LLM 기반 서비스를 만드는 많은 기업이 겪는 어려움이 있습니다. 분명 벤치마크 점수를 보고 성능이 좋은 모델을 골랐는데, 막상 운영을 시작하니 예상치 못한 문제가 발생하는 경우입니다. 도메인 지식에 대한 엉뚱한 답을 하거나, 위법적인 내용을 권유하거나, 민감한 정보를 노출하는 등, 기업의 신뢰성을...
[ICLR 2026 Conference 채택 – 셀렉트스타 AI Safety팀] AI 서비스가 실제로 사용될 때 성능만큼 중요한 것이 바로 안전성입니다. 아무리 똑똑한 AI라도 특정 국가의 법규를 어기거나 문화적 금기를 건드린다면 치명적인 리스크가 될 수 있기 때문입니다. 문제는 안전성을 점검하는 벤치마크가 주로 영어권...
셀렉트스타 김세엽 대표가 과학 커뮤니케이터 궤도와 함께 KBS Life ‘AI 토피아’ 2편에 출연해, AI 신뢰성 검증의 현실과 이를 해결하는 평가 자동화·통합 관리 방식에 대해 이야기했습니다. 이번 편은 특히 “AI 신뢰성 검증이 끝나면 모델은 완성되는가?”라는 질문에서 출발해, AI는 서비스에 배포된 이후에도 지속적으로...
셀렉트스타 김세엽 대표가 과학 커뮤니케이터 궤도와 KBS Life <AI 토피아>에서 만났습니다. 김세엽 대표는 AI 신뢰성을 결정짓는 핵심 요소인 데이터와 평가 체계에 대한 인사이트를 나누는 ‘지식텔러’로 함께 했는데요. 이번 방송은 “왜 어떤 AI는 정확한 답을 내놓고, 어떤 AI는 엉뚱한 답을 할까?”라는...