LLM을 서비스에 붙이는 순간부터 질문은 바뀝니다. “이 모델이 똑똑한가?”가 아니라, “우리 서비스에서 써도 되는가?”가 되죠. 실제로 많은 팀이 벤치마크 점수(예: 범용 성능 비교)를 보고 모델을 고른 뒤, 막상 운영 단계에서 전혀 다른 문제를 겪습니다. 도메인에선 엉뚱한 답이 나오고, 정책 위반이나...
셀렉트스타 김세엽 대표가 과학 커뮤니케이터 궤도와 함께 KBS Life ‘AI 토피아’ 2편에 출연해, AI 신뢰성 검증의 현실과 이를 해결하는 평가 자동화·통합 관리 방식에 대해 이야기했습니다. 이번 편은 특히 “AI 신뢰성 검증이 끝나면 모델은 완성되는가?”라는 질문에서 출발해, AI는 서비스에 배포된 이후에도 지속적으로...
셀렉트스타 김세엽 대표가 과학 커뮤니케이터 궤도와 KBS Life <AI 토피아>에서 만났습니다. 김세엽 대표는 AI 신뢰성을 결정짓는 핵심 요소인 데이터와 평가 체계에 대한 인사이트를 나누는 ‘지식텔러’로 함께 했는데요. 이번 방송은 “왜 어떤 AI는 정확한 답을 내놓고, 어떤 AI는 엉뚱한 답을 할까?”라는...