LLM을 서비스에 붙이는 순간부터 질문은 바뀝니다. “이 모델이 똑똑한가?”가 아니라, “우리 서비스에서 써도 되는가?”가 되죠. 실제로 많은 팀이 벤치마크 점수(예: 범용 성능 비교)를 보고 모델을 고른 뒤, 막상 운영 단계에서 전혀 다른 문제를 겪습니다. 도메인에선 엉뚱한 답이 나오고, 정책 위반이나...
셀렉트스타 김세엽 대표가 과학 커뮤니케이터 궤도와 KBS Life <AI 토피아>에서 만났습니다. 김세엽 대표는 AI 신뢰성을 결정짓는 핵심 요소인 데이터와 평가 체계에 대한 인사이트를 나누는 ‘지식텔러’로 함께 했는데요. 이번 방송은 “왜 어떤 AI는 정확한 답을 내놓고, 어떤 AI는 엉뚱한 답을 할까?”라는...