셀렉트스타 김세엽 대표가 과학 커뮤니케이터 궤도와 KBS Life <AI 토피아>에서 만났습니다. 김세엽 대표는 AI 신뢰성을 결정짓는 핵심 요소인 데이터와 평가 체계에 대한 인사이트를 나누는 '지식텔러'로 함께 했는데요.

이번 방송은 “왜 어떤 AI는 정확한 답을 내놓고, 어떤 AI는 엉뚱한 답을 할까?”라는 질문에서 출발합니다. AI 성능을 좌우하는 데이터의 품질과 설계 방식, 그리고 신뢰성을 확보하기 위한 평가 시스템 등 다양한 질문에 대한 김세엽 대표의 답을 들어보세요!

Q1. 왜 어떤 AI는 정확하고, 어떤 AI는 엉뚱한 답을 할까요?

답은 ‘데이터’에 있습니다.

최근 AI 성능 경쟁은 모델 크기나 컴퓨팅 파워를 넘어 '어떤 데이터를 어떻게 확보하고 정제했는가'의 문제로 이동하고 있습니다. 같은 모델이라도 학습 데이터에 따라 성능 차이는 크게 달라집니다.

특히 전문 영역에서는 고품질, 그리고 도메인 특화 데이터가 핵심 경쟁력이 되면서 단순 크롤링 데이터가 아닌, 합법적이고 신뢰 가능한 데이터 확보 전략이 중요해졌지요.

Q2. 최근 빅테크 기업들이 데이터 확보에 사활을 거는 이유는 무엇인가요?

고품질 데이터는 이제 전략 자산이 되었습니다.

과거에는 인터넷 크롤링 데이터 중심이었다면, 현재는 저작권과 라이선스가 해결된 데이터로 학습해야 하고, 또 이를 증명해야 하는 경우도 있습니다. 뿐만 아니라, 데이터 고갈 문제까지 생기면서 합법적이고 신뢰 가능한 데이터 확보가 핵심 경쟁력이 되었지요.

또한 이제는 스스로 판단하고 행동하는 AI 에이전트 시대로 넘어왔기 때문에, 아래와 같은 데이터 수요가 증가하고 있습니다.

• 추론(Reasoning) 능력을 키우는 문제 해결 데이터

• 산업·기업별 전문 도메인 데이터

• 텍스트를 넘어 이미지·음성·영상까지 포함한 멀티모달 데이터

특히 기업 환경에서는 내부 문서, 업무 히스토리, 맥락 데이터가 AI가 빠르게 온보딩하고 실무에 투입되기 위한 핵심 자산이 됩니다. 기업이 데이터 확보에 사활을 걸 수밖에 없겠지요.

가장 빠른 AI 뉴스

가장 빠른 AI 뉴스 구독하기

Q3. 좋은 데이터를 쓰면 AI는 항상 올바른 답을 내릴까요?

그렇지 않습니다. AI는 구조적으로 확률 기반 모델이기 때문인데요.

LLM은 가장 확률이 높은 다음 단어를 생성하는 구조이기 때문에 할루시네이션이 발생할 수 있습니다. 또한 학습 데이터가 특정 지역이나 인종, 문화에 치우칠 경우 편향된 결과가 나타날 위험도 존재하지요.

학습 전에는 데이터 분포 설계 및 편향을 통제해고, 학습 후에는 추가 튜닝을 통해 피드백이 반영되도록 하는 게 중요합니다. 마지막으로, 배포 단계에서 가드레일 및 필터링 시스템을 구축해 최대한 ‘믿을 수 있는’ AI를 만들어야 합니다.

AI는 완벽할 수 없기에, 실수를 발견하고 개선하는 평가 사이클을 갖추는 게 중요합니다.

Q4. 신뢰할 수 있는 AI를 만들기 위해 무엇이 필요할까요?

신뢰할 수 있는 AI를 위해서는 [데이터 설계 + 평가 시스템 + 개선] 루프를 구축해야 합니다.

AI 신뢰성의 핵심 기준에는 정확성(Accuracy), 그리고 안보 및 개인정보 보호(Security), 윤리 및 편향 방지(Ethics) 등이 있습니다. 또한 유도 질문을 통해 취약점을 점검하는 레드팀(Red Team) 테스트 역시 중요한 평가 요소라고 볼 수 있지요.

결국 신뢰할 수 있는 AI란, 문제에 맞게 설계된 데이터와 그 결과를 점검하는 체계적인 검증 프로세스가 함께 갖춰졌을 때 비로소 완성됩니다.

셀렉트스타는 이러한 데이터 설계 및 평가 체계를 통해 기업이 신뢰할 수 있는 AI 서비스를 구축하도록 지원하고 있습니다. 안심하고 사용할 수 있는 인공지능을 위한 최고의, 최선의, 그리고 최적의 선택이 될 수 있도록 늘 최선을 다하겠습니다.

🚀우리 회사 AI, 얼마나 안전할까?

🎥 방송 다시 보기

목록으로 돌아가기

Your AI Data Standard

라이선스 해결된 데이터셋 구매

더 알아보기

인공지능 도입 및 데이터 구축

문의하기

AIEvaluation AI거버넌스 AI데이터 AI레드팀 AI신뢰성 AI토피아 AI품질관리 LLM LLM기술 생성형AI 안전한AI 할루시네이션

AI토피아: 셀렉트스타, ‘궤도’에 오르다 [1편]

Q1. 왜 어떤 AI는 정확하고, 어떤 AI는 엉뚱한 답을 할까요?

Q2. 최근 빅테크 기업들이 데이터 확보에 사활을 거는 이유는 무엇인가요?

가장 빠른 AI 뉴스

Q3. 좋은 데이터를 쓰면 AI는 항상 올바른 답을 내릴까요?

Q4. 신뢰할 수 있는 AI를 만들기 위해 무엇이 필요할까요?

🚀우리 회사 AI, 얼마나 안전할까?

🎥 방송 다시 보기

Your AI Data Standard

라이선스 해결된 데이터셋 구매

인공지능 도입 및 데이터 구축

Related Posts

셀렉트스타, SOC2 Type 2 인증 획득

MWC 2026 & AI 레드팀 챌린지

셀렉트스타, ICLR 2026 메인트랙 채택

AI Data

AI Evaluation

Resources

IR

Company