...
[웨비나] 당신의 AI, 정말 안전한가요?
멀티모달 / 전문가 검증 / 고난도 추론

독자 AI 파운데이션 모델용 전문가 검증 멀티모달 데이터 구축

고객
국내 통신사
분야
금융, 법률, AI 평가
라벨링 유형
텍스트, 평가데이터, 평가 프레임워크
고객
국내 통신사
분야
금융, 법률, AI 평가
유형
텍스트, 평가데이터, 평가 프레임워크

과학·기술·뉴스·손글씨 문서를 기반 고난도 추론과 비정형 정보 해석 역량 강화를 지원

과학·기술·뉴스·손글씨 문서를 기반 고난도 추론과 비정형 정보 해석 역량 강화를 지원

파운데이션데이터
멀티모달
전문가검증
VQA
CoT
도식해석
손글씨문서
파운데이션데이터
멀티모달
전문가검증
VQA
CoT
도식해석
손글씨문서

프로젝트 개요

고난도 멀티모달 학습 데이터 설계

독자 AI 파운데이션 모델 개발을 위해 과학·기술·뉴스·손글씨 문서 기반의 고난도 멀티모달 학습 데이터 설계 및 구축

전문가 검증형 데이터 구축 체계 적용

해석 난이도가 높은 전문 문서를 대상으로 도메인 전문가 참여와 검증 체계를 반영한 고품질 데이터 구축

추론 및 비정형 문서 이해 역량 강화 지원

이미지 해석, 시각 정보 기반 질의응답, 단계적 추론(CoT), 비정형 문서 이해가 가능한 데이터 체계 마련

고난도 멀티모달 학습 데이터 설계

독자 AI 파운데이션 모델 개발을 위해 과학·기술·뉴스·손글씨 문서 기반의 고난도 멀티모달 학습 데이터 설계 및 구축

전문가 검증형 데이터 구축 체계 적용

해석 난이도가 높은 전문 문서를 대상으로 도메인 전문가 참여와 검증 체계를 반영한 고품질 데이터 구축

추론 및 비정형 문서 이해 역량 강화 지원

이미지 해석, 시각 정보 기반 질의응답, 단계적 추론(CoT), 비정형 문서 이해가 가능한 데이터 체계 마련

문제점

1. 고난도 멀티모달 데이터 필요
1. 고난도 멀티모달 데이터 필요

텍스트 기반 데이터만으로는 이미지 해석, 시각 정보 기반 질의응답, 단계적 추론 등 파운데이션 모델 고도화에 필요한 멀티모달 역량 확보에 한계

2. 전문 문서 해석 난이도에 따른 품질 확보 한계
2. 전문 문서 해석 난이도에 따른 품질 확보 한계

과학·기술·공학·손글씨 문서의 높은 해석 난이도로 인한 일반 크라우드 기반 구축 방식의 품질 확보 한계

3. 전문가 검증 기반 구축 체계 필요
3. 전문가 검증 기반 구축 체계 필요

실제 산업 활용 수준의 성능 확보를 위한 도메인 전문가 검증 체계 반영 데이터 구축 방식의 필요

솔루션

1. 카테고리별 멀티모달 데이터 설계
1. 카테고리별 멀티모달 데이터 설계
• 과학·기술 전문서적, 뉴스·잡지, 손글씨 포함 문서 등 카테고리별 데이터 설계
• 분자구조, P&ID, 건축도면, 경구약제, 약초, 잡지 지면, 손글씨 문제 등 세부 태스크 정의
2. 고난도 태스크 기반 데이터 구축
2. 고난도 태스크 기반 데이터 구축
• 이미지+텍스트 기반 VQA, 캡셔닝, QA, Fact-checking, Ranking, CoT 데이터 구축
• 시각 정보 해석, 추론, 설명 생성, 비정형 문서 이해를 포괄하는 멀티모달 데이터 체계 마련
3. 도메인 특화 응답 구조 및 추론 흐름 설계
3. 도메인 특화 응답 구조 및 추론 흐름 설계
• 도메인 특성에 맞는 추론 흐름 및 응답 구조 설계
• 파운데이션 모델 고도화를 지원할 수 있는 고난도 학습 데이터 구성
4. 도메인 전문가 기반 검수 체계 운영
4. 도메인 전문가 기반 검수 체계 운영
• 약사, 공정기술 전문가, 건축 전공자, 화학 연구원 등 분야별 전문가 직접 투입
• 전문가 검수 기반으로 정합성, 안전 맥락, 기술 표현 정확성 품질 확보
5. 파운데이션 모델 고도화용 데이터 체계 확보
5. 파운데이션 모델 고도화용 데이터 체계 확보
• VQA, 캡셔닝, QA, Fact-checking, CoT를 포함한 파운데이션 모델 학습용 데이터 체계 마련
• 전문 도식, 산업 도면, 손글씨 문서 등 비정형 멀티모달 데이터를 포함한 고품질 구축 구조 확보

활용분야

독자 AI 파운데이션 모델 학습

고난도 멀티모달 데이터를 기반으로 독자 AI 파운데이션 모델의 학습과 성능 고도화

과학·기술·산업 분야 AI 어시스턴트

전문 도식과 산업 문서를 이해하고 해석할 수 있는 도메인 특화 AI 어시스턴트 개발

비정형 문서 이해 및 시각 추론 모델 개발

손글씨 문서, 도면, 시각 정보 기반 추론이 필요한 멀티 모달 모델 개발

외 다양한 사례에 적용 가능합니다.