[AI Ignite X 금융보안원] 금융 AI 안전성과 활용 동향: 기술과 규제를 중심으로

픽셀 단위 장면 인지 멀티모달 데이터

주제
멀티모달 데이터
데이터 종류
이미지, 질의응답(QA) 데이터셋, 영상 데이터

2022년 데이터구축 수량

4,183개 .mp4 파일, 314,489개 .png 파일

레이블링 방법

panoptic segmentation, 텍스트 생성, 영상 태깅

1-1) 픽셀 단위 장면 인지 멀티모달 데이터

1-2) 비디오 전환 경계 추론 데이터

1-3) 비디오 장면 설명문 생성 데이터

 

라벨링 데이터 전량 참여

  • 형식 : png, json

영상 내 모든 객체를 감지, 분할, 추적하기 위해 주류/비주류 객체 정보 수집 및 자연어 묘사 데이터가 포함된 멀티모달 데이터 수집