[AI Ignite X 금융보안원] 금융 AI 안전성과 활용 동향: 기술과 규제를 중심으로

소셜 로봇 고객 응대 데이터 베이스

데이터 종류
이미지, 비디오, 텍스트
주제
멀티모달 데이터

캐시미션을 활용한 라벨링+반자동 레이블링 활용

4개월 내 얼굴 라벨링 6백만 건 이상 수행

레이블링 방법

구간 Timestamping, 전사, BBoX, , 키포인트

한국인 대화음성

출처: aihub.or.kr / 소셜로봇 고객응대 데이터

1.영상 내 얼굴 표정 라벨링(6,570,000)

  • 바운딩박스, 눈/코/입 키포인트
  • 73,000개 영상
  • 프레임 추출해서 라벨링 하면 수백만 건

2.자유 발화 전사 (300,180 영상 평균30초)

  • 30초 길이 영상 내 발화 내용 전사
  • 300,000건

3.행동 정보 라벨링 (300,180 영상)

  • 영상 내 등장인물과 로봇의 행동 정보 라벨링
    • 인물 : 접근, 주변파악, 정보확인 등
    • 로봇 : 정보접수, 정보확인, 정보탐색 등
  • 300,000건

4.거리 어노테이션(3,001,800 이미지)

수행 내용 요약

연도 : 2022년 / 차수 번호 : 2차 66번

셀렉트스타의 데이터 구축 사례를 더 확인해보세요!