감성 대화 말뭉치

주요 키워드
AI 학습데이터, 음성 데이터, 텍스트 데이터
주제
대화 말뭉치
데이터 종류
오디오, 텍스트

데이터 개요

소개
• 일반인 1,500명을 대상 크라우드 소싱 수행
• 음성 15,700문장 및 코퍼스 27만 문장 구축 및 세대별 감성 대화 텍스트 구축
• 감성 대화 엔진을 개발하여 세대별 감성 대화 서비스 제공
구축 목적
60가지 세부 감정에 대한 자연어 처리 말뭉치를 확보함으로써 다양한 AI 산업에 활용 가능(감정 인식을 위한 데이터는 크롤링이 불가능해 직접 제작)

메타데이터 구조표

데이터 영역

데이터 형식

라벨링 유형

데이터 활용 서비스

한국어

-

-

-

데이터 유형

데이터 출처

라벨링 형식

데이터 구축년도/데이터 구축량

오디오, 텍스트

-

-

2022년/10,000문장(음성), 27만 문장(코퍼스)

데이터 영역

데이터 형식

라벨링 유형

데이터 활용 서비스

한국어

-

-

-

데이터 유형

데이터 출처

라벨링 형식

데이터 구축년도/데이터 구축량

오디오, 텍스트

-

-

2022년/10,000문장(음성), 27만 문장(코퍼스)

데이터 통계

구축 내용 및 제공 데이터량
• 음성 약 10,000 문장
• 코퍼스 27만 문장

데이터 구축 범위

• 감성 텍스트 언어 수집
• 우울증 관련 언어 의미 구조화 및 대화 응답 시나리오 동반 수집

데이터 구축 규모

• 음성 약 10,000 발화, 코퍼스 27만 문장 수집/태깅
• 일반인 1,500명 대상의 인터뷰 및 크라우드 소싱 수행
• 우울증 환자 대상 WOZ 대화 수집

데이터 구축 일정

• 음성 약 10,000 발화, 코퍼스 27만 문장 수집/태깅
• 일반인 1,500명 대상의 인터뷰 및 크라우드 소싱 수행
• 우울증 환자 대상 WOZ 대화 수집

데이터 구축 범위

• 감성 텍스트 언어 수집
• 우울증 관련 언어 의미 구조화 및 대화 응답 시나리오 동반 수집

데이터 구축 규모

• 음성 약 10,000 발화, 코퍼스 27만 문장 수집/태깅
• 일반인 1,500명 대상의 인터뷰 및 크라우드 소싱 수행
• 우울증 환자 대상 WOZ 대화 수집

데이터 구축 일정

• 음성 약 10,000 발화, 코퍼스 27만 문장 수집/태깅
• 일반인 1,500명 대상의 인터뷰 및 크라우드 소싱 수행
• 우울증 환자 대상 WOZ 대화 수집