데이터셋 스토어

방송영상 / 음성

방송사 보유 영상 및 음성 데이터셋

데이터셋 스토어

방송영상 / 음성

방송사 보유 영상 및 음성 데이터셋

방송데이터
멀티모달
대규모음성

태그

방송데이터
멀티모달
대규모음성
제공 형태
영상(MP4, MOV)
음성(WAV, MP3)
스크립트(JSON, TXT) 등
보유 수량
100만 시간 이상
최소 구매 수량
기간에 따른 별도 협의
제공 형태
영상(MP4, MOV)
음성(WAV, MP3)
스크립트(JSON, TXT) 등
보유 수량
100만 시간 이상


최소 구매 수량
기간에 따른 별도 협의

데이터셋 특징

• 국내 주요 방송사의 뉴스, 예능, 드라마, 교양, 라디오 등 다양한 장르 데이터 보유
• 자막 대본 등 영상 / 음성과 매칭되는 텍스트 데이터 제공 가능(협의 필요)
• 해외 방송사 데이터 추가 협의 가능

활용분야

멀티모달 모델 개발

영상, 음성, 스크립트(텍스트)의 통합 데이터를 활용. AI 모델이 시청각 정보를 동시에 이해하고 발화자의 감정, 상황, 맥락 등을 종합적으로 파악하는 고차원적인 모델 개발에 최적.

오디오 분석 모델 개발

100만 시간 이상의 대규모 음성 데이터를 기반. 음성 인식(ASR), 화자 분리, 음성 합성(TTS) 등 고성능 오디오 분석 기술 개발에 활용. 다양한 장르 특성에 맞춘 정교한 모델 구현 지원.

맥락 이해 성능 강화

뉴스, 드라마, 예능 등 현실적이고 복잡한 대화 및 서사 학습. 단순 인식률을 넘어 대화 의도와 배경 지식을 정확히 파악하여, 인간 수준의 맥락 이해 능력을 갖춘 AI 성능 강화에 필수적.

외 다양한 사례에 적용 가능합니다.