데이터셋 스토어

다국어 대화 데이터셋

AI 쳇봇-사용자 대화, 사용자-사용자 대화 등

데이터셋 스토어

다국어 대화 데이터셋

AI 챗봇-사용자 대화, 사용자-사용자 대화 등

채팅 서비스를 통해 구축된 챗봇-사용자 대화, 사용자-사용자 대화 등
다국어
챗봇
대화데이터

태그

다국어
챗봇
대화데이터
채팅 서비스를 통해 구축된 챗봇-사용자 대화, 사용자-사용자 대화 등
제공 형태
JSON(추가 정제 협의 가능)
보유 수량
아래 내용 참고
최소 구매 수량
100,000
제공 형태
JSON(추가 정제 협의 가능)
보유 수량
아래 내용 참고
최소 구매 수량
100,000

데이터셋 스펙

인사 · 노무

경제 · 금융

의료

인문 · 예술

반려동물

보험

무역

과학

육아 · 아동

교통사고

법률

세금 · 세무

데이터

1. 사용자 저작 챗봇 대화 시나리오

2. 1번 데이터 중 사용자 신고로 삭제된 대화 시나리오

3. 1번 데이터 중 챗봇 발화문을 정제한 대화 시나리오

4. 3번 정제 과정에서 탈락한 대화 시나리오

5. 1번 데이터 중 챗봇 발화문을 맹검하여 점수 부착

6. 실제 사용자와 챗봇이 주고받은 대화 기록

7. 챗봇 역할극을 통해 생성된 사용자 간 실제 대화 기록

8. 사용자-사용자 대화 기록을 챗봇 모델링 용도로 정제한 대화 기록

총 용량

17GB

2GB

200MB

42MB

4GB

1TB

84GB

81MB

최대 구매 수량

900,000

300,000

300,000

100,000

900,000

30,000,000

127,000,000

800,000

데이터셋 특징

• 다양한 주제의 일상대화부터 신고 삭제된 대화까지 광범위한 대화셋
• 구어체, 은어, 이모티콘 등 비공식적인 언어 학습에 활용 가능
• 여러 문화권 사용자들이 참여하여 다양한 문화적 맥락 반영 (동아시아, 유럽, 중동, 남미 등 다수 데이터 보유)
• 챗봇 학습에 적합하도록 정제된 데이터 일부 포함
• 싱글턴 / 문장 / 준멀티턴 / 멀티턴 유형

활용분야

대화 다양성 강화

다양한 언어, 주제, 표현 방식의 데이터를 학습함으로써 AI가 더 폭넓고 유연한 대화를 생성할 수 있게 됩니다. 일상부터 특수 상황까지 대응 가능해집니다.

맥락 인식

연속된 대화 흐름 속에서 주제 전환이나 암묵적 의도를 파악하는 능력을 향상시켜, 자연스럽고 일관된 응답을 생성할 수 있습니다.

다중 페르소나 구현 강화

다양한 말투, 역할, 문화적 배경을 반영한 대화 데이터를 통해 AI가 상황에 따라 다른 성격이나 말투로 대화할 수 있도록 학습됩니다.

외 다양한 사례에 적용 가능합니다.