데이터셋 스토어

다국어 번역 데이터셋

번역 코퍼스

데이터셋 스토어

다국어 번역 데이터셋

번역 코퍼스

한국어-외국어 / 외국어-외국어 번역 쌍
번역데이터
다국어AI
문장쌍

태그

번역데이터
다국어AI
문장쌍
한국어-외국어 / 외국어-외국어 번역 쌍
제공 형태
JSON(추가 정제 협의 가능)
보유 수량
언어 별 상이
최소 구매 수량
TBA
제공 형태
JSON
보유 수량
언어 별 상이
최소 구매 수량
TBA

데이터셋 특징

• 글로벌 언어번역 플랫폼을 통해 구축된 번역 데이터
• 27개 주제로 분류된 50개 이상의 언어 데이터 보유
• 싱글턴(문장-문장) 번역 쌍 제공 가능

데이터셋 스펙

데이터셋 예시

영어 - 태국어

Nate doesn’t want John to go anywhere without him.

เนทไม่อยากให้จอห์นที่จะไปที่ใดก็ได้โดยไม่มีเขา.

Could you tell me if there are any mistakes in this sentence?

คุณสามารถบอกฉันหากมีข้อผิดพลาดใด ๆ ในประโยคนี้?

영어 - 베트남어

Use my set of keys, and I’ll check around for yours.

Sử dụng bộ khoá của tôi, và tôi sẽ kiểm tra chìa khoá cho bạn.

The Earth is mostly made of iron, oxygen and silicon.

Trái đất chủ yếu được tạo nên từ sắt, oxy và silicon.

활용분야

다국어 AI

50개 이상의 언어 데이터를 바탕으로 언어별 표현, 문법, 문화적 맥락을 학습해, 전 세계 사용자와 자연스럽게 소통하는 인공지능 모델을 구현할 수 있습니다.

번역 성능 개선

싱글턴 기반의 정제된 문장쌍 데이터를 활용해 문장 단위 번역의 정확도를 높이고, 어순, 뉘앙스, 의미 보존 측면에서 고품질 번역 모델 학습이 가능합니다.

전문 분야별 번역 정밀도 향상

의료, 법률, 기술 등 전문성이 요구되는 도메인별 데이터를 활용해, 일반 번역 모델보다 높은 용어 정확도와 문맥 일관성을 갖춘 특화 번역 AI 개발에 활용할 수 있습니다.

외 다양한 사례에 적용 가능합니다.