데이터셋 스토어 언론 데이터셋: 종합일간지 국내 최다 기사량을 보유한 언론사 데이터 데이터셋 구매하기 데이터셋 스토어 언론 데이터셋: 종합일간지 국내 최다 기사량을 보유한 언론사 데이터 데이터셋 구매하기 뉴스통신사 발행 기사 뉴스데이터 시계열AI 언어모델학습 태그 뉴스데이터 시계열AI 언어모델학습 뉴스통신사 발행 기사 제공 형태JSON(추가 정제 협의 가능) 보유 수량TBA 최소 구매 수량기간에 따른 별도 협의 제공 형태JSON(추가 정제 협의 가능) 보유 수량TBA 최소 구매 수량기간에 따른 별도 협의 데이터셋 특징 • 연 33만 건 이상의 기사를 발행하는 국가기간뉴스통신사 데이터• 정치·경제·사회·문화 등 다양한 주제를 포함하여 완성도 높은 문장 및 맥락 구성• 사실 보도를 중심으로 하는 '스트레이트 기사' 비중이 높아 객관성 및 간결성을 갖춘 고품질 콘텐츠• 다국어 기사 제공 가능(영어, 중국어, 일본어, 아랍어, 프랑스어, 스페인어) 활용분야 자연어 처리 성능 개선 정치·경제·사회·문화 등 폭넓은 주제를 포함하여 모델의 멀티도메인 적응력을 강화할 수 있습니다. 보도, 분석, 사설 등 기사의 목적에 따라 다양한 문체를 가지고 있어 표현 방식 및 어휘력 확장에도 기여할 수 있습니다. 현실정보 학습 모델이 동시대의 맥락과 사회적 담론을 학습하여 시의성을 반영한 응답을 생성하는 데 도움을 줄 수 있습니다. 문서 요약 및 정보 추출 언론 기사의 구조적 특성(제목-본문-결론)을 활용하여 장문의 텍스트를 요약하거나 핵심 내용을 추출하여 제목을 생성하는 등의 태스크에 활용할 수 있습니다. 외 다양한 사례에 적용 가능합니다.