DATUMO EVAL

다투모 이밸

안심하고 배포할 수 있는 LLM 서비스를 위해, 신뢰성 검증 과정을 원하는 대로 조율하고 감독하세요

도입 문의하기

체험하기

도입 문의하기

체험하기

A to Z를 함께합니다

믿을 수 있는 AI를 위해 처음부터 끝까지, 원하시는 방법으로 도와드립니다

자동화 플랫폼: Datumo Eval

다투모 이밸

직접 구상한 절차를 자동화 툴로 검증·감독하고 싶은 분께 적합합니다

맞춤형 평가 기준 및 지표 설정

평가용 질문 데이터 자동 생성

답변 자동 평가 및 분석

대시보드를 통한 검증 결과 시각화

문의하기

자동화 플랫폼: Datumo Eval

다투모 이밸

직접 구상한 절차를 자동화 툴로 검증·감독하고 싶은 분께 적합합니다

맞춤형 평가 기준 및 지표 설정

평가용 질문 데이터 자동 생성

답변 자동 평가 및 분석

대시보드를 통한 검증 결과 시각화

문의하기

설계부터 분석까지

컨설팅

방향을 잡기 어려우신 분들께, 기획 단계부터 전담 인력이 도와드립니다

방법론 및 평가 기준 설계

평가용 데이터 구축

평가 실행

검증 결과 분석

더 알아보기

설계부터 분석까지

컨설팅

방향을 잡기 어려우신 분들께, 기획 단계부터 전담 인력이 도와드립니다

방법론 및 평가 기준 설계

평가용 데이터 구축

평가 실행

검증 결과 분석

더 알아보기

주요 기능

AI 에이전트를 활용한 평가용 데이터 자동 생성

업로드된 고객의 정책 및 상품 문서를 통해 더욱 정교하고 현실적인 질문 데이터를 생성합니다. 신뢰성 및 정보 정확성 등 LLM 검증 분야별로 고품질 질문을 대량 제작하여, 효과적인 평가를 제공합니다.

현장 중심의 실질적 데이터 생성

실제 기업의 비즈니스 환경을 반영하여, 실제 사용자 환경에서 발생할 수 있는 다양한 시나리오에 기반한 평가용 질문 데이터를 생성합니다.

맞춤형 지표 및 기준에 따른 철저한 평가

기본으로 제공되는 지표는 물론, 직접 세밀하게 설정한 지표와 기준에 따라 다양한 평가가 가능합니다. 모든 답변에 대한 평가 결과 사유를 제공합니다.

대시보드를 통한 검증 결과 시각화 및 분석

지표별 답변 점수 분포, 모델별 성능 차이 등 다양한 결과를 한눈에 볼 수 있는 대시보드를 제공합니다.

AI 레드티밍 자동화 및 시각화

기다릴 필요 없이, 언제든 모델의 목적과 특성에 맞춘 AI 레드티밍을 자동으로 실시할 수 있습니다. 결과 또한 대시보드로 시각화하여 취약점을 빠르게 파악할 수 있습니다.

더 알아보기

Basic

Safety 평가 데이터

싱글턴 자동 평가

평가 결과 대시보드

문의하기

Standard

Basic 모든 기능

다중 청크 기반 싱글턴 평가용 질문 생성

* 개발 중

싱글턴 자동 평가

문의하기

Add-on

Red Teaming

Human 레드티밍

Safety 자동 레드티밍

문의하기

Basic

Safety 평가 데이터

싱글턴 자동 평가

평가 결과 대시보드

문의하기

Standard

Basic 모든 기능

다중 청크 기반 싱글턴 평가용 질문 생성

* 개발 중

싱글턴 자동 평가

문의하기

Add-on

Red Teaming

Human 레드티밍

Safety 자동 레드티밍

문의하기

LLM 평가 체크리스트 공개

우리 서비스에 맞는 GO/NO-GO 기준을 점검해보세요

10초만에 다운받기

AI 평가 솔루션 기업

AI 성능부터 안전성까지

셀렉트스타는 AI 성능을 좌우하는 고품질 학습 데이터는 물론, 모델 안전성을 검증하기 위한 전문 컨설팅과 자체 개발 자동화 플랫폼을 제공합니다.

국내 최초 AI 신뢰성 검증 자동화 솔루션, 다투모 이밸

누적 2.5억 건 이상 데이터 구축

글로벌 서비스

기업 고객 330+

NeurIPS EMNLP CVPR 등 글로벌 탑 티어 학회 등재

다투모 이밸

A to Z를 함께합니다

자동화 플랫폼: Datumo Eval

다투모 이밸

자동화 플랫폼: Datumo Eval

다투모 이밸

설계부터 분석까지

컨설팅

설계부터 분석까지

컨설팅

주요 기능

AI 에이전트를 활용한 평가용 데이터 자동 생성

AI 에이전트를 활용한 평가용 데이터 자동 생성

현장 중심의 실질적 데이터 생성

현장 중심의 실질적 데이터 생성

맞춤형 지표 및 기준에 따른 철저한 평가

맞춤형 지표 및 기준에 따른 철저한 평가

대시보드를 통한 검증 결과 시각화 및 분석

대시보드를 통한 검증 결과 시각화 및 분석

AI 레드티밍 자동화 및 시각화

AI 레드티밍 자동화 및 시각화

Basic

Standard

Add-on

Red Teaming

Basic

Standard

Add-on

Red Teaming

LLM 평가 체크리스트 공개

AI 평가 솔루션 기업

AI 성능부터 안전성까지

AI Data

AI Evaluation

Resources

IR

Company