[AI Ignite X 금융보안원] 금융 AI 안전성과 활용 동향: 기술과 규제를 중심으로
Software as a Service

Datumo Scope(Feature Space Tool;FST)는 시각화 기반 데이터셋 분석 솔루션입니다.

학습 데이터의 커버리지와 엣지 케이스를 눈으로 보고 Data-Centric AI를 구현해 보세요.

*다투모 스코프는 웹에 최적화되어 있습니다.

고객 사례

DATUMO SCOPE

국내 최초 피처스페이스(Feature Space) 기반 데이터셋 분석 솔루션 DATUMO SCOPE(Feature Space Tool;FST)는 데이터셋 분석-기획-선별 과정 전반에 활용됩니다.Datumo Scope와 함께 데이터 파이프라인을 개선하고 AI 성능 목표를 빠르게 달성해 보세요.

Datumo Scope - Visualization

데이터 차원 축소 및 시각화

비슷한 데이터는 가까이, 상이한 데이터는 멀리 배치한 평면 그래프를 제공합니다. 쉬운 조작과 가독성 높은 UI 디자인으로 전체 데이터셋의 커버리지를 빠르게 파악할 수 있습니다.

*피처 스페이스는 데이터의 정보를 담은 피처 벡터(Feature Vector)를 다차원 점으로 압축하여 표현한 공간입니다.

Datumo Scope는 피처 벡터를 자동으로 생성하거나, 기존 피처 벡터를 활용해 피처 스페이스를 시각화합니다.

Datumo Scope- Meta Data & Model Metric

메타 데이터 및 모델 메트릭 반영

메타 데이터(Meta data)와 모델 메트릭(Model Metric) 정보를 반영한 데이터 분포 그래프를 제공합니다. 데이터 수집 환경과 모델 성능 지표 등을 쿼리로 활용해 다양한 방법으로 데이터를 필터링할 수 있습니다.

* 다양한 기상 및 시간 조건에서 수집한 데이터를 구분하고 모델 성능 지표에 따라 다른 색으로 표현합니다. 모델 학습 결과를 빠르게 파악하여 엣지 케이스(Edge Case)를 쉽게 찾아낼 수 있습니다.

ANALYSIS FUNCTION

피처 벡터를 활용해 데이터를 고르게 선별하거나, 비슷한 데이터를 검색·조회할 수 있습니다.

다양한 기능을 조합해 데이터셋 분석을 더해가세요.

Datumo Scope - Curation

데이터 큐레이션

데이터셋 커버리지 손상을 최소화하며 자동으로 데이터를 선별합니다. 선별할 데이터의 개수 혹은 비율, 그리고 선별 알고리즘을 자유롭게 설정할 수 있습니다. 큐레이션 기능을 국소적으로 활용하면 데이터셋을 보다 정밀하게 구성할 수 있습니다.

*큐레이션 기능은 전체 데이터셋 커버리지를 빠르게 분석하거나, 용도에 맞게 데이터셋을 분류하는 (Train/Test set split) 등 머신러닝(ML) 라이프사이클 동안 다양한 방법으로 활용됩니다.

Datumo Scope - Similar Data Search

유사 데이터 조회

지정한 데이터와 유사한 데이터를 자동으로 조회합니다. 설정한 범위 내에서 검색과 편집을 반복하며 데이터셋을 원하는 대로 구성합니다.

*검색 결과를 보정할 보조 데이터를 선택해 사용자의 인사이트를 반영할 수 있습니다. 대상 주변의 점들을 직접 눌러 비슷한 데이터를 찾을 수도 있지만, 검색 기능을 활용하면 보다 정밀하고 신속한 작업이 가능합니다.

Feature Vector Upload
기존 피처 벡터를 업로드하여 맞춤형 피처 스페이스를 생성합니다. 다양한 버전의 피처 스페이스를 확인하고 데이터셋 분석을 이어가세요.
Cloud Intergration
기존 클라우드 환경에서 Datumo Scope를 사용합니다. 피처 벡터 생성을 위해 수집한 초기 데이터 정보는 별도 DB에 저장된 후 자동 폐기됩니다.
On-Premise
보안, 성능, 컴플라이언스 관련 이슈 대응을 위해 Datumo Scope를 온프레미스 환경에서 제공합니다.

Other Use Case

Datumo Scope를 활용해서 빠르게 인사이트를 얻고 모델 성능을 높여보세요

AI 성능 개선은

학습 데이터 개선에서 시작됩니다.

Datumo Scope를 통해 데이터셋의 편향, 과소, 엣지 케이스를 파악하고 라벨링 시간-비용을 절감하세요.

최고 수준 시각화
SOTA(State-of-the-Art) 성능 모델로 원천 데이터를 다차원 벡터로 변환한 다음 2차원으로 축소합니다. 데이터셋 커버리지(Coverage)와 편향(Bias)를 눈으로 확인하세요.
라벨링 비용 최적화
메타 데이터 및 모델 메트릭 쿼리, 유사 데이터 조회 등으로 라벨링 효용이 높은 데이터를 찾아냅니다. 데이터 수집 혹은 가공 대상을 명확히 정의해 학습 데이터셋을 적은 비용, 빠른 시간 내에 구축합니다.

다투모 스코프를 바로 체험해보세요!

학습 데이터의 커버리지와 엣지 케이스를 눈으로 보고 Data-Centric AI를 구현해 보세요.

클라우드 바우처 신청하기

사용자 기능 요청 우선 반영. 온보딩 프로세스 지원.