[25.08.14.9AM 웨비나] 시티은행 AI 총괄이 말하는 AI로 금융산업을 이끄는 방법

Data-centric AI

Data-centric AI

데이터 중심 AI(Data-centric AI)는 인공지능 개발에서 모델 구조 최적화보다 학습에 사용하는 데이터의 품질과 구조 개선을 우선시하는 접근 방식입니다.
이 방법론은 고품질의 체계적인 데이터신뢰성 있고 효과적인 AI 시스템을 구축하는 핵심이라는 원칙에 기반합니다.

 
데이터 중심 AI의 핵심 원칙:

 

양보다 질(Data Quality Over Quantity): 노이즈와 불일치를 제거하고 데이터셋을 정제하고 라벨링하여 품질을 높이는 데 집중합니다.

• 반복적인 데이터 개선(Iterative Data Improvements): 모델 성능 향상을 위해 데이터를 지속적으로 업데이트하고 개선합니다.

• 팀 간 협업(Collaboration Across Teams): 데이터 과학자, 엔지니어, 도메인 전문가가 함께 작업하여 데이터가 실제 작업 요구에 맞게 준비되도록 합니다.

• 확장 가능한 데이터 파이프라인(Scalable Data Pipelines): 데이터 준비를 자동화하고 재현성을 보장하는 도구와 워크플로우를 구축합니다.

 

중요성

 

데이터 중심 AI는 알고리즘을 끊임없이 조정하는 대신, 모델이 더 단순한 구조로도 높은 성능을 낼 수 있도록 데이터 자체를 개선하는 데 중점을 둡니다.
이는 특히 라벨링된 데이터가 희소하거나 비용이 많이 들거나 민감한 분야(예: 헬스케어, 법률 AI)에서 더욱 가치 있는 접근법입니다.

결론적으로, 데이터 중심 AI는 데이터 품질을 근본적으로 강화해 더 나은 AI 시스템을 만드는 실용적이고 효율적인 전략입니다.