[AI Ignite X 금융보안원] 금융 AI 안전성과 활용 동향: 기술과 규제를 중심으로

음식 사진 수집 가공

.

데이터 종류
이미지
레이블링 방법
이미지 수집 및 가공, 검수

데이터 개요

소개

AI허브 제공 중인 비전 분야 음식이미지 및 영양정보 데이터셋을 구성하는 원천데이터를 다양한 음식으로 확장 구축하고, 음식분류와 양 인식을 위한 원천 및 라벨링 데이터 등을 추가, 보완하여 데이터의 유용성과 활용도를 높이기 위한 데이터 고도화

구축목적

기 구축되어있는 음식이미지데이터의 경우, 한식메뉴 중심에 국한되다 보니 빠르게 변화하는 식문화 트랜드를 반영하지 못함 다양한 퀴진을 포함하여 폭넓은 가격대의 외식메뉴, 요즘의 식생활 형태를 반영할 수 있는 800종의 음식을 구축

메타데이터 구조표

데이터 영역

영상이미지

데이터 유형

이미지

데이터 형식

jpg

데이터 출처

이미지

라벨링 유형

바운딩박스(이미지) , 영양정보(텍스트)

라벨링 형식

json

데이터 활용 서비스

식단 관리 앱, 헬스케어 서비스 등

데이터 구축년도/ 데이터 구축량

2022년/232,087장

데이터 통계

1. 데이터 구축 규모
총 네 개의 카테고리로 분류된 특수외식메뉴, 일반외식·배달메뉴, 끼니대체메뉴, 음료 및 차류 등 이미지 데이터 및 영양정보 텍스트데이터

2. 데이터 분포
음식 중분류 카테고리 분포

촬영 각도 분포

활용 AI 모델 및 코드

모델 학습
기존의 Pascal VOC 데이터셋 타입을 음식 데이터셋에 적합하게 개선하여 커스텀 음식 데이터셋을 정의하였다. 해당 데이터셋은 8:1:1 비율로 Train / Vaildation / Test 용 데이터셋으로 활용되었다.

- 수집된 학습용 데이터에서 라벨링 된 2D 및 3D 바운딩박스는 학습서버를 통해 음식탐지 및 분류모델과 중량예측 모델을 개발

음식 사진 수집 및 가공
음식 사진 수집 및 가공
음식 사진 수집 및 가공

크라우드소싱 플랫폼 '캐시미션' 툴로써 사용

계정 생성, 정보, 집계, 정산, 관리자 기능 사용

  1. 수집을 위한 크라우드 소싱 플랫폼 제공
  2. 수집된 사진 209,000장에 대한 바운딩박스 및 검수
  3. 209,000장에 대한 3D-Cuboid 검수

연도 : 2022년

금속 3D프린터 및 모니터링 기술 기반 이미지 데이터

이미지 데이터 / JSON 형식

셀렉트스타의 데이터 구축 사례를 더 확인해보세요!