음식 사진 수집 및 가공

데이터 종류
이미지
레이블링 방법
이미지 수집 및 가공, 검수

데이터 개요

소개
AI 허브에서 제공 중인 비전 분야 음식이미지 및 영양정보 데이터셋

  • 원천데이터를 다양한 음식으로 확장 구축

  • 음식분류와 양 인식을 위한 원천 및 라벨링 데이터 등을 추가, 보완

  • 데이터의 유용성과 활용도를 높이기 위한 데이터 고도화

구축 목적
한식 메뉴 중심의 기 구축되어 있는 음식 이미지 데이터는 빠르게 변화하는 식문화 트렌드 반영이 어려워 다양한 요리와 폭넓은 가격대의 메뉴, 요즘 식문화 트렌드를 반영한 800종의 음식 데이터를 새롭게 구축

메타데이터 구조표

데이터 영역

데이터 형식

라벨링 유형

데이터 활용 서비스

영상 이미지

jpg

바운딩박스(이미지), 영양정보(텍스트)

식단 관리 앱, 헬스케어 서비스 등

데이터 유형

데이터 출처

라벨링 형식

데이터 구축년도/데이터 구축량

이미지

이미지

json

2022년/232,087장

데이터 영역

데이터 형식

라벨링 유형

데이터 활용 서비스

영상 이미지

jpg

바운딩박스(이미지), 영양정보(텍스트)

식단 관리 앱, 헬스케어 서비스 등

데이터 유형

데이터 출처

라벨링 형식

데이터 구축년도/데이터 구축량

이미지

이미지

json

2022년/232,087장

데이터 통계

1. 데이터 구축 규모
총 네 개의 카테고리로 분류된 특수 외식 메뉴, 일반 외식·배달 메뉴, 끼니 대체 메뉴, 음료 및 차류 등 이미지 데이터 및 영양정보 텍스트 데이터
2. 데이터 분포
음식 중분류 카테고리 분포
촬영 각도 분포

활용 AI 모델

모델 학습
• 기존 Pascal VOC 데이터셋 타입을 음식 데이터셋에 적합하게 개선하여 커스텀 음식 데이터셋을 정의
• 8:1:1 비율로 Train / Vaildation / Test 용 데이터셋으로 활용
수집된 학습용 데이터에서 라벨링 된 2D 및 3D 바운딩박스는 학습서버를 통해 음식탐지 및 분류모델과 중량예측 모델을 개발

자사 크라우드소싱 플랫폼 '캐시미션' 활용

이미지 데이터 / JSON 형식

계정 생성, 정보, 집계, 정산, 관리자 기능 사용
1. 수집을 위한 크라우드 소싱 플랫폼 제공
2. 수집된 사진 209,000장에 대한 바운딩박스 및 검수
3. 209,000장에 대한 3D-Cuboid 검수

연도: 2022년

이미지 데이터 / JSON 형식