Underdog을 위한 인공지능의 발전 첫번째 이야기, 소외된 90%를 위한 기술 WeSee의 교차로 정보 데이터셋입니다.
데이터셋 스펙
데이터셋 구축 목적
저시력자와 같은 교통약자에게 보행신호 및 횡단보도에 대한 정보 전달을 통해 안전 횡단 서비스 제공
수량
총량: 73,616건 (이미지 36,808건, JSON 36,808건)
bbox_1 : 22,879건 x 1 = 22,879 box
bbox_2 : 13,325건 x 2 = 26,650 box
bbox_3 : 369건 x 3 = 1,107 box
bbox_4 : 190건 x 4 = 760 box
bbox_5 : 29건 x 5 = 145 box
bbox_6 : 16건 x 6 = 96 box
최종데이터 생산 진행률: 51,636 box / 30,000 box (172.12%)
데이터 형식
PNG/JPG, JSON
모든 데이터는 셀렉트스타의 크라우드소싱 플랫폼 캐시미션을 통해 수집 가공되었습니다.
어떤 약자를 위한 인공지능 데이터셋일까?
셀렉트스타는 WeSee와 함께 저시력자 및 시각장애인 등 교통약자를 위한 ‘교차로 정보 데이터셋’을 구축했습니다.
저시력자나 시각장애인(이동 시 휠체어나 보조기구가 필요한 이)들이 이동 시 많은 어려움을 겪고 있음에도 불구하고 국내외, 장애인의 주요 이동 통로인 ‘인도’에 대한 대규모 데이터가 구축된 사례를 찾아볼 수 없었습니다.
무심코 사용해왔던 ‘돈’ 역시 누군가에게는 불편함을 동반한다는 현실, 시각장애인들은 현금을 사용하는데 생각보다 더 많은 제약을 받습니다. 물건을 살 때 알맞은 금액을 지불한 것인지 알기 어렵고, 정확한 거스름돈을 받았는지도 알기 쉽지 않습니다. 심지어는 이를 악용하여 부당한 이득을 취하는 비도덕적인 경우도 비일비재하게 발생한다고 합니다.
현금의 사용량이 많이 줄어든 요즘이긴 하지만, 여전히 사용하는 경우가 더러 있습니다. 그렇기에 WeSee는 이러한 일들을 방지하고자, 저시력자나 시각장애인들도 수월하게 현금을 사용할 수 있기를 바라며, 화폐를 정확히 인식하고 사용자에게 정보를 전달해줄 수 있는 화폐 정보 데이터셋을 셀렉트스타를 통해 구축하였습니다.
데이터셋은 어떻게 구축했을까?
화폐에 박스 그리기 미션
‘캐시미션(앱)’에서 박스 대상의 경계선이 두 박스선 사이에 들어오도록 박스를 그리는 화면
‘캐시미션(앱)’에서 동전의 동그란 경계선 끝이 두 박스 안에 들어오도록 박스를 그려서 수집
데이터는 셀렉트스타의 크라우드소싱 플랫폼 캐시미션을 통해 수집 & 가공되었습니다.
다양한 각도로 촬영된 지폐와 동전 데이터를 수집하고, 이를 각각 레이블링하였습니다. 정확한 정보를 통해 인지도를 높이기 위해 총 55,752건이라는 방대한 양의 데이터를 모아 구축한 데이터셋입니다.
양질의 데이터를 확보할 수 있었던 좋은 기회
WeSee 공동 창업자 오선택
인공지능의 품질은 데이터셋의 양과 질에 의해 좌우되는 폭이 큰데, 많은 양질의 데이터셋을 이번 프로젝트를 통해 확보할 수 있게 되어 기쁩니다. 무엇보다 시각장애인들의 삶에 작은 진보를 이뤄낼 가능성이 더 커졌다는 점이 과한 업무에 지친 팀원들에게 하나의 보상이 된 듯 싶습니다. 많은 도움을 준 셀렉트스타에게 감사의 인사를 전합니다.
이 데이터셋은 실제로 어떻게 사용될까?
WeSee는 시각장애인들 위한 AI 모델에 활용되기를 꿈꾸고 있다고 합니다. 웨어러블 디바이스 또는 스마트폰 앱의 음성 서비스와 같은 직관적인 방식으로 실시간 도로상황과 신호등 및 횡당보도 정보를 시각장애인들이 쉽고 빠르게 인지할 수 있도록 돕는 서비스에 적용될 수 있습니다.
인공지능 컨텐츠를 다루는 유튜버 ‘빵형의 개발도상국’님께서 실제로 오픈데이터셋에 공개된 WeSee의 교차로 정보 데이터셋을 활용한 AI를 선보인 멋진 사례도 찾아볼 수 있었습니다!
기술의 발전이 모두에게 평등할 수는 없습니다. 하지만 이와 같은 underdog을 위한 AI 기술의 발전이 소외된 이들에게 희망을 줄 수 있기를 바랍니다.