AI기술이 그려나가는 스포츠의 미래
축구 경기를 이기기 위해서는 어떤 것들이 중요할까요? 아마 가장 중요한 것은 경기를 뛰는 선수들의 실력과 컨디션일 것입니다. 하지만 실력과 컨디션은 눈에 보이는 것이 아니라 정확하게 예측하기가 쉽지 않습니다.
핏투게더는 이렇게 눈으로 볼 수 없는 승리의 요소를 찾아내어 현실로 연결하고자 합니다.
웨어러블 EPTS(Electronic Performance Tracking System) 기술을 기반으로 스포츠 선수들의 움직임을 정확하게 측정하고, 움직임 빅데이터를 인공지능으로 분석하여 스포츠 팀의 의사 결정을 돕는 B2B 솔루션을 개발하고 있습니다.
데이터셋 스펙
데이터셋 구축 목적
영상을 통해 확보된 선수의 좌표와 GPS를 통해 계산한 선수의 좌표를 활용하여 기존의 단일 솔루션보다 더욱 높은 정확도로 선수의 위치를 포착하고 이를 이용한 다양한 스포츠 IT 솔루션을 제공
수량
상품 image data, bbox 좌표 및 카테고리가 있는 json 파일
(bbox 201,835개, 이미지데이터 11,150장)
각 이미지 당 평균 18개의 bbox 작업 진행
데이터 수집 및 가공 방법
핏투게더에서 제공한 K리그 축구 영상 프레임컷을 바탕으로 축구 경기 영상 내의 오브젝트에 Bounding box 및 Labeling 작업을 진행
모든 데이터는 셀렉트스타의 크라우드소싱 플랫폼 캐시미션을 통해 수집 가공되었습니다.
작업 정확도를 높이는 셀렉트스타만의 솔루션
핏투게더의 IT 솔루션은 GPS를 기반으로 합니다. 그러나 GPS 역시 측정 도구 자체의 오차를 내포하고 있으며, 천장 등의 GPS 음영이 발생하는 경우, 정확도가 감소하는 상황이 발생하기도 합니다. 이를 개선할 수 있는 수단으로 핏투게더는 영상 솔루션에 집중하고 있는데요. 영상을 통해 확보된 선수의 좌표와 GPS를 통해 계산한 선수의 좌표를 활용하여 기존의 단일 솔루션보다 더욱 높은 정확도로 선수의 위치를 포착하고자 핏투게더가 셀렉트스타의 문을 두드렸습니다.
이번 프로젝트는 축구 경기 영상 속에 보이는 선수와 심판, 그리고 공에 박스를 그리고 레이블링하는 작업이었습니다. 핏투게더가 제공한 프레임컷을 바탕으로, 셀렉트스타가 데이터 가공 기준 및 방법을 수립하고 설계하였으며, 데이터 레이블링과 검수는 모두 셀렉트스타의 크라우드소싱 플랫폼 캐시미션으로 이루어졌습니다.
박스 규격과 레이블링 정확도를 높이기 위해 셀렉트스타가 어떻게 튜토리얼을 제공했는지 함께 살펴보겠습니다.
‘캐시미션(웹)’에서 전문 가이드 팀이 작성한 크라우드 유저들의 미션 이해를 돕기 위한 가이드_ ‘축구 경기 화면 속 공과 사람들에게 박스를 그리는 미션’
‘캐시미션(앱)’에서 전문 가이드 팀이 작성한 크라우드 유저들이 미션 이해를 돕기 위한 가이드
일관된 규격의 바운딩 박스를 그릴 수 있도록 셀렉트스타의 바운딩 박스 안에는 이렇게 점선으로 가이드 박스가 하나 더 표시됩니다. 박스를 그리는 대상의 경계선이 실선과 점선 사이에 들어올 수 있도록 해야하며, 이는 셀렉트스타의 특허 기술이기도 합니다.
핏투게더는 셀렉트스타에서 제공한 학습 데이터를 이용하여 여러 object detection 알고리즘을 학습시키고 이를 기반으로 한 video tracker 개발에 박차를 가하고 있습니다. 또한 FIFA의 Quality 인증을 통해 글로벌 1위의 정확성을 인정받은 웨어러블 기술을 기반으로, 현재 대한민국의 K-League을 포함하여 전세계 35개국 약 250여개 축구팀에 솔루션을 공급하고 있습니다. Series B 투자까지 유치했다고 하니, 앞으로 제공할 더욱 풍부한 솔루션들이 기대가 됩니다.
레이블링 과정의 문제점을 해결하는 가이드라인
핏투게더 김기현 이사
기존 회사 내에서 담당자들이 직접 레이블을 제작하는 과정에서 겪었던 어려움은 너무도 많은 시간이 소요된다는 점과 레이블의 품질이 제각각이라는 점이었습니다.
그러나 셀렉트스타는 여러 프로젝트의 노하우를 살려 저희가 적절한 매뉴얼을 작성할 수 있도록 도와주셨으며 데이터를 꼼꼼히 살펴 발생 가능한 다양한 상황에 대한 의사 결정 로드맵을 작성할 수 있도록 도와주셨습니다. 덕분에 저희는 레이블링 과정에서 발생할 수 있는 여러 가능성에 대해 적절한 가이드라인을 제시할 수 있었고 이는 만족스러운 품질의 레이블 데이터 생성으로 이어졌습니다.
또한 적지 않은 양의 데이터였음에도 불구하고 셀렉트스타의 크라우드소싱 시스템 덕분에 예상보다 훨씬 빠르게 데이터를 생성할 수 있었습니다. 마무리 단계에서 진행되는 검수 역시 철저하게 진행해주셔서 내부 연구원들의 만족도는 매우 높았습니다.
이 데이터셋은 실제로 어떻게 사용될까?
현재 많은 곳에서 공통적으로 겪고 있는 스포츠 경기 영상 분석 알고리즘의 문제점은 다음과 같습니다.
- 공 위치 추적의 어려움
- 선수들이 모였다 헤치는 과정에서 태그 정보 유실
뿐만 아니라 전술 분석을 위해 영상을 촬영하는 경우 영상 내 개체의 크기가 작아 인식이 어려운 경우가 있습니다. 또한 방송 송출용 영상에서는 화각이 계속해서 바뀌기 때문에 경기장의 calibration이 어렵다는 문제가 있습니다.
이러한 문제를 해결하기 위해 스포츠 경기 영상 분석은 여전히 휴먼리소스의 개입이 여전히 필요한 상황입니다. 하지만 적극적인 스포츠 데이터 활용을 위해서는 완전한 자동화가 필요하며 이 데이터셋을 통해 단점을 보완하는 영상 알고리즘을 개발 할 수 있습니다.
핏투게더의 오픈된 데이터셋을 통해 더 많은 기업에서 더욱 고도화된 스포츠 데이터 분석 솔루션을 개발해 다양한 스포츠들이 발전할 수 있기를 바랍니다.