올인원 데이터 플랫폼 셀렉트스타
수집 가공 선별 분석 기획까지
셀렉트스타는 AI를 위한 맞춤형 학습 데이터를 제공합니다.
기업과 함께 AI를 더 똑똑하게 만들어 줄 데이터를 고민하고,
보유한 기술과 축적한 노하우로 AI를 빛나게 할 데이터를 완성합니다.
“셀렉트스타의 플랫폼을 통해서 대량의 미디어 콘텐츠 데이터에 대한 가공을 신속하고 정확하게 완료할 수 있었습니다. 내부적으로 인원을 고용해서 진행을 했더라면, 정말 많은 시간이 걸릴 수도 있었던 작업을 저희 예상보다 짧은 기간에 정확하게 처리를 해 주셨었고, 지속적인 커뮤니케이션을 통해서 실시간 피드백이 가능했습니다. 덕분에 저희가 원했던 고품질의 데이터를 결과물로 전달 받을 수 있었고, 목표했던 AI 모델 개발 및 고도화를 진행할 수 있었습니다.”
SKTelecom
“전문 성우 분들의 음성 데이터가 필요해서 셀렉트스타에 의뢰를 드리게 되었습니다. 초반에 성우 선별을 위한 샘플 데이터를 꼼꼼하게 챙겨 주셔서 좋았고, 최종 전달받은 데이터의 퀄리티도 매우 만족스러웠습니다. 다음 번에도 셀렉트스타와 함께 일할 수 있기를 희망합니다.”
삼성전자
“셀렉트스타 플랫폼 덕분에 빠른 시간 내에 한국어 질문-답변 데이터셋인 KorQuad 2.0을 구축할 수 있었습니다. 다양한 작업자의 참여로 데이터 편향성을 방지하였고 품질 또한 만족스러웠습니다. 특히, 당사의 데이터 요건과 작업자의 이해를 모두 잡은 작업자 교육자료가 인상깊었습니다.”
LG CNS
“셀렉트스타와 KLUE 데이터셋을 구축하며 가장 인상적이었던 부분은 데이터 품질 관리였습니다. 상당히 어려운 난이도와 촉박한 일정이었음에도 불구하고 일관된 데이터 작업이 가능하도록 가이드라인이 수립되었고, 고품질 데이터를 만들 수 있는 작업자 선발과 교육, 전수 검사가 이뤄졌습니다. 셀렉트스타 담당자 분들의 역량과 열정 덕분에 대표 한국어 NLP 벤치마크 데이터셋인 KLUE가 무사히 세상에 나올 수 있었다고 생각합니다.”
업스테이지
“셀렉트스타의 플랫폼을 통해 대량의 OCR 데이터 가공을 신속하고 정확하게 완료할 수 있었습니다. 내부 파트타임을 고용하였을 경우 6개월이 걸리는 분량을 1달이 채 안되게 처리해주셨고 지속적인 커뮤니케이션을 통해서 즉각적인 업데이트와 피드백이 가능했습니다. 비용, 품질, 속도 모두 좋았고 덕분에 내부 리소스를 많이 절감하게 되었습니다.”
롯데정보통신
“셀렉트스타와 협업하며 가장 놀라웠던 것은 데이터 품질이었습니다. 상당히 촉박한 프로젝트 일정에도 불구하고 멋진 퀄리티의 데이터를 전달해 주셨고, 자율주행 로봇에 탑재할 이미지 Segmetation 모델을 개발하는데 큰 도움이 되었습니다. 다음 프로젝트에도 꼭 셀렉트스타와 함께 할 계획입니다. .”
뉴빌리티
“셀렉트스타와 함께 의류 및 패션 이미지 데이터 레이블링 프로젝트 (Bounding Box, Tagging, Landmark)를 진행했습니다. 원하는 데이터셋의 스펙을 서로 맞추기 위한 의사소통 과정이 원활하게 이루어졌으며, 합리적인 가격으로 내부의 니즈에 맞는 데이터셋을 확보할 수 있었습니다.”
옴니어스
“스마트홈 AI 개발을 위해 실내 사진 수집 및 레이블링을 셀렉트스타에 의뢰했습니다. 다양한 집안 환경 사진을 수집해야 해서 내부적으로 진행이 어려웠는데, 셀렉트스타의 크라우드소싱 방식이 빛을 발하여 많은 사람들로부터 데이터를 얻을 수 있었습니다. 전문성을 갖고 데이터 품질, 속도, 프로젝트 관리를 진행해주셨고 좋은 결과를 얻었습니다.”
엘컴택
“수집과 가공에 다소 시간과 노력이 많이 필요한 데이터인 다양한 책에서 많은 문제를 생성하는 프로젝트를 셀렉트스타와 함께 진행했습니다. 또한 데이터의 제공으로 끝나는 것이 아니라 재검토 과정을 거치고, 그 재검토 과정에서 발생한 문제점들에 대해서 끝까지 해결해 주셔서 양질의 데이터를 얻을 수 있었습니다.”
와이드브레인
"이제는 AI 산업에서 가장 중요한 개념이 바로 데이터의 정보의 양과 질이라는 것을 알아가고 있는 것 같습니다. 셀렉트스타는 그 AI의 본질을 가장 선도적으로 파악하여 데이터 중심의 기술력을 갖추었습니다. 특히 최근에 공개한 Datumo FST는 그 데이터의 세부적인 그 데이터 품질과 엣지 데이터를 바로 눈으로 바로 파악할 수 있는 극한의 HCI 및 획기적이고 편리한 도구입니다. 감사합니다."
삼성 디스플레이
"가이드라인에 대한 명확한 이해가 필요한 상황에서 PM님은 모든 질문에 적극적으로 답변해 주셨습니다. 그 덕분에 프로젝트의 가이드라인을 더 명확하게 이해하고 개선할 수 있었습니다. 덕분에 퀄리티를 향상시키기 위한 추가 작업을 할 수 있었고, 어려움을 함께 극복하고 프로젝트의 품질을 높여 성공적으로 마무리할 수 있었습니다. PM님의 지식과 전문성에 대한 감사의 말씀을 전하며, 앞으로의 협업을 고대하고 있습니다."
스캐터랩
"데이터셋이 레이블링하기 까다로워 기준을 확실히 하는 것이 중요했는데, 너무 많은 케이스의 사례들이 있어 레이블링 기준을 글 만으로 정의하기가 어려웠습니다. 그래서 레이블링한 데이터에 대해 피드백을 주고받으며 저희와 작업자들 간의 기준을 맞추는 것이 필요했는데, 이 부분이 매우 만족스러웠습니다. 프로젝트 초반에 미팅을 자주 하며 레이블링한 데이터에 대해 의견을 나누고 이후 작업에 대해 의견들을 반영해가며 프로젝트를 진행했는데, 이 과정이 있어 좋은 결과물이 나올 수 있었습니다."
튜닙
"데이터를 수집/가공하는 과정에서 작은 실수가 생기면 그 데이터를 활용하는 AI 성능에도 문제가 생길 수 있습니다. 이 부분을 빠르고 정확하게 해결하는 셀렉트스타는 모든 AI 기업•데이터 기업에게 가뭄의 단비와 같은 곳입니다. 좋은 성능의 AI를 위해서는 많은 데이터가 필요합니다. 필요한 데이터에 대한 명확한 정의가 필요하고 아주 많은 Raw 데이터를 수집해야 하며 각 데이터마다의 라벨링이 필요합니다. 이 과정에서 셀렉트스타는 국내 최고 수준의 기술력과 서비스를 제공한다고 생각합니다."