The Data-centric AI Company
All-in-one Data Service
AI 기업의 핵심 데이터 파트너, 전체 AI Data Value-chain에 서비스 제공
AI Product Business
Data-centric AI 기술과 Domain 파트너십을 결합한 AI Product Business
데이터 기획 서비스
데이터 구조화
Raw 문서 · 지식 데이터를 최적의 형태로 구성하여 RAG 기반 LLM 도입을 위한 데이터 설계
파인튜닝 학습 데이터
Instruction 데이터셋 등 파운데이션 모델을 서비스에 튜닝 시키기 위한 학습데이터 설계
Red Teaming
AI의 잘못된, 유해한 답변을 의도적으로 유도하여 서비스 리스크를 찾는 Red Teaming 설계
평가 데이터
AI 성능과 신뢰성을 서비스 목적에 맞게 평가하기 위한 데이터 설계
고객 성공 사례
AI 개발을 가속하세요
체계적 데이터 라벨러 선발-교육-관리로 대규모 고품질 데이터셋을 빠르게 구축합니다
“셀렉트스타의 플랫폼을 통해서 대량의 미디어 콘텐츠 데이터에 대한 가공을 신속하고 정확하게 완료할 수 있었습니다. 내부적으로 인원을 고용해서 진행을 했더라면, 정말 많은 시간이 걸릴 수도 있었던 작업을 저희 예상보다 짧은 기간에 정확하게 처리를 해 주셨었고, 지속적인 커뮤니케이션을 통해서 실시간 피드백이 가능했습니다. 덕분에 저희가 원했던 고품질의 데이터를 결과물로 전달 받을 수 있었고, 목표했던 AI 모델 개발 및 고도화를 진행할 수 있었습니다.”
SKTelecom
“전문 성우 분들의 음성 데이터가 필요해서 셀렉트스타에 의뢰를 드리게 되었습니다. 초반에 성우 선별을 위한 샘플 데이터를 꼼꼼하게 챙겨 주셔서 좋았고, 최종 전달받은 데이터의 퀄리티도 매우 만족스러웠습니다. 다음 번에도 셀렉트스타와 함께 일할 수 있기를 희망합니다.”
삼성전자
“셀렉트스타 플랫폼 덕분에 빠른 시간 내에 한국어 질문-답변 데이터셋인 KorQuad 2.0을 구축할 수 있었습니다. 다양한 작업자의 참여로 데이터 편향성을 방지하였고 품질 또한 만족스러웠습니다. 특히, 당사의 데이터 요건과 작업자의 이해를 모두 잡은 작업자 교육자료가 인상깊었습니다.”
LG CNS
“셀렉트스타와 KLUE 데이터셋을 구축하며 가장 인상적이었던 부분은 데이터 품질 관리였습니다. 상당히 어려운 난이도와 촉박한 일정이었음에도 불구하고 일관된 데이터 작업이 가능하도록 가이드라인이 수립되었고, 고품질 데이터를 만들 수 있는 작업자 선발과 교육, 전수 검사가 이뤄졌습니다. 셀렉트스타 담당자 분들의 역량과 열정 덕분에 대표 한국어 NLP 벤치마크 데이터셋인 KLUE가 무사히 세상에 나올 수 있었다고 생각합니다.”
업스테이지
“셀렉트스타의 플랫폼을 통해 대량의 OCR 데이터 가공을 신속하고 정확하게 완료할 수 있었습니다. 내부 파트타임을 고용하였을 경우 6개월이 걸리는 분량을 1달이 채 안되게 처리해주셨고 지속적인 커뮤니케이션을 통해서 즉각적인 업데이트와 피드백이 가능했습니다. 비용, 품질, 속도 모두 좋았고 덕분에 내부 리소스를 많이 절감하게 되었습니다.”
롯데정보통신
“셀렉트스타와 협업하며 가장 놀라웠던 것은 데이터 품질이었습니다. 상당히 촉박한 프로젝트 일정에도 불구하고 멋진 퀄리티의 데이터를 전달해 주셨고, 자율주행 로봇에 탑재할 이미지 Segmetation 모델을 개발하는데 큰 도움이 되었습니다. 다음 프로젝트에도 꼭 셀렉트스타와 함께 할 계획입니다. .”
뉴빌리티
“셀렉트스타와 함께 의류 및 패션 이미지 데이터 레이블링 프로젝트 (Bounding Box, Tagging, Landmark)를 진행했습니다. 원하는 데이터셋의 스펙을 서로 맞추기 위한 의사소통 과정이 원활하게 이루어졌으며, 합리적인 가격으로 내부의 니즈에 맞는 데이터셋을 확보할 수 있었습니다.”
옴니어스
“스마트홈 AI 개발을 위해 실내 사진 수집 및 레이블링을 셀렉트스타에 의뢰했습니다. 다양한 집안 환경 사진을 수집해야 해서 내부적으로 진행이 어려웠는데, 셀렉트스타의 크라우드소싱 방식이 빛을 발하여 많은 사람들로부터 데이터를 얻을 수 있었습니다. 전문성을 갖고 데이터 품질, 속도, 프로젝트 관리를 진행해주셨고 좋은 결과를 얻었습니다.”
엘컴택
“수집과 가공에 다소 시간과 노력이 많이 필요한 데이터인 다양한 책에서 많은 문제를 생성하는 프로젝트를 셀렉트스타와 함께 진행했습니다. 또한 데이터의 제공으로 끝나는 것이 아니라 재검토 과정을 거치고, 그 재검토 과정에서 발생한 문제점들에 대해서 끝까지 해결해 주셔서 양질의 데이터를 얻을 수 있었습니다.”
와이드브레인
"이제는 AI 산업에서 가장 중요한 개념이 바로 데이터의 정보의 양과 질이라는 것을 알아가고 있는 것 같습니다. 셀렉트스타는 그 AI의 본질을 가장 선도적으로 파악하여 데이터 중심의 기술력을 갖추었습니다. 특히 최근에 공개한 Datumo FST는 그 데이터의 세부적인 그 데이터 품질과 엣지 데이터를 바로 눈으로 바로 파악할 수 있는 극한의 HCI 및 획기적이고 편리한 도구입니다. 감사합니다."
삼성 디스플레이
"가이드라인에 대한 명확한 이해가 필요한 상황에서 PM님은 모든 질문에 적극적으로 답변해 주셨습니다. 그 덕분에 프로젝트의 가이드라인을 더 명확하게 이해하고 개선할 수 있었습니다. 덕분에 퀄리티를 향상시키기 위한 추가 작업을 할 수 있었고, 어려움을 함께 극복하고 프로젝트의 품질을 높여 성공적으로 마무리할 수 있었습니다. PM님의 지식과 전문성에 대한 감사의 말씀을 전하며, 앞으로의 협업을 고대하고 있습니다."
스캐터랩
"데이터셋이 레이블링하기 까다로워 기준을 확실히 하는 것이 중요했는데, 너무 많은 케이스의 사례들이 있어 레이블링 기준을 글 만으로 정의하기가 어려웠습니다. 그래서 레이블링한 데이터에 대해 피드백을 주고받으며 저희와 작업자들 간의 기준을 맞추는 것이 필요했는데, 이 부분이 매우 만족스러웠습니다. 프로젝트 초반에 미팅을 자주 하며 레이블링한 데이터에 대해 의견을 나누고 이후 작업에 대해 의견들을 반영해가며 프로젝트를 진행했는데, 이 과정이 있어 좋은 결과물이 나올 수 있었습니다."
튜닙
"데이터를 수집/가공하는 과정에서 작은 실수가 생기면 그 데이터를 활용하는 AI 성능에도 문제가 생길 수 있습니다. 이 부분을 빠르고 정확하게 해결하는 셀렉트스타는 모든 AI 기업•데이터 기업에게 가뭄의 단비와 같은 곳입니다. 좋은 성능의 AI를 위해서는 많은 데이터가 필요합니다. 필요한 데이터에 대한 명확한 정의가 필요하고 아주 많은 Raw 데이터를 수집해야 하며 각 데이터마다의 라벨링이 필요합니다. 이 과정에서 셀렉트스타는 국내 최고 수준의 기술력과 서비스를 제공한다고 생각합니다."
CNAI
“셀렉트스타의 플랫폼을 통해서 대량의 미디어 콘텐츠 데이터에 대한 가공을 신속하고 정확하게 완료할 수 있었습니다. 내부적으로 인원을 고용해서 진행을 했더라면, 정말 많은 시간이 걸릴 수도 있었던 작업을 저희 예상보다 짧은 기간에 정확하게 처리를 해 주셨었고, 지속적인 커뮤니케이션을 통해서 실시간 피드백이 가능했습니다. 덕분에 저희가 원했던 고품질의 데이터를 결과물로 전달 받을 수 있었고, 목표했던 AI 모델 개발 및 고도화를 진행할 수 있었습니다.”
SKTelecom
“전문 성우 분들의 음성 데이터가 필요해서 셀렉트스타에 의뢰를 드리게 되었습니다. 초반에 성우 선별을 위한 샘플 데이터를 꼼꼼하게 챙겨 주셔서 좋았고, 최종 전달받은 데이터의 퀄리티도 매우 만족스러웠습니다. 다음 번에도 셀렉트스타와 함께 일할 수 있기를 희망합니다.”
삼성전자
“셀렉트스타 플랫폼 덕분에 빠른 시간 내에 한국어 질문-답변 데이터셋인 KorQuad 2.0을 구축할 수 있었습니다. 다양한 작업자의 참여로 데이터 편향성을 방지하였고 품질 또한 만족스러웠습니다. 특히, 당사의 데이터 요건과 작업자의 이해를 모두 잡은 작업자 교육자료가 인상깊었습니다.”
LG CNS
“셀렉트스타와 KLUE 데이터셋을 구축하며 가장 인상적이었던 부분은 데이터 품질 관리였습니다. 상당히 어려운 난이도와 촉박한 일정이었음에도 불구하고 일관된 데이터 작업이 가능하도록 가이드라인이 수립되었고, 고품질 데이터를 만들 수 있는 작업자 선발과 교육, 전수 검사가 이뤄졌습니다. 셀렉트스타 담당자 분들의 역량과 열정 덕분에 대표 한국어 NLP 벤치마크 데이터셋인 KLUE가 무사히 세상에 나올 수 있었다고 생각합니다.”
업스테이지
“셀렉트스타의 플랫폼을 통해 대량의 OCR 데이터 가공을 신속하고 정확하게 완료할 수 있었습니다. 내부 파트타임을 고용하였을 경우 6개월이 걸리는 분량을 1달이 채 안되게 처리해주셨고 지속적인 커뮤니케이션을 통해서 즉각적인 업데이트와 피드백이 가능했습니다. 비용, 품질, 속도 모두 좋았고 덕분에 내부 리소스를 많이 절감하게 되었습니다.”
롯데정보통신
“셀렉트스타와 협업하며 가장 놀라웠던 것은 데이터 품질이었습니다. 상당히 촉박한 프로젝트 일정에도 불구하고 멋진 퀄리티의 데이터를 전달해 주셨고, 자율주행 로봇에 탑재할 이미지 Segmetation 모델을 개발하는데 큰 도움이 되었습니다. 다음 프로젝트에도 꼭 셀렉트스타와 함께 할 계획입니다. .”
뉴빌리티
“셀렉트스타와 함께 의류 및 패션 이미지 데이터 레이블링 프로젝트 (Bounding Box, Tagging, Landmark)를 진행했습니다. 원하는 데이터셋의 스펙을 서로 맞추기 위한 의사소통 과정이 원활하게 이루어졌으며, 합리적인 가격으로 내부의 니즈에 맞는 데이터셋을 확보할 수 있었습니다.”
옴니어스
“스마트홈 AI 개발을 위해 실내 사진 수집 및 레이블링을 셀렉트스타에 의뢰했습니다. 다양한 집안 환경 사진을 수집해야 해서 내부적으로 진행이 어려웠는데, 셀렉트스타의 크라우드소싱 방식이 빛을 발하여 많은 사람들로부터 데이터를 얻을 수 있었습니다. 전문성을 갖고 데이터 품질, 속도, 프로젝트 관리를 진행해주셨고 좋은 결과를 얻었습니다.”
엘컴택
“수집과 가공에 다소 시간과 노력이 많이 필요한 데이터인 다양한 책에서 많은 문제를 생성하는 프로젝트를 셀렉트스타와 함께 진행했습니다. 또한 데이터의 제공으로 끝나는 것이 아니라 재검토 과정을 거치고, 그 재검토 과정에서 발생한 문제점들에 대해서 끝까지 해결해 주셔서 양질의 데이터를 얻을 수 있었습니다.”
와이드브레인
"이제는 AI 산업에서 가장 중요한 개념이 바로 데이터의 정보의 양과 질이라는 것을 알아가고 있는 것 같습니다. 셀렉트스타는 그 AI의 본질을 가장 선도적으로 파악하여 데이터 중심의 기술력을 갖추었습니다. 특히 최근에 공개한 Datumo FST는 그 데이터의 세부적인 그 데이터 품질과 엣지 데이터를 바로 눈으로 바로 파악할 수 있는 극한의 HCI 및 획기적이고 편리한 도구입니다. 감사합니다."
삼성 디스플레이
"가이드라인에 대한 명확한 이해가 필요한 상황에서 PM님은 모든 질문에 적극적으로 답변해 주셨습니다. 그 덕분에 프로젝트의 가이드라인을 더 명확하게 이해하고 개선할 수 있었습니다. 덕분에 퀄리티를 향상시키기 위한 추가 작업을 할 수 있었고, 어려움을 함께 극복하고 프로젝트의 품질을 높여 성공적으로 마무리할 수 있었습니다. PM님의 지식과 전문성에 대한 감사의 말씀을 전하며, 앞으로의 협업을 고대하고 있습니다."
스캐터랩
"데이터셋이 레이블링하기 까다로워 기준을 확실히 하는 것이 중요했는데, 너무 많은 케이스의 사례들이 있어 레이블링 기준을 글 만으로 정의하기가 어려웠습니다. 그래서 레이블링한 데이터에 대해 피드백을 주고받으며 저희와 작업자들 간의 기준을 맞추는 것이 필요했는데, 이 부분이 매우 만족스러웠습니다. 프로젝트 초반에 미팅을 자주 하며 레이블링한 데이터에 대해 의견을 나누고 이후 작업에 대해 의견들을 반영해가며 프로젝트를 진행했는데, 이 과정이 있어 좋은 결과물이 나올 수 있었습니다."
튜닙
"데이터를 수집/가공하는 과정에서 작은 실수가 생기면 그 데이터를 활용하는 AI 성능에도 문제가 생길 수 있습니다. 이 부분을 빠르고 정확하게 해결하는 셀렉트스타는 모든 AI 기업•데이터 기업에게 가뭄의 단비와 같은 곳입니다. 좋은 성능의 AI를 위해서는 많은 데이터가 필요합니다. 필요한 데이터에 대한 명확한 정의가 필요하고 아주 많은 Raw 데이터를 수집해야 하며 각 데이터마다의 라벨링이 필요합니다. 이 과정에서 셀렉트스타는 국내 최고 수준의 기술력과 서비스를 제공한다고 생각합니다."
CNAI
데이터셋 구축 사례
신속 · 정확한 고품질 데이터셋
400개 이상 프로젝트 진행, 2억 건 이상 데이터 작업 노하우를 확인해 보세요
데이터셋 스토어
더욱 강력한 AI 프로젝트, 라이선스가 확보된 고품질 데이터로 구현해 보세요
간편하게 구매하고, 빠르게 활용하세요
전문가 질의응답 데이터셋 도서 데이터셋 사진, 일러스트, 영상 데이터 다국어 대화 데이터셋 다국어 번역 데이터셋 합성 데이터셋 코딩 테스트 데이터셋 카드 데이터셋 언론 데이터셋
데이터 구축 서비스 - CONTENT & LANGUAGE
인간 인지 능력 수집
사람과 상호작용하는 AI, 사람처럼 행동하는 AI 개발을 위해 인간의 감정 및 주관적 판단, 평가 데이터 등을 수집합니다. 수집 데이터는 검색, 음성 전사, 문서 처리, 대화문 생성 등에 활용됩니다.
데이터 구축 서비스 - VISION
컴퓨터 비전 및 영상 처리
이미지 및 비디오 데이터를 프로젝트에 가장 알맞은 형태으로 가공하고 올바른 주석을 더합니다.
수집 데이터는 자율주행, 건강 및 재난 위험 감지, 상품 식별 및 추천 AI 개발에 활용됩니다.
AI Trends & Insights
셀렉트스타가 읽어 주는 AI NEWS & TRENDS
셀렉트스타가 직접 주최하는 최신 AI 정보와 지식을 공유하는 네트워킹 데이, 뉴스레터, 각종 세미나 및 콘퍼런스까지
우리 회사도 AI 도입 할 수 있을까?
많은 곳에서 비용 절감, 업무 자동화 등을 위해 인공지능을 적극 활용하려고 합니다. 하지만 그 중요성을 알면서도 도입하지 못하는 데는 다양한 이유가 있습니다.
세계 최대 규모 AI 레드팀 챌린지
생성형 AI 레드팀 챌린지에 셀렉트스타는 Presenting Partner이자 운영사무국으로 함께하며 행사 기획, 레드 티밍 플랫폼 구축, 데이터 분석을 진행했습니다.
LLaVA: 멀티모달계의 LLaMA
ChatGPT 등장 이후 우리는 자연어로 AI에 질문하는 방식이 익숙해졌습니다. 멀티모달도 ChatGPT처럼 텍스트로 학습 시키는 방법이 있는데요. 바로 Instruction Tuning입니다.
AI/DX Newsletter
AI NEWS & TRENDS 받아보기
함께 성장할 동료를 찾습니다
셀렉트스타 미션과 비전에 공감하고, 가치관과 일하는 방식을 공유하며 함께 성장할 멤버를 모시고자 합니다.