최근 몇 주는 자고 일어나면 유독 새로운 기술이나 모델이 많이 나온 듯 합니다. 오픈AI의 챗GPT 5.1, 구글의 제미나이3, 메타의 SAM3, 그리고 어제(25일) 앤트로픽의 클로드 오퍼스 4.5까지 정신이 없는데요. 오늘은 이 치열한 전장 속에서 가장 따끈따끈한 주인공, 클로드 오퍼스 4.5를 좀...
세계 최고 권위를 자랑하는 자연어처리 학회 EMNLP 2025에서 셀렉트스타 연구진이 참여한 논문 3편이 동시에 채택되는 쾌거를 거뒀습니다. 상위 22% 내 메인논문으로 채택된 ‘CoBA: Counterbias Text Augmentation for Mitigating Various Spurious Correlations via Semantic Triples’(이하 CoBA)는 LLM 기반 텍스트 증강으로 학습...
레이블이 없는 데이터에서 스스로 레이블을 생성해 학습하는 방법인 자기지도학습(SSL)은 지난 몇 년 동안 이미지, 텍스트, 음성 등 다양한 분야에서 학습 방식으로 사용됐습니다. 하지만 자기지도학습에는 오랫동안 해결되지 않은 구조적 문제가 있는데요. 바로 ‘임베딩 공간의 붕괴’와 ‘기하학적 왜곡’입니다. 이 문제를 보다 근본적이고...
데이터와 자유롭게 대화할 수 있다면 어떨까요? AI가 데이터 뭉치를 자유롭게 검색하고 분석해, 복잡한 인사이트도 알아서 도출해 자연어로 답변해 줄 수 있다면요. 구글 클라우드와 KAIST 공동 연구팀은 최신 논문 〈DS-STAR: Data Science Agent via Iterative Planning and Verification〉에서 데이터 사이언티스트 역할을 노리는...
지난 3~4일, 코엑스에서 열린 SK AI Summit 2025에 셀렉트스타가 부스 및 발표로 함께했습니다. 셀렉트스타는 ‘국가대표 AI’ 사업이라고도 불리는 한국 독자 AI 파운데이션 모델 구축 프로젝트에서 SKT 컨소시엄의 데이터 파트 총괄로 참여하고 있는데요. 덕분에 AI 얼라이언스(alliance) 관에서 부스를 운영하게 되었습니다. (혹시...
AI가 이미지를 이해하고 언어로 표현하는 능력이 점점 좋아지고 있습니다. 하지만 사람처럼 문맥을 파악하고, 이전에 본 정보를 새로운 상황에 적용하는 능력은 여전히 부족한데요. 이번 ICCV 2025에서 발표된 논문 <Teaching VLMs to Localize Specific Objects from In-Context Examples>는 이 한계를 해결하고자 합니다. 연구진은...
AI로 동영상을 만들 수 있다는 사실은 이제 놀랍지 않습니다. 이제는 얼마나 사실적으로, 더 쉽게 만들 수 있는지가 중요할 정도로 동영상 생성 AI는 우리에게 익숙한 존재인데요. AI 영상은 어떻게 만들어지는 걸까요? 오픈AI의 Sora로 만든 영상. 출처: 오픈AI 시작은 노이즈: 확산 모델의...
LLM은 문맥 길이에 제약이 있습니다. 아주 긴 문서를 입력하면 모두 처리하기 어렵고, 입력 토큰 수가 늘어날수록 계산 비용이 가파르게 증가해 버리지요. 이러한 문맥 길이 한계를 어떻게 극복할 수 있을까요? 서점에 가면 종종 책 사진을 찍는 사람들을 봅니다. 마음에 들거나 기억하고...
AI 모델을 오염시키는 가장 직접적인 방법 중 하나는 학습 데이터를 오염시키는 것입니다. 그렇다면, 모델 오염을 위해 필요한 데이터는 얼마나 될까요? 지금까지는 모델이 크면 클수록, 당연히 필요한 오염 데이터 수도 많아진다고 생각해왔습니다. 덕분에 큰 모델이 보다 안전하다는 인식이 있었지요. 하지만 최근...
로봇의 무작위 진입을 막기 위해 종종 뜨는 ‘로봇이 아닙니다’ 문구를 알고 계시지요? ‘캡챠(CAPTCHA)’라고 불리는 이 장치는 사람과 로봇을 구별하기 위한 목적으로 만들어졌습니다. 봇이라면 해결하기 어려운 문제를 내내 사람인지 아닌지 확인하는 절차인데요. 보안 정책상, LLM 기반 에이전트는 캡챠를 풀어서는 안됩니다. 캡챠의...