그림 한 장, 텍스트 몇 줄, 혹은 사진 한 장으로 나만의 가상 세계를 만들 수 있다면 어떨까요? 올해 2월 구글이 공개한 구글 Genie (Generative Interactive Environment)는 바로 그런 마법을 가능하게 하는 모델입니다. 이번에는 구글이 후속작 Genie 2를 선보이며 World Model로 나아갈...
감동+기술, 하츄핑 AI 영상편지 케이크 셀렉트스타가 또 ‘캐치! 티니핑’을 만났습니다! 이번에는 대한민국 대표 베이커리인 뚜레쥬르도 함께 했는데요. 이번 프로젝트는 ‘캐치! 티니핑’ 캐릭터를 활용해 AI 영상편지까지 제공 받는 ‘하츄핑의 스타 플래닛’ 케이크입니다. 케이크 뿐만 아니라 AI 기술을 통해 맞춤형 축하 메시지를...
AI 기술이 발전하는 속도를 따라잡기가 어렵습니다. 특히 생성형 AI는 그 중심에 서 있는데요. 우리에게 ChatGPT로 익숙한 생성형 AI는 텍스트 뿐만 아니라, 이미지, 음성, 영상 등 다양한 형태의 데이터를 처리하고 생성하는 능력을 통해 혁신의 새 지평을 열고 있습니다. 생성형 AI가 어디까지...
1편 <RAG를 뛰어넘는 Graph RAG> 읽고 오기 오늘도 어마어마한 규모의 도서관에 들어서며 레터를 시작하고자 합니다. 책이 끝없이 늘어서 있는 이곳에서 또 한 번 “기술 산업의 주요 트렌드는 무엇인가요?”라고 묻습니다. 지난 번 테크레터에서, 우리는 Graph RAG를 질문과 관련된 책과 자료를 빠르게...
2022년 7월, Stable Diffusion 등장 이후 생성 모델은 세계적인 화두가 되었습니다. 특히 비전 분야에서는 Diffusion 계열의 이미지 생성 모델이 주목 받았습니다. 그로부터 2년이 지난 현재, 생성 모델은 이미지를 넘어 영상과 3D 객체까지 생성하고 있습니다. Microsoft의 수석 연구원이 CVPR 2024 튜토리얼에서...
대형 언어 모델(LLM)이 다양한 산업에서 상용화되면서, 성능과 안전성 평가가 필수 과제로 부상하고 있습니다. 특히, 생성형 AI의 특성상 기존의 딥러닝 모델처럼 정형화된 정답이 없기 때문에 평가가 더욱 복잡한데요. 정보의 정확성, 유해성, 관련성 등 다양한 요소를 종합적으로 고려해야 합니다. 셀렉트스타는 이 문제를...
어마어마한 규모의 도서관에 들어섰다고 상상해 볼까요? 책이 끝없이 늘어서 있는 이곳에서 “기술 산업의 주요 트렌드는 무엇인가요?”라고 묻습니다. 이때 도서관 사서가 관련된 책을 찾는 데 그치지 않고, 도서관에 존재하는 기술 산업과 관련된 모든 자료를 요약해 제공한다면 어떨까요? Graph RAG는 바로 이러한 혁신적인...
‘AI가 인간을 능가할 수 있다’는 가정은 더이상 놀랍지 않습니다. 시간의 문제처럼 여겨지기도 하지요. 자율 주행에서 코드 작성까지, AI는 점점 빠르게 인간의 능력을 따라잡거나 능가하고 있습니다. 특히, 최근 개발된 LLM은 Python 코딩 문제 해결에서 90% 이상의 높은 정확도를 기록하며, 사람을 능가하는...
대형 언어 모델(LLM)의 발전으로 AI 분야에 새로운 가능성이 열렸습니다: 바로 LLM 에이전트인데요. 기존의 AI 모델이 독립적인 프롬프트에 수동적으로 반응하는 데 비해, LLM 에이전트는 동적이고 자율적인 비서처럼 작동하도록 설계되었습니다. 이들은 다단계 작업을 수행하고 다른 시스템과 상호작용하며, 복잡한 요청을 처리하기 위해 외부...
자연어 생성(Natural Language Generation) 분야에서 “좋은 텍스트”를 평가하는 일은 늘 어렵습니다. 인간의 직관과 일치하도록 텍스트의 품질을 가늠하는 작업은 특히나 창의적이거나 개방형인 작업일수록 까다롭지요. 기존의 평가 지표인 BLEU나 ROUGE는 성능을 수치화하는 데 유용하지만, 대화나 요약과 같은 작업에서 요구되는 다양성과 창의성을 제대로 반영하지...