데이터 구조화란 무엇일까요? 지난 아티클에서 LLM 학습을 위한 새로운 접근법으로 RAG에 대해 알아보았는데요. RAG는 오픈북 테스트처럼 외부의 데이터를 활용해 모델이 필요한 정보를 찾아 답변을 생성하는 방식입니다. RAG의 성능은 데이터를 얼마나 효과적으로 구조화하느냐에 따라 크게 달라집니다. 데이터 구조화는 모델이 적절한 정보를...
생성형 AI를 기반으로 한 대규모 언어 모델(LLM)은 다양한 도메인에서 강력한 성능을 발휘하고 있습니다. 그러나 AI를 실제 환경에서 활용하기 위해서는 모델의 학습 방식과 데이터를 다루는 전략에 대한 이해가 필수적입니다. 이번 편에서는 LLM 학습과 RAG(Retrieval-Augmented Generation)에 대해 이야기 해보려고합니다. RAG의 필요성과 데이터를...
생성형 AI가 인간에게 유용한 도구로 자리 잡기 위해서는 단순히 데이터를 학습하는 것을 넘어, 사람의 의도를 이해하고, 인간의 기대에 부합하는 방식으로 응답할 수 있어야 합니다. 이를 가능하게 하는 핵심 요소가 바로 휴먼 얼라인먼트(Human Alignment)인데요. 휴먼 얼라인먼트가 무엇인지, 또 이를 이용한 학습...
그림 한 장, 텍스트 몇 줄, 혹은 사진 한 장으로 $%name%$님만의 가상 세계를 만들 수 있다면 어떨까요? 올해 2월 구글이 공개한 구글 Genie (Generative Interactive Environment)는 바로 그런 마법을 가능하게 하는 모델입니다. 이번에는 구글이 후속작 Genie 2를 선보이며 World Model로 나아갈...
감동+기술, 하츄핑 AI 영상편지 케이크 셀렉트스타가 또 ‘캐치! 티니핑’을 만났습니다! 이번에는 대한민국 대표 베이커리인 뚜레쥬르도 함께 했는데요. 이번 프로젝트는 ‘캐치! 티니핑’ 캐릭터를 활용해 AI 영상편지까지 제공 받는 ‘하츄핑의 스타 플래닛’ 케이크입니다. 케이크 뿐만 아니라 AI 기술을 통해 맞춤형 축하 메시지를...
AI 기술이 발전하는 속도를 따라잡기가 어렵습니다. 특히 생성형 AI는 그 중심에 서 있는데요. 우리에게 ChatGPT로 익숙한 생성형 AI는 텍스트 뿐만 아니라, 이미지, 음성, 영상 등 다양한 형태의 데이터를 처리하고 생성하는 능력을 통해 혁신의 새 지평을 열고 있습니다. 생성형 AI가 어디까지...
오늘도 어마어마한 규모의 도서관에 들어서며 레터를 시작하고자 합니다. 책이 끝없이 늘어서 있는 이곳에서 또 한 번 “기술 산업의 주요 트렌드는 무엇인가요?”라고 묻습니다. 지난 번 테크레터에서, 우리는 Graph RAG를 질문과 관련된 책과 자료를 빠르게 찾아 요약해 주는 ‘스마트 사서’로 비유했는데요. 오늘 살펴...
2022년 7월, Stable Diffusion 등장 이후 생성 모델은 세계적인 화두가 되었습니다. 특히 비전 분야에서는 Diffusion 계열의 이미지 생성 모델이 주목 받았습니다. 그로부터 2년이 지난 현재, 생성 모델은 이미지를 넘어 영상과 3D 객체까지 생성하고 있습니다. Microsoft의 수석 연구원이 CVPR 2024 튜토리얼에서...
대형 언어 모델(LLM)이 다양한 산업에서 상용화되면서, 성능과 안전성 평가가 필수 과제로 부상하고 있습니다. 특히, 생성형 AI의 특성상 기존의 딥러닝 모델처럼 정형화된 정답이 없기 때문에 평가가 더욱 복잡한데요. 정보의 정확성, 유해성, 관련성 등 다양한 요소를 종합적으로 고려해야 합니다. 셀렉트스타는 이 문제를...
어마어마한 규모의 도서관에 들어섰다고 상상해 볼까요? 책이 끝없이 늘어서 있는 이곳에서 “기술 산업의 주요 트렌드는 무엇인가요?”라고 묻습니다. 이때 도서관 사서가 관련된 책을 찾는 데 그치지 않고, 도서관에 존재하는 기술 산업과 관련된 모든 자료를 요약해 제공한다면 어떨까요? Graph RAG는 바로 이러한 혁신적인...