셀렉트스타의 NLP 연구원이 직접 말해주는 <LLM 평가 3부작>의 마지막 레터입니다. 앞선 편지에서 LLM 평가에 대한 정의와 의미, 그리고 구체적인 예시를 살펴보았는데요. 오늘은 실제로 모모잼의 안전성을 평가한 방법을 자세히 공개합니다. 1️⃣ [1] LLM 평가란 무엇인지 (무엇을, 어떤 데이터로, 어떻게?)2️⃣ [2] LLM 안전성 평가 &...
새로운 모델이 나올 때마다 연구자들은 모델을 활용할 수 있는 새로운 분야를 탐색하고는 하는데요. 지난 23일, o1의 논리적인 사고 과정을 의학 분야에 적용하여 AI 의사의 가능성을 탐구한 연구한 논문 <A Preliminary Study of o1 in Medicine: Are We Closer to an AI...