Zero-Shot Learning(제로샷 러닝)은 학습 과정에서 한 번도 본 적 없는 클래스(범주)를 모델이 인식하고 분류할 수 있도록 하는 머신러닝 기법입니다. 직접적인 예시가 없어도, 해당 클래스에 대한 속성 정보나 텍스트 설명 등 의미적 관계를 활용해 기존 지식을 새로운 개념으로 확장합니다. 따라서 많은...
YOLO(You Only Look Once)는 실시간 객체 탐지를 위한 알고리즘으로, 하나의 이미지에서 여러 객체를 동시에 인식하고 위치를 추정합니다. 기존 탐지 방식과 달리 YOLO는 한 번의 합성곱 신경망(CNN) 연산만으로 전체 이미지 내 객체를 탐지하기 때문에 매우 빠른 속도를 자랑합니다. 약간의 정확도를 희생하는...
White-Box Model(화이트박스 모델)이란 내부 작동 방식이 완전히 투명하고 사람이 이해할 수 있도록 설계된 머신러닝 모델을 의미합니다. 입력이 어떻게 예측 결과에 영향을 미치는지 전 과정이 추적 가능하며, 설명 가능성과 감사(auditability)가 중요한 환경에서 적합하게 사용됩니다. 주요 특징: • 투명성(Transparency): 모든...
VLM(Vision-Language Model, 비전-언어 모델)이란 시각 정보(이미지)와 언어 정보(텍스트)를 함께 처리하고 이해할 수 있는 AI 모델을 의미합니다. 이미지와 텍스트를 정렬(alignment)하여, 이미지 캡셔닝, 시각적 질문 응답, 멀티모달 추론 등 다양한 복합 과제를 수행할 수 있게 해줍니다. 주요 특징: • 멀티모달...
Vector Database(벡터 데이터베이스)란 텍스트, 이미지, 오디오 등의 데이터를 수치 벡터(embedding) 형태로 저장하고 검색할 수 있도록 설계된 특수한 데이터베이스입니다. 이 벡터는 의미적 정보를 반영하므로, 벡터 데이터베이스는 의미 기반 검색, 추천 시스템, AI 메모리 기능 등에 활용됩니다. 주요 특징: • 고차원...
Unsupervised Learning(비지도 학습)이란 정답(label) 없이 데이터의 패턴을 스스로 학습하는 머신러닝 방식입니다. Supervised Learning(지도 학습)과 달리 입력과 출력 쌍에 의존하지 않고, 데이터 내부의 숨겨진 구조나 군집, 관계를 찾아냅니다. 주로 라벨이 없거나 라벨링 비용이 높은 상황에서 활용됩니다. 주요 특징: •...
Underfitting(언더피팅)이란 머신러닝 모델이 너무 단순하여 데이터의 근본적인 패턴을 제대로 학습하지 못하는 현상을 의미합니다. 이로 인해 훈련 데이터와 테스트 데이터 모두에서 낮은 성능을 보이며, 데이터의 신호(signal)를 제대로 포착하지 못합니다. 일반적으로 모델의 복잡도가 너무 낮거나, 특징(feature)이 부족하거나, 학습이 충분히 이루어지지 않았을 때...
Trustworthy AI(신뢰 가능한 인공지능)란 윤리적이고 투명하며 신뢰할 수 있는 인공지능 시스템을 의미합니다. 이러한 시스템은 인간의 가치와 사회적 기대에 부합하며, 그 생애주기 전반에 걸쳐 안전성, 공정성, 책임성을 보장합니다. 신뢰 가능한 AI는 의료, 금융, 교육 등 다양한 분야에서 책임 있는 도입과 대중의...
Tree of Thoughts(사고의 나무)는 대형 언어 모델(LLM)이 하나의 정답에 도달하기 전에 다양한 사고 경로를 탐색하도록 유도하는 추론 프레임워크입니다. 기존의 단일하고 선형적인 사고 흐름 대신, 이 프레임워크는 여러 지점에서 분기하며 다양한 가능성을 생성하고 이를 비교 및 평가하는 방식으로 작동합니다. 사고 과정을...
Transformer Model(트랜스포머 모델)은 2017년 발표된 논문 “Attention is All You Need” 를 통해 제안된 신경망 아키텍처입니다. 기존의 RNN(Recurrent Neural Network, 순환 신경망)과 달리 입력 데이터를 병렬로 처리하며, 문맥 속 단어들 간의 관계를 파악하기 위해 Self-Attention(셀프 어텐션) 메커니즘을 사용합니다. 주요...