[25.08.14.9AM 웨비나] 시티은행 AI 총괄이 말하는 AI로 금융산업을 이끄는 방법

Embedding

Embedding

임베딩(Embedding)은 단어, 이미지, 기타 데이터를  연속적인 벡터 공간의 저차원 밀집 벡터(dense vector)로 변환한 표현입니다.
원래 복잡하거나 고차원인 데이터를 AI 모델이 효율적으로 처리할 수 있도록 의미적 관계나 구조를 수치 벡터에 압축하여 표현하는 방법입니다.

 

작동 원리:

 

데이터를 벡터로 매핑(Mapping Data to Vectors)
고차원 또는 기호 데이터(예: 단어)를 고정 크기의 숫자 벡터로 변환합니다.
예: 단어는 의미와 사용 패턴에 따라 숫자 벡터로 표현됨.

• 관계 유지(Preserving Relationships)
의미가 비슷한 데이터는 벡터 공간에서 가까운 위치에, 의미가 다른 데이터는 멀리 배치됩니다.

• 학습 기반 임베딩(Learning Embeddings)
Word2Vec, GloVe, BERT 등은 데이터 내 관계를 최적화하면서 임베딩을 자동으로 학습합니다.

 

활용 사례: 

 

• 자연어 처리(NLP):
단어 임베딩(예: BERT 임베딩)을 이용한 텍스트 분류, 번역, 감정 분석

• 추천 시스템(Recommender Systems):
아이템 임베딩을 사용하여 유사 상품이나 콘텐츠 추천

• 컴퓨터 비전(Computer Vision):
이미지 임베딩을 통해 유사한 이미지를 검색하거나 군집화

• 지식 그래프(Knowledge Graphs):
엔터티 임베딩을 통해 구조화된 데이터 내 관계 파악

 

중요성

 

임베딩은 비정형 데이터(텍스트, 이미지 등)를 효율적으로 처리하고 분석할 수 있게 하는 현대 AI의 핵심 기술입니다.
의미 있는 패턴과 관계를 수치화하여 모델 성능을 향상시키고, 다양한 AI 응용을 가능하게 합니다.