문서 데이터 정비
일반 구조화로 해결되지 않는 정확성과 효율성을 극대화해 드립니다
문서 데이터 정비
일반 구조화로 해결되지 않는 정확성과 효율성을 극대화해 드립니다
챗봇 도입을 원하는 기업을 위한 솔루션
OCR(텍스트 데이터 변환)부터 챗봇 제공까지, 모든 과정을 도와드립니다
원본 데이터 OCR
구조화
청크(Chunk)화
RAG를 위한 DB 설계
챗봇 제공
솔루션
Semantic 구조화
탑다운으로 작성된 문서를 다양한 방식과 길이로 Chunking 가능한 문단 단위로 구조화하여, JSON 형식으로 반환합니다.
다양한 Chunk로 Vector DataBase를 구성하여 쿼리에 대한 답변을 구체화하고 정확도를 향상시킵니다.
Synthetic Chunk 1
Synthetic Chunk 2
Synthetic Chunk 3
Synthetic Chunk 4
Synthetic Chunk 1
KDB 정기예금 상품의 이름과 특징
Synthetic Chunk 2
KDB 정기예금 상품의 거래조건
Synthetic Chunk 3
KDB 정기예금 상품의 출처
Synthetic Chunk 4
KDB 정기예금 상품의 심의번호
의미론적으로 유사한 문장들을 모아 문단 구성
문단 단위로 Chunk 구성, 표 형태 붕괴 문제 해결
계층화된 key 값을 부여, 용이한 Chunk 조합
각 Chunk를 조합, Synthetic Chunk 생성
Synthetic Chunk를 통해 질문에 맞는 답변 생성
QA 결과 비교
일반 구조화 VS Semantic 구조화
셀렉트스타의 Semantic 구조화는 일반 구조화보다 효율적인 문서 데이터 정비를 통한 정확한 답변 생성이 가능합니다.
The Data-centirc AI Company
AI 성능 개선, 데이터로부터 시작됩니다