오늘날의 캐릭터 대화는 단순한 상호작용을 넘어, 개인 맞춤형으로 진화하고 있습니다.
셀렉트스타의 캐릭터 실시간 대화 기술은 마치 친구처럼 사용자와의 대화를 기억하고, 이를 바탕으로 맞춤형 화상대화를 제공합니다. 캐릭터는 사용자의 이름과 이전 대화를 바탕으로 더 깊이 있는 소통을 가능하게 합니다.
셀렉트스타는 아이코닉스(ICONIX)의 뽀로로와 로이비쥬얼(ROI VISUAL)의 로보카폴리와 협력해 실시간 대화를 지원하는 캐릭터 서비스를 선보였습니다. 이 서비스는 캐릭터의 음색을 유지하면서도 다양한 언어로 변환이 가능해, 전 세계 아이들이 이 캐릭터들과 실시간으로 소통하며 친구 같은 특별한 경험을 즐길 수 있습니다.
10분 분량의 짧은 오디오 데이터를 통해 구현 가능한 캐릭터 보이스
캐릭터 실시간 대화를 구현하려는 IP사는 새롭게 리소스를 개발할 필요 없이 기존에 보유한 모션 및 10분 분량의 짧은 오디오 데이터를 사용하여 짧은 시간안에 캐릭터를 활용한 AI 프로젝트를 완성시킬 수 있습니다.
캐릭터 실시간 대화의 핵심 기술
페르소나로 완성되는 캐릭터 대화
캐릭터의 말투, 성격과 특징, 세계관과 주변 인물 정보 등 페르소나를 통해 캐릭터 답변을 생성합니다. 사용자의 질문에 각 캐릭터들은 페르소나를 기반으로 한 특별한 답변을 하도록 AI를 활용하고 있습니다.
AI와 사람이 함께하는 이중 검토 시스템
유저와 캐릭터 대화를 바탕으로, 캐릭터의 답변을 모니터링하여 문맥 적절성, 가짜 정보, IP에 맞는 캐릭터 페르소나의 적합성, 연령 적합성 등을 AI와 사람이 이중으로 검토합니다. 부적절한 내용이나 오류가 있는지 검수한 후, 필요한 경우 AI나 데이터를 개선시킵니다.
정확한 음성 인식을 위한 사용자 음성 텍스트 변환 기술
오디오를 텍스트로 변화하는 과정에서 연령별 발화 특성을 고려한 기술을 강화하여 음성 인식 정확도를 향상시켰습니다. 또한 지속적으로 유저 발화 모니터링을 통해 발화 사전 구축을 진행하고 있습니다.
텍스트에서 캐릭터 영혼이 담긴 오디오로 자연스러운 변환
캐릭터와 실시간 화상 대화에서 AI는 캐릭터 답변을 텍스트로 먼저 생성하여, 캐릭터의 성격과 말투에 맞춘 음성 메시지로 자동 변환합니다. 이 과정에서 캐릭터의 음성과 함께 적절한 모션이 적용된 영상이 생성되어 더욱 생동감 있고 정확한 표현이 가능합니다.
-텍스트를 오디오로 변환하는 기술 : TTS(Text to speech)
-특정 보이스톤을 구현하는 기술 : Voice Cloning
-선택한 오디오의 음성을 특정 보이스톤으로 합성하는 기술 : SVC**(**Singing voice conversion)
대화에 적합한 캐릭터 모션과 보이스를 선택하는 감정 분류 모델
감정 분류 모델은 사용자 발화 내용을 통해 감정을 파악하여 대화에 생동감을 줄 수 있도록 적절한 캐릭터 보이스와 모션을 선택 하는데 활용합니다. 해당 기술을 통해 사용자가 기쁠때 캐릭터가 활짝 웃으며 대답하고, 사용자가 슬플때 캐릭터가 칭찬과 위로할 수 있는 목소리와 모션으로 대화의 몰입감을 더하여 줍니다.
셀렉트스타의 기술은 캐릭터와의 상호작용을 넘어, 사용자에게 특별한 감동을 제공합니다. 캐릭터의 음색을 유지하면서 다양한 언어로 변환 가능한 글로벌 언어 지원을 통해 일관된 경험을 제공하고, IP에 맞춘 안전한 가이드라인을 준수합니다. 이를 통해 사용자 맞춤형, 안전하고 정확한 AI 솔루션을 제공합니다.