초‧중‧고 주요 교과목 및 고난이도 수학 문항*
*고난이도 수학 문항: 한국올림피아드(KMO) 및 대학원 수준
교육AI
추론강화
교과과정
태그
교육AI
추론강화
교과과정
무해성(Harmlessness) 평가 데이터 구성
제공 형태
JSON(추가 정제 협의 가능)
보유 수량
• 초중고 수준: 400,000건 이상
• 고난이도 수학: 13,000건 이상
• 고난이도 수학: 13,000건 이상
최소 구매 수량
기간에 따른 별도 협의
1. 편향성(Bias) 평가데이터
특정 대상에 대한 선입견이나 고정관념을 유도하는 질문
2. 혐오(Hate) 평가데이터
특정 대상에 대한 혐오나 공격적인 답변을 유도하는 질문
3. 위법성(Illegal) 평가데이터
우리나라 법에 저촉되는 여러 행위들에 대한 질문
4. 민감성(Sensitiveness) 평가데이터
논란의 여지가 있거나, 미래 예측 등 사회적으로 민감할 수 있는 주제에 대한 질문
무해성 평가 데이터를 시의성 반영 여부로 분류하여 구성
• 최근 사회적 이슈를 반영한 무해성 평가를 위해 일반 무해성 평가 데이터와 시의성 반영 무해성 평가 데이터로 구성
• 일반 무해성 평가 데이터는 시의성과 큰 관련이 없는 일반적 유해 요소 반영
• 시의성 반영 무해성 평가 데이터는 최근 사회적 이슈와 연관된 유해 요소 반영
평가 항목
편향성
혐오
위법성
민감성
합계
일반 수량
3,000
3,000
750
0
6,750
시의성 반영 수량
1,000
1,000
250
1,000
3,250
합계
4,000
4,000
1,000
1,000
10,000
평가 항목
편향성(Bias)
혐오(Hate)
위법성(Illegal)
민감성(Sensitiveness)
합계
일반 무해성 평가 데이터 수량
3,000
3,000
750
0
6,750
시의성 반영 무해성 평가 데이터 수량
1,000
1,000
250
1,000
3,250
합계
4,000
4,000
1,000
1,000
10,000
활용분야
AI 신뢰성 및 안전성 검증
AI 모델 답변의 편향(Bias), 혐오(Hate) 요소를 정량적으로 평가하고 진단. 위법성, 민감성 문항을 통해 서비스 출시 전 법적/사회적 리스크를 선제적으로 검증하고 AI의 안전성을 확보하는 데 활용.
최신 이슈 대응 능력 평가
시의성 반영 데이터를 활용해 AI가 최근 사회적 이슈 관련 질문에 대해 편향/민감한 답변을 생성하는지 집중 평가. 급변하는 사회적 맥락을 인지하고 무해한 답변을 생성하도록 성능 개선에 활용.
유해성 필터링 모델 고도화
유해 콘텐츠를 걸러내는 가드레일(Guardrail) 모델 학습에 최적화. 다양한 유형의 악의적 질문과 잠재적 유해 답변을 학습시켜 필터링 모델의 방어력을 극대화하고 오탐률을 최소화.
외 다양한 사례에 적용 가능합니다.