Command Palette
Search for a command to run...
CHOCLO 라틴 아메리카 문화 벤치마크 데이터 세트
CHOCLO 라틴 아메리카 문화 벤치마크 데이터셋은 언어 모델에서 라틴 아메리카 문화에 대한 지식을 평가하기 위해 설계된 벤치마크 데이터셋입니다. 이 데이터셋은 언어 모델이 라틴 아메리카 문화를 얼마나 정확하게 표현하는지 평가하는 것을 목표로 하며, 특히 언어 모델에서 라틴 아메리카 문화가 과소평가되거나, 누락되거나, 편향되는 등의 현실적인 문제를 해결하도록 설계되었습니다. 이 데이터 세트는 전통, 음식, 유명 인사, 지리, 동물, 식물, 문화유산 등 라틴 아메리카 문화의 7가지 핵심 범주에 걸쳐 구조화된 인스턴스를 포함합니다. 또한 칠레, 멕시코, 아르헨티나 등 18개 라틴 아메리카 국가의 데이터를 포함하여 라틴 아메리카의 다양한 문화적 환경을 포괄적으로 보여줍니다. 이 데이터 세트는 위키피디아 텍스트 설명을 기반으로 구축되었으며, 데이터 품질과 문화적 적합성을 보장하기 위해 다단계 필터링 및 수동 검증 전략을 사용합니다.
데이터 필드:
- 엔티티: 엔티티 이름
- 국가: 해당 법인이 위치한 국가
- 범주: 개체 범주 (예: 음식, 전통, 공인 등)
- 난이도: 문제 난이도 (쉬움, 중간, 어려움)
- 질문: 엔티티 생성 문제와 관련하여
- 답변: 예상 답변