HyperAI초신경
Back to Headlines

LAION과 인텔이 개발한 AI 도구, 40가지 감정 강도 분석 가능

4일 전

LAION과 인텔이 AI 시스템의 인간 감정 이해력을 향상시키는 도구를 소개했습니다. 이 "동정적 통찰(Empathic Insight)" 패키지는 얼굴 이미지나 오디오 파일을 분석하여 40가지 감정의 강도를 평가하도록 설계된 모델과 데이터셋을 포함하고 있습니다. 얼굴 이미지의 경우, 감정은 0에서 7의 척도로 점수가 매겨지고, 음성의 경우 감정이 나타나지 않거나 약간 또는 강하게 나타난다고 표시됩니다. Empathic Insight 모델의 핵심은 EmoNet입니다. 이 모델은 심리학의 중요한 참고 자료인 "감정 핸드북(Handbook of Emotions)"에서 유래한 40가지 감정 범주를 기반으로 합니다. 연구팀은 기본적인 감정 목록을 확장하여 집중력, 혼란 등의 인지 상태, 고통, 피로 등의 신체 상태, 수치심, 자부심 등의 사회적 감정을 추가했습니다. 연구팀은 감정이 보편적으로 해독 가능한 것이 아니라 뇌가 다양한 신호를 통해 구성된다고 주장합니다. 따라서 이 모델들은 확실한 라벨이 아닌 확률 추정치를 사용합니다. 모델을 훈련시키기 위해, 연구팀은 20만 3,000개 이상의 얼굴 이미지와 4,692개의 오디오 샘플을 사용했습니다. 음성 데이터는 영어, 독일어, 스페인어, 프랑스어로 5,000시간 이상의 합성 녹음을 포함하고 있으며, OpenAI의 GPT-4o 오디오 모델을 사용해 생성되었습니다. LAION은 개인 정보 문제를 피하고 인구 통계학적 다양성을 개선하기 위해 완전히 합성 데이터에 의존했습니다. 얼굴 이미지는 Midjourney와 Flux 같은 텍스트-이미지 모델로 생성되었으며, 나이, 성별, 인종 등을 프로그래밍적으로 변형시켰습니다. 모든 오디오 샘플은 심리학 전문가들이 검토했으며, 세 명의 독립 리뷰어가 동의한 평가만 데이터셋에 포함되었습니다. LAION에 따르면, Empathic Insight 모델은 기존 경쟁자들보다 벤치마크에서 더 우수한 성능을 보였습니다. EmoNet Face HQ 벤치마크에서 Empathic Insight Face 모델은 Gemini 2.5 Pro나 Hume AI와 같은 클로즈 소스 API보다 심리학 전문가들의 평가와 더 높은 상관관계를 보였습니다. 주요 지표는 AI의 평가가 심리학 전문가들의 평가와 얼마나 일치하는지를 측정한 것입니다. EmoNet의 평가는 심리학 전문가의 평가와 최대 40%의 일치율을 보였으며, 표준 VLM은 25-30%, 랜덤 베이스라인은 거의 0%의 일치율을 보였습니다. 연구팀은 또한 음성 감정 인식에서도 좋은 결과를 보고했습니다. Empathic Insight Voice 모델은 EmoNet Voice 벤치마크에서 기존 오디오 모델보다 우수한 성능을 발휘하며, 40가지 감정 범주 모두를 정확히 식별했습니다. 팀은 다양한 모델 크기와 오디오 처리 방법을 실험하여 결과를 최적화했습니다. 더 나아가, LAION은 BUD-E Whisper라는 OpenAI의 Whisper 모델의 업그레이드 버전을 개발했습니다. Whisper는 음성을 텍스트로 전사하지만, BUD-E Whisper는 감정의 톤을 구조화된 설명으로 추가하고, 웃음이나 한숨 등의 목소리 반응을 감지하며, 연령과 성별 같은 화자의 특성을 추정합니다. 모든 EmoNet 모델은 Creative Commons 라이선스(모델)와 Apache 2.0 라이선스(코드) 하에 제공되며, Hugging Face에서 다운로드할 수 있습니다. Empathic Insight 모델은 "Small"과 "Large" 버전으로 제공되어 다양한 용도와 하드웨어 요구 사항에 맞춰 사용할 수 있습니다. 인텔은 2021년부터 이 프로젝트를 지원해 왔으며, 특히 인텔 하드웨어에 최적화된 모델 개발에 집중하고 있습니다. 업계 전문가들은 LAION과 인텔이 공동으로 개발한 Empathic Insight 모델이 인간 감정을 더욱 정밀하게 이해하고 표현할 수 있다는 점에서 큰 의미를 두고 있습니다. 이 모델들이 활용되면, AI 시스템은 사용자의 감정 상태를 더 잘 파악하여 맞춤형 서비스를 제공하거나, 디지털 어시스턴트가 더 자연스럽게 대화할 수 있을 것으로 기대됩니다. LAION은 인공 지능 분야에서의 개방성과 혁신을 추구하는 비영리 조직으로, 이 프로젝트는 그들의 목표를 잘 반영하고 있습니다. 인텔은 이러한 협력을 통해 자사 하드웨어의 AI 성능을 더욱 강화할 계획입니다.

Related Links