AI 평가 플랫폼 LMArena, 구글 '나노 바나나'로 인해 10배 성장하며 실용성 기반 AI 평가의 중심지로 부상
6일 전
AI 평가 플랫폼 LMArena의 CTO인 위린 창은 최근 구글의 신규 이미지 생성 모델 'Nano Banana'가 실시간 사용자 투표에서 1위를 기록한 배경을 설명하며, 이 모델이 구글의 Gemini 2.5 Flash임을 확인했다고 밝혔다. LMArena는 2023년 UC 버클리 연구진이 시작한 챗봇 대결 플랫폼으로, 사용자가 다양한 AI 모델을 테스트하고 투표를 통해 성능을 비교하는 커뮤니티 기반 평가 시스템이다. 지난 8월 Nano Banana의 폭발적 인기로 월간 방문자 수가 10배 증가했으며, 현재 월 300만 명 이상이 이용 중이다. 창은 "모델 간 성능 차이를 실질적인 사용 사례 기반으로 평가하는 것이 중요하다"며, 기존 벤치마크의 한계를 넘어서는 실용 중심의 평가 체계 구축을 강조했다. 현재는 코딩, 창의적 글쓰기, 이미지 생성 등 다양한 분야에서 클로드, 지니, GPT 시리즈 등이 상위를 차지하고 있으며, 특히 지니는 시각 인식 및 이미지 편집 분야에서 높은 평가를 받고 있다. 창은 메타의 '초지능 랩'이 다중 모달리티를 통합한 '옴니 모델' 개발을 추진 중이라며, 산업 전반에 걸친 AI 활용 사례를 확대하기 위해 법률, 의료, 교육 분야의 모델 한계를 분석하는 데 주력하고 있다고 전했다. 또한, 기업들이 LMArena에 모델을 공개하는 목적은 단순 노출이 아니라 사용자 기반 피드백을 통해 모델을 개선하는 데 있다고 설명하며, 공개된 데이터와 코드를 통해 공동 연구를 촉진하고 있다.
Related Links
Business Insider