OpenAI의 GPT-5 라이브스트림서 그래프 오류 논란…CEO까지 나서 "대규모 실수" 인정
2일 전
OpenAI가 GPT-5 라이브 스트리밍 중 일부 그래프에 오류를 내보내며 논란에 휩싸였다. 특히 '모델 간 위선 평가(deception evals)'를 비교하는 차트에서 GPT-5의 코딩 위선률이 50.0%로 표시됐지만, 이를 비교한 o3 모델은 47.4%로 낮은 수치임에도 더 큰 막대그래프로 표현돼 오류가 명확했다. 또 다른 차트에서는 GPT-5의 점수가 o3보다 낮은데도 더 큰 막대를 사용했고, o3와 GPT-4o의 점수는 다르지만 동일한 크기의 막대를 사용해 시각적 오해를 유발했다. 이에 대해 사무엘 올트먼 CEO는 "엄청난 차트 실수(mega chart screwup)"라고 직접 언급했고, 마케팅 담당 직원도 "의도치 않은 차트 범죄"라며 사과했다. OpenAI는 즉각적인 반응을 피했으며, 실제 그래프 제작에 GPT-5가 사용됐는지는 불분명하지만, 모델이 환각 현상을 크게 줄였다는 주장을 내세운 데 비해 이러한 실수는 신뢰도에 타격을 줬다.
Related Links
The Verge