HyperAI초신경
Back to Headlines

구글 AI 젬니, 포켓몬 게임에서 패닉 상태 발생

9일 전

구글의 AI 모델 제미니가 포켓몬 게임에서 패닉 상태에 빠졌습니다. 최근 구글과 앤트로픽 두 회사는 최신 AI 모델들이 25년 이상 된 초기 포켓몬 게임을 어떻게 진행하는지 연구하고 있습니다. 이 연구는 때때로 유쾌하면서도 깊은 통찰력을 제공하는데, 이번에는 구글 딥마인드가 보고서에서 제미니 2.5 프로가 포켓몬이 죽을 위기에 처했을 때 패닉에 빠진다고 밝혔습니다. 이 상태는 AI의 판단 능력이 "질적으로 관찰 가능한 저하"를 경험하게 만들기도 합니다. AI 벤치마크링, 즉 다양한 AI 모델의 성능을 비교하는 과정은 종종 실제 모델의 능력에 대한 충분한 문맥을 제공하지 못하지만, 일부 연구원들은 AI 모델이 비디오 게임을 하는 모습을 관찰하는 것이 유용하다고 생각합니다. 지난 몇 개월 동안, 구글이나 앤트로픽과 관련이 없는 두 개발자가 각각 "제미니 플레이 포켓몬"과 "클로드 플레이 포켓몬"이라는 이름의 트위치 스트림을 시작했습니다. 여기에서는 누구나 실시간으로 AI가 오래된 어린이 비디오 게임을 진행하는 모습을 볼 수 있습니다. 스트림은 AI의 "사고 과정"을 표시하며, 이는 AI가 문제를 평가하고 답변을 도출하는 방식의 자연어 번역입니다. 이 과정을 통해 AI 모델이 어떻게 작동하는지 이해할 수 있습니다. 그러나 제미니 2.5 프로의 진행 속도는 아직 인간 어린이보다 느리며, 게임 완료까지 수백 시간이 걸릴 정도입니다. 관심을 끄는 점은 AI가 게임을 얼마나 빨리 완료했는지보다, 그 과정에서 어떤 행동을 하는지를 관찰하는 것입니다. 보고서에 따르면, 제미니 2.5 프로는 게임 중 다양한 상황에서 패닉 상태에 빠집니다. 이 상태에서 AI는 갑자기 특정 도구들을 사용하지 않거나, 인간이 스트레스를 받았을 때 잘못된 판단을 내리는 것처럼 행동합니다. 이러한 반응은 흥미롭지만 동시에 불편한 느낌을 줍니다. 트위치 채팅방의 이용자들은 이 패닉 상태가 발생할 때마다 이를 적극적으로 주목하고 있습니다. 한편, 클로드 AI도 칸토 지역을 탐험하면서 독특한 행동을 보였습니다. 클로드는 모든 포켓몬이 체력을 잃으면 플레이어 캐릭터가 "화이트 아웃"하여 가장 가까운 포켓몬 센터로 돌아가는 패턴을 파악했습니다. 그러나 클로드는 한때 문산 동굴에서 막혀 있을 때, 모든 포켓몬을 기절시키면 다음 마을의 포켓몬 센터로 이동될 것이라고 잘못 추측했습니다. 이는 게임의 실제 메커니즘과 달랐으며, 시청자들은 AI가 게임에서 스스로를 죽이는 모습을 놀라움과 함께 지켜봐야 했습니다. 그럼에도 불구하고, AI는 인간 플레이어보다 우수한 면도 있습니다. 제미니 2.5 프로는 포켓몬 게임의 바우더 퍼즐을 해결하는 데 뛰어난 정확성을 보여주며, 일부 인간의 도움으로 특정 작업을 위한 에이전틱 도구를 생성했습니다. "바우더 물리학에 대한 설명과 유효한 경로를 확인하는 방법만으로 제미니 2.5 프로는 복잡한 바우더 퍼즐을 단번에 해결할 수 있다"고 보고서는 밝혔습니다. 구글은 제미니 2.5 프로가 이러한 도구를 인간의 개입 없이 스스로 생성할 수 있는 능력을 갖추었을 가능성을 제기합니다. 미래에는 AI가 스스로 "패닉하지 않는" 모듈을 개발할 수도 있다는 기대가 있습니다. 이러한 연구 결과는 AI의 성능과 한계를 보다 명확히 이해하는 데 도움을 줍니다. AI가 비디오 게임을 통해 인간의 의사결정 과정을 모방하면서도 고유한 해결책을 찾는 능력을 보여주므로, 이는 AI 발전의 중요한 단서가 될 수 있습니다. 구글과 앤트로픽은 이러한 연구를 통해 AI 모델의 성능을 개선하고, 더욱 인간다운 행동을 표현할 수 있도록 노력하고 있습니다. 업계 전문가들은 AI가 비디오 게임을 통해 어떻게 행동하는지를 관찰하는 것이 AI의 실제 성능을 평가하는 데 유용할 수 있다고 평가합니다. 구글 딥마인드는 AI 연구의 선두주자로 알려져 있으며, 이러한 실험을 통해 AI의 행동 패턴과 문제 해결 능력을 분석하고 있습니다. 앤트로픽도 비슷한 연구를 진행하고 있어, 두 회사의 경쟁은 더욱 치열해지고 있습니다.

Related Links