HyperAI초신경

AI에게 카드와 게임을 가르치는 것은 단순히 인간을 이기는 것만이 아닙니다.

6년 전
헤드라인
神经小兮
特色图像

어제 DeepMind는 자사의 AI인 AlphaStar가 유럽 서버에 출시될 것이라고 발표했습니다. AlphaStar는 StarCraft 2 래더에서 익명으로 인간 플레이어와 경쟁하게 됩니다. 오늘, 페이스북과 CMU가 개발한 AI 도박사인 플러리버스가 6인 텍사스 홀덤 게임에서 최고의 인간 플레이어를 이겼다는 소식이 다시 한번 뉴스를 장식했습니다. AI는 게임 경쟁에서 점점 더 나은 성과를 보이고 있지만, 우리는 AI가 게임에서 인간을 이길 수 있도록 끊임없이 훈련시키고 있습니다. 궁극적인 목적과 의미는 무엇인가?

어제 DeepMind는 자사의 AI를 발표했습니다. AlphaStar는 곧 유럽 서버에서 이용 가능하며, StarCraft 2의 래더에서 익명으로 인간 플레이어와 경쟁하게 됩니다.오늘 Facebook과 CMU는 공동으로 개발했습니다. AI 도박의 신 플러리부스 6명의 플레이어가 참가한 텍사스 홀덤 토너먼트에서 최고의 인간 플레이어를 물리쳤습니다.

AI가 보드 게임에 왜 항상 관심을 갖는 걸까요? 그리고 AI 팀은 왜 게임과 보드 대회에서 우승하기 위해 그렇게 열심히 노력하는 걸까요?

가장 복잡한 전략 게임인 '스타크래프트2'부터 시작해볼까요?

스타크래프트는 블리자드 엔터테인먼트에서 1998년에 출시되었으며, 후속작인 스타크래프트 2는 2010년에 출시되었습니다.가장 어렵고 하드코어한 실시간 전략 게임, 다양한 게임이 AI에 의해 정복되었지만, AI가 마스터하기에는 상대적으로 어려운 유형의 게임입니다.

이 게임에서는 조감도를 활용해 전장에서 군대에 명령을 내립니다. 플레이어는 자원을 모아 건물을 짓고, 군대를 편성하고, 업그레이드한 후 다른 플레이어와 싸웁니다.

승리하려면 플레이어는 여러 요소를 신중하게 균형 있게 조절하고 처리해야 하며, 시기적절한 계획과 대응 전략을 수립해야 합니다. 전략에만 의존하는 체스 게임과는 달리, AI는 이 게임에서 좋은 성적을 거두려면 불완전한 정보 처리, 장기 계획 수립, 시기적절한 전략 학습 등 여러 가지 과제에 직면해야 합니다.

하지만 작년 12월, 이 상황은 급격하게 바뀌었습니다. 인간과 알파스타 간의 스타크래프트2 11차전에서 AI는 10:1이라는 압도적인 점수로 승리했습니다.이 시점에서 AI는 스타크래프트 게임에 강한 영향을 미쳤습니다.

AlphaStar의 동작은 다음에 의해 결정됩니다.딥 뉴럴 네트워크신경망은 게임 인터페이스(유닛과 그 속성 목록)로부터 입력 데이터를 받고 게임 내 동작을 구성하는 일련의 명령을 출력합니다.

불완전한 정보에 따르면, 게임은 일반적으로 최대 1시간 동안 진행되고 수천 번의 움직임이 필요합니다. StarCraft의 각 프레임은 입력 단계로 사용됩니다.신경망은 각 프레임의 나머지 부분에 대한 예상되는 동작 순서를 예측한 다음 가장 좋은 동작을 취합니다.

Alphastar와 인간 프로 플레이어 비교: 관찰과 행동 사이의 총 지연은 차이를 보여줍니다.

DeepMind는 AlphaStar가 게임에서 성공한 것은 우수한 클릭률이나 빠른 반응 시간 때문이 아니라 실제로 뛰어난 거시적, 미시적 전략적 결정 덕분이라고 설명했습니다.

이 기술은 번역, 언어 모델링, 시각적 표현 등 장기 시퀀스와 대규모 출력 공간을 모델링하는 것을 포함하여 머신 러닝 연구의 여러 다른 과제에도 도움이 될 수 있습니다.

AI가 보드 게임을 장악했다

  • 1997년, 컴퓨터 프로그램 "딥블루"가 당시 세계 최고의 체스 선수를 물리쳤는데, 이는 AI가 인간 게이머를 이긴 최초의 사례로 기록되었습니다.
  • 2017년 5월, 성장하던 알파고는 당시 세계 최고의 바둑 기사였던 커제에게 3:0으로 승리했습니다. 그리고 불과 5개월 후, DeepMind는 새로운 알고리즘 변형을 발표했습니다. 알파고 제로, 알파고를 100 대 0으로 이길 수 있었습니다.
  • 2018년 말, 우버 AI 연구소는 강화 학습 알고리즘을 사용했습니다. 탐험하기,존재하다 몬테주마의 복수점수는 200만을 넘었고, 평균 점수는 40만점이 넘으며, 아타리 게임 역사상 가장 강력한 클리어런스 알고리즘으로 알려져 있습니다.
  • 오픈AI 파이브  첫째, 우리는 5개의 신경망을 사용합니다. 오픈AI 파이브  아마추어 Dota 2 플레이어 팀을 물리치세요. 2019년 4월, 그들은 Dota2 International Invitational에서 세계 챔피언 OG 팀을 2:0으로 이겼습니다.
Dota2가 OpenAI에 완전히 인수된 것 같습니다.
  • 그러다 최근 페이스북과 CMU가 공동으로 개발한 텍사스 홀덤 포커 신 AI가 등장했습니다. 플루아르 자형아이버스6인 게임에서 최고의 텍사스 홀덤 플레이어를 이기는 경우 평균적으로 거의천 달러.

이 팀은 텍사스 홀덤 도박 AI를 훈련하는 데 일주일도 걸리지 않았습니다.

Pluribus는 또한 게임 중에 허세를 부리며 인간 플레이어를 속입니다.

인간은 여러 복잡한 e스포츠 게임에서 최고의 인간 플레이어를 물리친 수많은 AI를 개발했고, 이로 인해 인간은 두려움에 떨게 되었습니다.

하지만 AI가 게임을 하는 것은 단지 재미 때문일까요?먼저 인류를 물리치고, 그 다음에 인류를 섬겨라

이러한 AI 회사들은 바둑, e스포츠, 포커 등의 알고리즘을 가르치기 위해 많은 노력을 기울였으며, 그들의 태도는 매우 진지하다고 할 수 있습니다.

OpenAI는 심지어 체육관과 우주  누구나 이 플랫폼을 사용하여 컴퓨터에게 게임 방법을 가르칠 수 있는 오픈 소스 플랫폼입니다. Gym은 Atari, Flappy Bird, Snake 등의 작은 게임을 플레이하는 데 사용되고, Universe는 GTA5나 레이싱 등의 대형 3D 게임을 플레이하는 데 사용됩니다.

OpenAI Gym은 1,000개 이상의 게임을 대중에게 공개했습니다.

그들은 오락을 위해 게임을 하는 데 엄청난 양의 에너지와 재정적 자원을 소비합니까? 아니면 AI가 인간을 이기는 것이 그들에게 큰 성취감을 주는 것일까? 아니요. AI 연구자들에게 게임은 단지 방법일 뿐, 목표가 아닙니다.

  게임 환경:AI 전반의 발전을 위한 가속기입니다. 

게임은 AI를 테스트하기에 완벽한 플랫폼입니다.게임은 처리하기 쉬운 데이터, 고정된 규칙, 다양한 가상 전략을 갖추고 있습니다. 게임은 시뮬레이션된 시나리오이므로 인공지능 연구 및 개발에 이상적인 장소입니다.

스타크래프트와 같은 게임에는 복잡한 전략과 데이터가 있습니다.

뉴욕대학교 게임연구센터의 줄리안 토겔리우스 준교수는 "게임을 통해 학습한 내용을 실제 세계로 옮기는 사례를 많이 보지 못했다"고 말했다. "하지만 우리는 게임을 플레이하기 위해 발명된 방법이 현실 세계로 옮겨지는 것을 보았습니다."

  게임 AI: 인간 플레이어를 위한 최고의 스승이자 상대 

한편, AI는 더욱 완벽한 전략을 발견하고 인간 플레이어의 경쟁 기술을 향상시키는 데 도움이 될 수 있습니다. 커제 씨는 알파고와의 경기가 자신의 사고방식을 열어주고 바둑 실력을 향상시켰다고 믿는다.

반면, AI의 개입으로 많은 게임에서 더욱 똑똑한 상대가 탄생하게 될 것입니다. 조정된 AI는 인간 선수의 코치 역할을 할 뿐만 아니라, 다양한 선수의 수준에 맞춰 적응해 그들과 경기를 펼칠 수도 있습니다.

또한, 오늘날의 게임에서 인간 플레이어끼리 서로 화를 내는 것도 방지할 수 있습니다. 만약 당신 맞은편에 불교 AI가 있다면, 확실히 더욱 문명화된 게임 환경을 유지할 것입니다.  게임은 단지 시작일 뿐입니다. 해야 할 일이 많습니다. 

DeepMind의 CEO인 데미스 하사비스는 "DeepMind의 목표는 단순히 게임에서 이기는 것이 아니라, 게임을 즐기면서 영감을 얻는 것입니다."라고 말했습니다.

AI 연구자들이 가장 좋아하는 게임은 슈퍼마리오라고 합니다.

"하지만 개인적으로는 게임하는 걸 좋아하고, 컴퓨터 게임도 개발해 봤어요. 하지만 어떤 면에서는 게임들이 다 테스트베드라고 할 수 있죠. 알고리즘을 작성하고 테스트해 보는 거죠.궁극적으로 우리는 이 기술을 적용하여 실제 문제를 해결하고자 합니다."

미래에는 알파고와 알파스타가 게임 속 영웅을 조종하는 AI 플레이어의 이름에 그치지 않을 것이고, 딥마인드도 게임 문제를 푸는 데만 국한되지 않을 것입니다. 그들은 인간 사회의 AI 영웅이 될 것이다.

-- 위에--

원본 기사를 읽으려면 클릭하세요