HyperAI초신경

후산 가족의 인공지능이 등장했다

6년 전
정보
Dao Wei
特色图像

마이크로소프트는 마작을 플레이하기 위한 AI 모델을 출시했는데, 이 모델은 프로 경쟁 플랫폼에서 최고 수준에 도달하는 데 성공했습니다. 전국적으로, 심지어 전 세계적으로 인기 있는 이 엔터테인먼트 활동에서 AI 마작신의 탄생은 어떤 어려움을 극복했으며, 이 기술 탄생의 더 깊은 의미는 무엇일까요?

마이크로소프트는 최근 개최된 세계 인공지능 컨퍼런스에서 "AI 마작의 신" Suphx를 선보였는데, 이 AI 마작의 신은 프로 마작 경쟁 플랫폼에서 최상위 인간 플레이어의 평균 수준을 뛰어넘었습니다.

Suphx의 정식 명칭은 Super Phoenix이며, 2019년 3월 일본의 프로 마작 경연 플랫폼 "Tenho"에 출시되었습니다.

Microsoft의 글로벌 부사장인 Harry Shum이 현장에서 Suphx를 소개했습니다.

가장 잘 알려진 마작 플랫폼에서 AI가 참여할 수 있는 오픈 경쟁 "스페셜 룸"에서 Suphx는 인간 플레이어와 함께 5,000회 이상의 4인 마작 게임을 플레이하면서 점차 자신의 힘과 수준을 보여주었습니다.

6월에는 수프크스가 특별실의 최고 계급인 10위에 올랐습니다. 수프크스가 11번째 랭크인 '천풍랭크'에 도달하지 못한 이유는 해당 플랫폼이 AI 시스템이 전투를 위해 최고 레벨의 방에 들어가는 것을 허용하지 않았기 때문입니다.

2006년 천풍 플랫폼이 출시된 이래로 4인 마작에서 10레벨에 도달한 플레이어는 약 180명인 반면, 10레벨에 도달한 활동적인 인간 플레이어는 12명 정도에 불과합니다. 하지만 힘의 수준을 측정하는 안정된 랭크 측면에서 볼 때, 수픽스는 8.7에 도달했는데, 이는 인간 10단 선수의 7.4보다 훨씬 높은 수치입니다.

Suphx는 Tianfeng 플랫폼의 모든 AI 중 가장 높은 수준입니다.

이전에 Tianfeng 플랫폼에서 활동 중인 마작 AI 시스템은 두 가지가 있었는데, 도쿄 대학이 2015년에 출시한 "Blast"와 Dwango가 2018년에 출시한 "NAGA25"였습니다. 하지만 두 시스템 모두 안정적인 순위가 6.5 미만이었으며 Suphx에 크게 뒤처졌습니다.

천년의 역사를 가진 마작: 천천히 진화하는 대중적 여가 활동

마작은 '마작' 또는 '참새 카드'라고도 불리며, 정통 중국 게임입니다.

마작의 기원에 대해서는 다양한 이야기가 있고, 그 진실을 확인할 수는 없습니다. 하지만 확실한 것은 마작이 등장한 이래로 국민적 오락으로 대중에게 인기를 끌었으며, 오랫동안 인기를 유지해 왔다는 것입니다.

마작의 전신은 한나라의 잎 모양의 카드에서 유래되었습니다.

마작패의 상징과 제작 방식 역시 많은 변화를 겪었습니다. 가장 오래된 마작 타일대나무와 동물 뼈생산이 시작되었고, 그 이후에는 카드놀이를 하던 시기도 있었습니다.

고위 관리들은 코뿔소 뿔, 상아, 금, 은, 구리, 청화자 등을 사용하여 마작패를 만들었습니다. 그 당시 마작패는 숙련된 장인들에 의해 하나하나 조각되었습니다.

LV, 프라다, 에르메스 등 세계적인 브랜드는 모두 고급 맞춤형 마작 게임을 출시했습니다.

마작을 재료로 대량 생산할 수 있게 된 것은 1960년대 이후의 플라스틱 제품의 대중화와 기계화의 발전 덕분이었다.

하지만 생산 기술의 변화 외에도 마작에서 가장 진보된 기술은 AI 다음으로 자동 마작 기계일 것입니다.

AI는 추론으로 승리한다

AI 연구가 시작되기 전에는 많은 사람들이 마작에서 운이 결정적인 요소라고 믿었습니다. 하지만 사실 마작의 경쟁 규칙은 실제로 매우 복잡한 문제입니다.

마작패 136개순열과 조합의 가능한 결과는 다양합니다.같은 플레이어가 카드를 두 번 내는 사이에 다른 세 명의 플레이어가 카드를 내기도 하고, 자신의 카드도 뽑기도 합니다. 또한, '치', '펭', '갱'은 게임 속에서 역동적인 변화를 일으킬 것입니다.

둘째, 이것은불완전 정보 문제. 각 플레이어는 자신이 가진 13장의 카드와 플레이된 카드만 알고 있으며, 다른 사람의 카드와 남은 홀 카드는 알 수 없습니다. 이런 숨겨진 정보로 인해 많은 변수가 생겨납니다.

여러 카드 게임의 복잡성 비교

경험이 많은 플레이어라도알려진 카드와 최상의 플레이 사이의 논리적 관계를 명확히 하세요숨겨진 정보가 많을수록 게임의 복잡성은 더욱 커집니다.

이를 위해서는 프로세스 전반에 걸쳐 좋은 전략적 계획이 필요합니다. 예를 들어, 상황이 불리할 때 전략적으로 "네 번째 플레이어가 이기게 하세요"라고 하면 총점에서 두 번째 플레이어에게 밀리는 것을 막을 수 있습니다.

따라서 전문적인 마작 AI를 구축하려면 강력한 컴퓨팅 성능만으로는 충분하지 않습니다. 더욱 필요한 것은 AI가직관, 예측, 추론그리고퍼지 의사 결정능력.

심층 강화 학습을 통해 위대한 마작 선수가 되다

위의 어려움을 해결하기 위해 Microsoft는 심층 강화 학습을 사용하여 Suphx를 만들었고, 최신 알고리즘을 통해 학습과 디버깅을 거쳐 점차 경쟁 마작에서 가장 강한 마작 플레이어가 되었습니다.

Suphx가 이렇게 했습니다

첫 번째는 "초기화" 단계입니다. 연구자들은 "천풍" 플랫폼의 공개 데이터를 활용하여지도 학습초기 모델을 얻고, 모델을 기반으로 셀프 게임을 사용하여 강화 학습 훈련을 수행합니다.

그 후,불완전 정보 게임이러한 과제를 해결하기 위해 Suphx는 강화 학습의 효과를 높이기 위해 혁신적인 예언자 코칭 기술을 시도했습니다.

학습 단계에서는 눈에 보이지 않는 숨겨진 정보를 활용하여 AI 모델의 학습 방향을 안내하고, 학습 경로를 더욱 명확하게 만들어 완벽한 정보라는 의미에서 최적의 경로에 더욱 가깝게 만듭니다. 이를 통해 AI 모델은 눈에 보이는 정보를 심층적으로 이해하고 이를 통해 효과적인 전략을 찾을 수 있습니다.

AI가 상대방의 최대 이득을 최소화하기를 바라는 고전적인 검색 트리 구조는 마작 게임에 적합하지 않습니다.

또한 복잡한 마작 카드 표현과 득점 메커니즘의 경우, 전체 예측 기술을 사용하여 각 경쟁 라운드와 8라운드 후의 최종 결과 사이에 연결 고리를 구축합니다.

독창적인 디자인을 통해예언자, 모델은 각 라운드의 게임이 최종 결과에 미치는 영향을 이해할 수 있으므로글로벌 의사결정 관점.

연구팀은 또한 게임의 진행을 동적으로 제어할 수 있는 새로운 메커니즘을 도입하여 Suphx가 추론 단계에서 최신 정보를 기반으로 전략을 조정하고 적응형 결정을 내릴 수 있도록 했습니다.

마지막 단계는 실제 전투에 참여하는 것입니다. 즉, 인간 플레이어가 하는 게임에 지속적으로 참여하여 AI가 지속적으로 학습하고 기술을 향상시킬 수 있도록 하는 것입니다.

이 라운드에서 Suphx는 게임에서 승리했을 뿐만 아니라, 빅3에서도 승리했습니다.

Suphx는 3월에 Tianfeng 플랫폼에 진입한 이후 끊임없이 발전해 왔습니다. 현재 Suphx는 공격과 방어의 균형을 맞추고, 단기적 손실과 장기적 이익 간의 균형을 전략적으로 맞추고, 모호한 정보를 바탕으로 신속한 결정을 내리는 등 최고의 인간 플레이어보다 더 똑똑한 전략을 수립할 수 있습니다.

마작 AI: 단순히 승패를 가르는 것 이상

새로운 알고리즘과 훈련 기술 덕분에 Suphx는 플레이 방법과 스타일 면에서 독보적입니다.

Tianfeng 플랫폼의 최고 인간 플레이어는 소셜 미디어에서 Suphx를 칭찬했습니다. 그는 수프스의 경기를 많이 보았고, 전에 본 적이 없는 많은 기술을 배웠다고 느꼈습니다.

또한 많은 플레이어들은 수픽스와의 경기에서 실질적인 격투 기술을 배웠다고 말하며, 그를 "마작 교과서", "수픽스 선생님"이라고 불렀습니다.

136타일 마작이 가져온 기술적 깨달음

마작에서 승패를 가르는 것은, 일반인이 행운과 경험에서 오는 짜릿함을 즐기는 반면, 고수들은 지성의 경쟁을 즐긴다.

이러한 "마작의 신" AI는 무적의 마작 코치를 만드는 것 외에도 데이터 알고리즘 차원에서 이러한 엔터테인먼트를 분석할 수 있는 새로운 관점을 열어줄 수도 있습니다.

더 이상 도박꾼처럼 운에 의지하지 않고, 두뇌의 힘에 의지하여 점차 무작위적이고 불확실한 것들을 버리고 승리를 위한 일련의 규칙을 탐구합니다.

이것이 바로 AI 개발의 길에서 가장 매혹적인 희망의 빛이 아닐까요?

콘텐츠 참조: Microsoft Research AI 헤드라인 "Microsoft Super Mahjong AI Suphx, 불완전한 정보 게임 깨기" (https://mp.weixin.qq.com/s/S-axCx41WKDJG2BiGGTZfg)