HyperAI초신경

드래곤의 어머니는 살아남을 것인가, 아니면 죽을 것인가? 어떤 예측 알고리즘이 더 정확할까요?

6년 전
정보
神经小兮
特色图像

미국 드라마 '왕좌의 게임'의 정보를 분석하여 데이터 관점에서 주인공들의 생존 확률을 예측했습니다. 판타지 스토리에 대한 이러한 연구 방법은 실제 생활에서의 유사한 적용 사례에도 영감을 줄 것입니다.

이 세상에는 두 종류의 사람만 있습니다. 왕좌의 게임을 보는 사람과 보지 않는 사람입니다.

여러분이 오랫동안 기다려온 왕좌의 게임이 마침내 마지막 시즌을 맞이했습니다. 울프 스타크 가문의 모토인 "겨울이 온다"가 마침내 실현되었고, 인간과 화이트 워커 사이의 전쟁이 발발하려 하고 있습니다.주인공들의 삶과 죽음을 추측해 보세요.

 이 인기 드라마는 "모든 사람은 죽는다"는 생각을 심도 있게 풀어냈으며, 복잡한 줄거리로 인해 시청자들은 결말을 간절히 기대하게 됩니다.

각 에피소드를 본 후에야 당신이 아끼는 아리아가 살아남을지, 그리고 욕망의 여왕이 아리아에게 죽을지 알 수 있나요?

이런 고통에 직면하면 언제나 참을 수 없는 사람들이 있습니다. 예를 들어,코드를 좋아하는 프로그래머들은 알고리즘을 사용하여 왕좌의 게임의 스토리를 분석하고 등장인물의 생존 확률과 철왕좌에 오를 가능성이 가장 높은 사람을 예측했습니다.

흥미로운 점은 서로 다른 알고리즘과 팀이 매우 다른 결과를 예측한다는 것입니다. 예를 들어, 뮌헨 공과대학(TUM) 팀의 알고리즘은 데이너리스가 결국 철왕좌에 오를 것이라고 예측했습니다. 반면 다른 알고리즘에 따르면 데이너리스는 겨울을 살아남지 못했습니다.

게다가 또 다른 마법의 "알고리즘"이 있습니다. 남자는 모두 죽습니다.

그렇다면 어떤 예측이 정확할까요? 각 회사마다 자체 기반이 있습니다. 그들이 어떻게 하는지 살펴보겠습니다.

머신러닝은 드래곤 마더가 끝까지 살아남을 것이라고 예측합니다.

TUM의 학생들은 컴퓨터 과학 세미나에서 흥미롭고 대담한 시도를 했습니다.데이터 과학과 머신 러닝 방법을 사용하여 Game of Thrones에 등장하는 캐릭터의 최종 생존 가능성을 예측합니다.  '왕좌의 게임' 8번째 시즌이 방영되기 전에 알고리즘은 등장인물들의 운명을 예측했습니다.

 왼쪽: 생존율 순위 오른쪽: 사망률 순위
Game of Thrones 캐릭터의 전체 목록과 자세한 예측은 다음에서 확인할 수 있습니다.
 https://got.show에서 온라인으로 구매하세요
(이미지 출처: https://got.show/)

이 결론에서,드래곤 마더는 생존 확률이 가장 높습니다(99%)그녀의 왕의 손 악마도 97%의 생존율을 가지고 있습니다. 드래곤의 어머니가 마침내 모든 주요 가문을 장악하게 된 걸까요? 교활하고 자기방어적인 브론은 93.5%로 사망 순위 1위를 차지했습니다.

이런 결과는 어디서 나온 것인가요?

TUM 팀분석 데이터는 "얼음과 불의 노래" 책, 왕좌의 게임 대사, 위키피디아 팬 커뮤니티 콘텐츠에서 수집되었습니다.예측에 사용되는 정보에는 캐릭터의 가족, 결혼 여부, 동맹 등이 포함됩니다.

그들은 수백 개의 등장인물에 대한 특징적인 데이터 세트를 추출하고 스토리 속 등장인물에 대한 정보를 꼼꼼히 조사했습니다. 성별 및 상태와 같은 데이터 외에도 메타데이터 정보도 고려됩니다. 예를 들어, 누군가가 주요 인물인지 조연인지, 위키피디아와 같은 채널에서 얼마나 자주 인용되는지 등이 있습니다.

이 데이터를 통해 알고리즘 분석을 통해 Game of Thrones의 사망률에 대한 몇 가지 추세가 밝혀졌습니다.남성은 여성보다 위험에 더 많이 노출됩니다(남성 사망률은 22%인 반면, 여성 사망률은 11%입니다.)

각 캐릭터의 운명을 예측하고 추세를 예측하기 위해 팀은 두 가지 별도 모델을 사용했습니다.첫 번째는 베이지안 추론 방법입니다., pymc3에 포함된 MCMC 방법을 사용하여 베이지안 생존 분석 모델을 훈련합니다.두 번째는 머신 러닝과 신경망을 포함합니다., Python의 Keras 프레임워크에서 수행되었습니다.

철왕좌 아니면 죽음, 최종 결정권은 누구에게 있을까?

그들의 작업은 어느 정도 효과를 가질 수도 있다. 2016년, 6번째 시즌이 방영되기 전, TUM의 같은 과목 학생들은 존 스노우의 부활을 정확하게 예측하는 알고리즘을 만들었습니다.

텍스트 분석 사용: 드래곤의 어머니는 죽을 것인가?

 
당신은 분명히 같은 호기심을 가진 사람이 한 명 이상 있을 거라고 믿어야 합니다.

또 다른 데이터 과학자, Peter Vesterberg 원작 소설의 텍스트 분석을 통해 마지막 시즌의 줄거리 방향을 예측할 수 있습니다.

피터는 줄거리의 방향이 등장인물 간의 관계에 의해 뒷받침된다고 믿는다. 그는 출간된 5권의 『얼음과 불의 노래』를 분석하여 네트워크 이론을 적용하여 등장인물 간의 관계를 계산하고, 이를 시각적으로 표현하였으며, 등장인물의 중요도에 따른 최종 생존율을 판단하였다.

그는 점을 사용하여 등장인물을 표현했고, 얼음과 불 이야기의 텍스트를 바탕으로 품사 태깅과 유사도 측정과 같은 방법을 사용하여 등장인물 간의 "친밀도" 정도를 정의했습니다. 두 이름이 더 가깝고 자주 등장할수록 두 이름은 더 긴밀하게 연관되어 있습니다.

역할과 다른 역할의 관련성을 판단하는 방법은 주로 네 가지 핵심 개념을 사용합니다.

  • 연결 중심성 - 전체 노드 수에 대한 노드에 직접 연결된 노드의 비율입니다.
  • 근접 중심성 - 노드가 다른 노드에 가까울수록 중심성이 높아집니다.
  • 중간 중심성 – 노드가 다른 두 노드 사이의 가장 짧은 경로에 대한 다리 역할을 하는 횟수를 정량화합니다.
  • 고유 벡터 중심성 - 노드의 중요도는 이웃 노드의 수와 이웃 노드의 중요도에 따라 달라집니다.

이러한 개념의 분석을 통해 우리는 다음을 얻을 수 있습니다.관계 값의 "가중치" 숫자. 최종 결과는 캐릭터 관계의 지도인데, 선의 두께는 캐릭터가 얼마나 밀접하게 연결되어 있는지를 나타내고 최종 노드의 크기는 캐릭터의 중요성을 나타냅니다. 이 중요도 지수는 작성자에 의해 '제거'될 가능성도 보여줍니다.

구체적인 지표 순위는 다음과 같습니다.

존은 4가지 분석 지표의 순위에서 선두를 달리고 있습니다.

이런 분석에 따르면, 존 스노우는 의심할 여지 없이 가장 중요한 캐릭터입니다. 드래곤 가문에서 태어나 늑대 가문에서 자란 이 의심스러운 RMB 플레이어가 결국 철왕좌에 오를 수 있을까요? 그 다음으로 중요한 인물로는 정보를 담당하는 작은 악마와 왕을 죽이는 자 제이미가 있습니다.

네트워크 이론의 관점에서 볼 때, 드래곤의 어머니 데이너리스는 초기 단계에 너무 많은 돈을 썼고, 후기 단계에는 충분한 금이 없었을 가능성이 큽니다. 그녀는 단지 관계망의 가장자리에 있을 뿐이며, 그녀가 파멸할 가능성이 매우 높아 보입니다.

예측은 단순히 오락을 위한 것이 아니라 실제적인 의미도 가지고 있습니다.

우리는 서로 다른 결과를 내는 여러 알고리즘 중에서 어떤 알고리즘이 더 나은지 알 수 없습니다. 아마도 피날레가 나와야 알 수 있을 거예요. 하지만 그들이 사용하는 방법은 단순히 재미를 위한 것이 아니라 실질적인 가치가 있습니다.

TUM이 개발한 생존 확률 알고리즘은 심각한 학습 프로젝트에서 나왔습니다. 이 과정을 설립하는 주요 목적은 다음과 같습니다.학생들은 지능형 컴퓨터 시스템을 설계, 개발, 배포하는 방법을 배웁니다. 

이 프로젝트의 수석 책임자인 가이 야흐다브 박사는 "왕좌의 게임 등장인물의 생존 가능성을 예측하는 데는 판타지 세계의 데이터가 필요하지만, 현실 세계에서 똑같은 AI 기술을 사용하면 우리의 일상 생활에 상당한 영향을 미칠 수 있다"고 말했습니다.

 Guy Yachdav 박사는 TED 강연에서 예측 알고리즘이 실제 문제를 어떻게 해결할 수 있는지 설명합니다.

"열정과 교육의 결합은 새로운 도구를 만드는 훌륭한 방법입니다. TUM에서 진행하는 강좌에서 우리는 학생들에게 이 기술의 사용법을 가르치는 흥미로운 방법들을 발견했습니다."라고 TUM 정보학과 학과장인 부르크하르트 로스트 교수는 말했습니다.

현재 현실 세계에서는비슷한 알고리즘이 의학과 금융 분야에서도 사용될 수 있습니다. 예를 들어, 결합된 정보 분석을 사용하여 건강 결과를 예측할 수 있습니다. 이 기술은 암 환자의 치료나 합병증의 효과를 분석하는 것과 비슷합니다. 

데이터 과학자 피터는 캐릭터의 생존을 분석하는 것 외에도 디지털 관점에서 "얼음과 불의 노래" 소설의 다양한 글쓰기 규칙을 분석하고, 데이터를 사용하여 소설의 요소를 분석했습니다.

아마도 이 패턴을 익힌 후에는미래에는 소설가와 시나리오 작가가 인공지능을 사용하여 새로운 콘텐츠를 빠르게 제작할 수 있게 될 것입니다.이렇게 하면, 당신은 마틴이 자신의 실수를 만회하는 모습을 보지 않아도 될 겁니다.

어벤져스에서 살아남을 영웅이 누구인지 예측하고 싶으신가요?

활기찬 4월은 또다시 끝나가는 계절인 듯합니다. 왕좌의 게임 마지막 시즌 외에도 어벤져스도 다음 주 수요일에 피날레를 선보일 예정입니다. 저는 많은 사람들이 타노스의 손가락 튕김에서 아직 벗어나지 못했을 것이라고 생각합니다. 그 무자비한 남자는 조용하고 무작위로 일몰을 지켜보며 우주의 절반을 파괴했습니다.

아마 AI조차도 이런 임의의 사망률을 예측할 수는 없을 겁니다. 하지만 여전히 너무 궁금해서 직접 시도해 보고 싶다면 TUM 팀의 프로젝트 오픈소스 주소는 다음과 같습니다.

https://api.got.show/doc/

하지만 실제로는 AI 예측이 필요하지 않습니다. 어벤져스 4도 최고의 엔딩이 될 겁니다. 결국, 닥터 스트레인지는 철저한 방법, 즉 시행착오적인 방법을 사용해 어벤져스 세계에 희망을 남겼습니다. 그는 타임 스톤을 사용해 14,000,605가지 가능성을 시도하고 승리로 이어질 유일한 가능성을 선택했습니다.

닥터 스트레인지의 정신은 아마도 코드를 쓰는 데 적합할 것입니다.

원본 기사를 읽으려면 클릭하세요