HyperAI초신경

알파지오메트리: 딥마인드의 엄청난 컴퓨팅 파워가 다시 기적을 만들어내지만, "지능 대신 컴퓨팅 파워"가 최적의 솔루션이 아닐 수도 있다

일 년 전
정보
zhaorui
特色图像

저자: 이보주

편집자: 산양

표지 이미지 출처: Google DeepMind

딥마인드는 컴퓨팅 능력을 사용하여 기적을 창조한다? 많은 찬사를 받는 AlphaGeometry는 얼마나 가치가 있을까?

최근 구글 딥마인드의 알파 시리즈에 새로운 멤버인 알파지오메트리가 추가되었는데, 여전히 인기가 많으며, "획기적", "대단한", "인간에 가깝다" 등의 찬사가 화면을 가득 메우고 있습니다. 그렇다면 수학올림피아드에서 금메달 수준의 역량을 갖췄다고 주장하는 이 AI 시스템은 얼마나 가치가 있을까?

AlphaGeometry는 Google DeepMind 팀과 뉴욕 대학 연구진에 의해 개발되었습니다.신경 언어 모델과 기호 추론 엔진을 결합하면,인간과 비슷한 수준으로 복잡한 기하학 문제를 해결할 수 있습니다.

30개의 국제수학올림피아드(IMO) 기하 문제에 대한 벤치마크 테스트에서 AlphaGeometry는 이전에는 불가능했던 시간 내에 25개의 문제를 풀었습니다. 소타  우의 "우 방식"은 10개의 문제를 풀었지만, IMO 금메달리스트는 평균 25.9개의 문제를 풀 수 있었습니다.

실제로 알파고가 출시된 이후, 다양한 분야에서 많은 혁신적인 발전이 이루어지면서 "딥마인드 제품은 반드시 고품질이어야 한다"는 생각이 사람들의 마음속에 점차 자리 잡았습니다. 하지만 동시에 업계에는 합리적이고 변증법적인 목소리도 있습니다. 지능을 컴퓨팅 성능으로 대체하는 것은 분명 만족스럽지만, 실제 적용 가치가 더 중요하다는 것입니다. 따라서 AlphaGeometry의 출시와 함께 이것이 컴퓨팅 파워의 이점을 이용한 카니발인지 아니면 과학을 위한 AI  패스파인더.

언급할 가치가 있는 것은 다음과 같습니다.우리는 베이징대학교 지능대학 교수를 인터뷰했습니다.린 저우천, 관련 학문적 이슈를 논의하고 연구했습니다.린저우천 교수는 난카이대학, 베이징대학, 홍콩이공대학에서 수학과 응용수학을 공부한 후, 베이징대학 수학과로 돌아와 박사학위를 취득하고 인공지능 분야에 뛰어들었습니다. (린저우천 교수와의 인터뷰를 보려면 여기를 클릭하세요)

표현과 계산: 수학을 위한 AI의 두 가지 주요 과제

린저우천 교수는 이렇게 말했습니다."과거에는 수학적 정리의 '표현'과 대규모 컴퓨팅이 AI가 수학적 정리를 증명하는 데 있어 두 가지 주요 과제였습니다."

"우선, 논리적 추론에 크게 의존하는 매우 추상적인 학문인 수학이 AI를 받아들이는 첫걸음은 '표현' 문제를 해결하는 것입니다. 컴퓨터가 계산할 수 있는 방식으로 수학적 정리를 표현하는 것이 후속 AI 응용 프로그램의 기반이 됩니다."

AlphaGeometry가 목표로 하는 기하학적 문제는 비교적 쉽게 표현할 수 있습니다. 해석기하학과 대수기하학의 등장으로 기하학적 모양과 기하학적 객체 간의 관계를 수치적 값을 통해 표현할 수 있게 되었습니다.우원준"수학적 기계화"그리고 어느 정도 평면 기하학 정리와 기계어 사이에 다리를 놓았습니다."

둘째, 우원쥔(Wu Wenjun) 원장이 제안한 '우(Wu) 방법'과 그뢰브너(Gröbner) 기반과 같은 전통적인 방법들은 평면 기하 정리 증명 문제를 이론적으로 해결했지만, 컴퓨팅 성능에 제약을 받습니다. 다시 말해, 저장 공간과 컴퓨팅 용량이 방대하고, 특히 더 어려운 평면 기하 문제에 직면할 경우 연산 공간이 기하급수적으로 증가하기 때문에 기존의 많은 방법들은 어려운 문제를 처리하는 데 어려움을 겪습니다.

DeepMind의 가장 큰 장애물은 엄청난 양의 계산 문제가 아닙니다. DeepMind는 자금력이 풍부하거든요. 가장 큰 어려움은 운영 공간의 기하급수적 성장을 피하는 방법에 있으며, 여기서 머신 러닝 방법이 도움이 될 수 있습니다. ”

구체적으로, AlphaGeometry는 1억 개의 합성 데이터 포인트로 학습되었으며, 인간의 시연 없이도 복잡한 기하학적 문제를 자율적으로 해결하고, 인간이 읽을 수 있는 증명을 생성할 수 있습니다.

아래 그림과 같이, 우리나라 초·중등학생들에게 가장 친숙한 "이등변 정리"를 예로 들면, ∠ABC=∠BCA임을 증명하려면 먼저 문제를 컴퓨터 언어로 직접 변환한 후, AlphaGeometry에 입력해야 합니다.

AlphaGeometry는 정리가 증명되거나 새로운 진술이 소진될 때까지 정리 전제로부터 새로운 진술을 "철저하게" 추론하는 기호 추론 엔진을 실행하여 증명 검색을 시작합니다. 기호 추론 엔진이 증명을 찾지 못하면 언어 모델은 보조 지점을 구성하고, 증명 가능한 조건을 추가한 다음 기호 엔진을 통해 증명 검색을 다시 시작합니다. 해결책이 발견될 때까지 이러한 순환이 계속됩니다.

해결책은 자동으로 사람이 읽을 수 있는 언어로 구문 분석되므로 검증 및 평가가 가능합니다.

AlphaGeometry는 모델 학습에 합성 데이터를 사용하여 관련 데이터베이스가 부족하다는 문제를 해결한다는 점도 언급할 가치가 있습니다.

연구진은 다양한 무작위 정리 전제에 기존의 기호 엔진을 사용하고 10만 개의 CPU에서 72시간 동안 실행하여 약 5억 개의 합성 정리 증명 사례를 얻었습니다. 형식적인 정규화와 중복 제거를 거친 후, 그들은 최종적으로 1억 개의 정리 증명 사례를 얻었는데, 그 중 900만 개의 사례는 최소한 하나 이상의 보조 구성을 포함했고, 많은 증명 단계가 200단계를 넘었습니다. 이는 국제수학올림피아드의 기하학 문제의 평균 증명 길이의 4배에 달합니다.

합성 데이터 생성 프로세스

AlphaGeometry가 실제 문제를 해결하는 능력을 비교하고 테스트하기 위해 연구진은 2000년 이후 IMO 대회에서 출제된 기하 문제를 기호 엔진이 읽을 수 있는 기계어로 변환하려고 시도했고, 75%만 성공적으로 표현될 수 있음을 발견하여 30개의 고전적 기하 문제로 구성된 테스트 세트 IMO-AG-30을 구성했습니다.

각 문제의 실행 시간은 파생 폐쇄의 크기가 다르기 때문에 다릅니다. 연구자들은 실행 시간이 문제의 난이도와 상관관계가 없다는 것을 발견했습니다. 예를 들어, IMO 2019 P6는 IMO 2008 P1a보다 훨씬 어렵지만, IMO 시간 제한 내에 해결하는 데 필요한 병렬화 시간은 훨씬 짧습니다.

언어 모델 디코딩 과정은 k개의 선택적 보조 구조를 설명하는 k개의 서로 다른 시퀀스를 반환하므로, 연구자들은 각 빔의 점수를 가치 함수로 사용하여 k개의 옵션에 대한 빔 검색을 수행했습니다. 이 방법은 강력한 병렬성을 가지고 있으며, 병렬 컴퓨팅 리소스를 사용할 수 있는 경우 검색 속도를 크게 향상시킬 수 있습니다.

연구자들은 GPU V100 가속 언어 모델의 4개 병렬 사본을 사용하여 25개 문제를 모두 풀고 제한 시간 내에 완료하는 데 필요한 최소한의 병렬 CPU 수가 다음 그림과 같다는 것을 발견했습니다.


아래 그림은 IMO-AG-30 테스트 세트에서 10가지 다른 모델/방법의 성능을 보여줍니다. 흥미로운 점은 GPT-4가 시험에서 단 한 문제도 맞추지 못했다는 것입니다.

지능을 컴퓨팅 파워로 대체하는 데 있어 핵심은 애플리케이션 가치입니다.

지난 이틀 동안 인터넷에 게시된 엄청난 양의 보고서를 통해 AlphaGeometry의 성과가 완전히 드러났습니다. 그 영향력에 대해서는 자세히 설명할 필요가 없으므로, 논란의 여지가 있는 부분을 제외하면 AlphaGeometry가 과학 연구와 AI 애플리케이션 개발에 어떤 실질적인 가치를 가져올 수 있는지 알아보고자 합니다.

린저우천 교수는 이렇게 말했습니다.현재, 알파지오메트리는 알파고와 같은 "선생님"이 될 수 있으며, 가르치는 데 있어 더 큰 보조적 역할을 할 수 있습니다.또한 AlphaGeometry의 모델 성능 혁신은 부인할 수 없으며, "큰 힘은 기적을 창조할 수 있다"는 것을 다시 한번 입증합니다. 강력한 컴퓨팅 성능의 이점은 강력한 모델 성능을 만들어내며, 이는 컴퓨팅 성능을 "숭배"하는 연구자와 회사에 어느 정도 자신감을 더해줍니다. ”

그러나 Lin Zhouchen 교수가 말했듯이,AI 분야에서는 '컴퓨팅 파워가 지능을 대체하는' 효과가 수도 없이 나타났지만, AI만으로는 산업 전문가가 되기 위한 최종 1% 돌파구를 마련하기는 여전히 어렵습니다.

따라서 지금으로서는 AlphaGeometry든 GPT 모델과 같은 다른 AI 도구든 여전히 사람들의 일상생활과 과학 연구에 있어서 "선생님이자 친구"입니다. AI 도구의 유연한 활용은 일반적인 추세가 되었습니다. 컴퓨팅 능력이 만들어내는 '기적'을 실제 문제에 어떻게 적용할 것인가 하는 것은 대체하기 어려운 인간의 가치입니다.

과거로부터 교훈을 얻어 현재에 적용해보면, AI 도구의 급속한 성장은 컴퓨터의 대중화와 많은 유사점을 가지고 있습니다. 예를 들어, AI는 우리의 업무 방식에 혁명을 일으켜 기존 방식을 큰 추진력으로 대체했으며 점차 직장 역량을 평가하는 기준이 되고 있습니다. 그러나 이와 대조적으로 AI 도구의 한계도 더욱 두드러지는데, 바로 특수성입니다.

린 저우천 교수는 다음과 같이 믿습니다.현재 AI 도구는 균일성이 부족합니다.수학에만 집중하더라도 수론과 기하학을 위해 개발된 AI 도구 사이에는 큰 차이가 있으며, 학제간 AI 도구는 말할 것도 없습니다. AI 도구는 아직 오늘날의 컴퓨터라는 기반 시설만큼 쉽게 접근할 수 없습니다. 현재 컴퓨터 언어로는 C, Java, Python 등이 있습니다. 이러한 언어 중 하나만 사용해도 수학, 물리, 화학 등 여러 학문 분야의 문제를 해결할 수 있으며, 이는 언어의 다재다능함을 보여줍니다. 하지만 알파 시리즈에서 볼 수 있듯이 AI 도구의 경우는 다릅니다. ”

따라서 린 저우천 교수는 "미래에 AI 도구를 추상화하고 재사용할 수 있게 되면 과학을 위한 AI가 대중화될 수 있을 것"이라고 믿습니다. ”

이는 HyperAI가 과학을 위한 AI의 발전을 지속적으로 추적하면서 관찰한 현상이기도 합니다. 일부 연구 그룹이나 연구팀에서는 연구에 필요한 AI 도구 개발을 담당하기 위해 해당 분야의 구성원 외에 AI 전문가를 모집하지만, 과학 분야는 여전히 전통적인 과학 연구자에게 맡겨져 있습니다.

AI가 과학 연구 과정에 도움을 주고 개선하는 것이 점점 더 분명해지고 새로운 트렌드가 되고 있다는 것은 의심의 여지가 없지만, 이 AI+과학 팀 모델이 장기적인 해결책일까요?

린 저우천 교수는 "미래에는 한편으로는 AI 도구 사용의 문턱을 낮추고 일정 수준의 획일성을 달성하여 과학자들이 컴퓨터 프로그래밍처럼 다양한 문제에 AI 도구의 구성 요소를 결합하여 사용할 수 있도록 해야 합니다. 다른 한편으로는 과학자들이 AI의 힘을 최대한 활용하기 위해 AI 도구 사용 능력을 점진적으로 향상시켜야 합니다."라고 말했습니다.

길은 길고 힘들지만, 계속 가면 목적지에 도착할 수 있을 거예요. 과학을 위한 AI는 DeepMind와 같은 대기업에 의해 시작되었으며, 국가 정책의 추진과 함께 긴 여정을 시작했습니다. 인간 개발을 위한 가치를 실제로 구현하기 위해서는 과학 연구와 산업이 함께 여정의 장애물을 제거해야 합니다.

마지막으로, 이 글을 쓰는 데 도움과 지원을 해주신 베이징대학교 지능학원의 린저우천 교수님께 감사드리고 싶습니다. 현재, 저우천 린 교수의 연구 그룹은 박사과정 학생을 모집하고 있습니다. 자격 조건을 충족하는 학생은 이력서를 zlin@pku.edu.cn으로 보내주시기 바랍니다.

저는 물리학자 루트비히 볼츠만의 신조에 따라 살아갑니다. 좋은 이론보다 더 실용적인 것은 없습니다. 저는 현재 수학에 강하고(하지만 반드시 수학과 출신이어야 한다는 것은 아닙니다) 이론적 분석에 관심이 많은 박사과정 학생을 찾고 있습니다. 이 학생들은 저와 함께 수학을 우아하게 사용하여 실제 문제를 해결하는 방법을 배울 수 있기를 바랍니다. 이력서를 보내주세요.

——린 저우천