하버드-MIT 연구: AI, 과학적 발견 위해 아직 미숙
하버드와 MIT 연구: AI 모델이 과학적 발견을 하기에는 아직 준비되지 않았다 AI는 내일 해가 뜰 것을 예측할 수 있지만, 그 이유를 설명할 수는 없다. 최근 하버드 대학교와 MIT의 연구자들은 대형 언어 모델(LLMs)과 인공 일반 지능(AGI)에 대한 핵심 질문 중 하나인, 기초 AI 모델이 세계 모델을 인코딩할 수 있는지, 아니면 단순히 시퀀스의 다음 토큰을 예측하는 데만 능한지를 조사하는 연구를 발표했습니다. 이 예측과 설명 사이의 이분법은 AI를 넘어 과학의 근본적인 난제입니다. 연구팀은 트랜스포머 기반 AI 모델을 행성 궤도 역학(케플러가 행성이 태양 주변을 어떻게 움직이는지를 발견한 것)을 예측하도록 훈련시켰습니다. 이후 이 모델이 뉴턴의 만유인력 법칙을 이해하고 있는지를 테스트하기로 결정했습니다. 연구자들은 이 AI 모델이 올바른 예측을 하지만 뉴턴의 법칙을 인코딩하지 못한다면, 전면적인 세계 모델을 갖추지 못했다고 가정했습니다. 이는 현재의 AI 모델이 세계를 이해할 수 없다는 강력한 증거가 될 것이며, AGI의 꿈에 큰 타격을 입힐 것입니다. 행성 궤도 역학을 선택한 이유는 역사적으로 정확하기 때문입니다. 뉴턴은 케플러의 발견을 바탕으로 만유인력 법칙을 도출했습니다. 비슷한 방식으로, 연구자들은 AI 모델이 케플러의 관찰을 통해 뉴턴의 법칙을 유추할 수 있는지를 검증하려고 했습니다. 연구 결과, AI 모델은 케플러의 궤도 데이터를 기반으로 정확한 예측을 할 수 있었지만, 뉴턴의 물리 법칙을 이해하고 있지는 않았습니다. 이는 AI 모델이 데이터 패턴을 잘 학습할 수는 있지만, 그 뒤에 숨겨진 원리를 파악하는 데는 한계가 있음을 보여줍니다. 이 연구는 AI가 과학적 발견을 하기 위해서는 단순한 예측력뿐만 아니라, 세계의 근본적인 원리를 이해하는 능력이 필요하다는 점을 강조합니다. 研究者们还发现,尽管AI模型能够处理复杂的数学计算,但在解释这些计算背后的物理原理时却显得无力。例如,当AI模型被要求解释为什么行星会沿着特定的轨道运行时,它只能提供基于数据的统计预测,而不是基于物理定律的逻辑解释。这一发现进一步证明了AI模型在理解复杂系统方面的能力有限。 此外,研究人员指出,如果AI模型真的能够编码世界模型,那么它们应该能够在新的、未见过的情况下进行推理和预测。然而,在这项研究中,当AI模型遇到与训练数据不同的新情况时,其表现显著下降,这表明它缺乏泛化能力。 总的来说,这项研究表明,尽管AI在某些任务上表现出色,但它们目前还无法真正理解世界。这并不意味着AI没有价值,而是指出了当前技术的一个重要局限性。要实现AGI,科学家们需要开发出能够更深入地理解和推理世界的AI系统。 이 연구에서 연구자들은 AI 모델이 복잡한 수학 계산을 수행할 수는 있지만, 그 계산 뒤의 물리적 원리를 설명할 때는 무력하다는 점도 발견했습니다. 예를 들어, AI 모델이 왜 행성이 특정 궤도를 따라 움직이는지를 설명하도록 요구받았을 때, 그것은 데이터 기반의 통계적 예측만 제공할 수 있었지, 물리 법칙에 따른 논리적 설명은 할 수 없었습니다. 이 발견은 AI 모델이 복잡한 시스템을 이해하는 데 있어 한계가 있다는 점을 더욱 확실히 보여줍니다. 또한, 연구원들은 AI 모델이 정말로 세계 모델을 인코딩한다면, 새로운 미처 보지 못한 상황에서도 추론과 예측을 할 수 있어야 한다는 점을 언급했습니다. 그러나 이번 연구에서 AI 모델이 훈련 데이터와 다른 새로운 상황에 직면했을 때, 성능이 크게 저하되었으며, 이는 일반화 능력이 부족함을 시사합니다. 결국, 이 연구는 AI가 특정 작업에서는 우수한 성능을 보이지만, 현재로서는 세계를 진정으로 이해할 수 없다는 것을 시사합니다. 이는 AI가 가치가 없다는 것을 의미하지는 않지만, 기술의 중요한 한계성을 지적합니다. AGI를 실현하기 위해서는 과학자들이 세계를 더 깊이 이해하고 추론할 수 있는 AI 시스템을 개발해야 합니다. 산업 전문가들은 이 연구 결과를 긍정적으로 평가하며, AI 개발의 미래 방향성을 제시해주었다고 말합니다. 하지만 동시에, 현재의 AI 모델이 과학적 발견을 위해 필요한 깊이 있는 이해 능력을 갖추지 못하고 있다는 사실을 받아들여야 함을 강조합니다. 하버드와 MIT의 연구는 AI 기술의 발전을 위한 중요한 단계로 간주되며, 앞으로의 연구가 이러한 문제를 해결하는 데 초점을 맞춰야 할 필요성을 제기하고 있습니다.