Back to Headlines

OpenAI의 AI 리더십을 뒷받침하는 수학적 사고의 비밀: o1 모델과 미래의 인공지능 에이전트로 향하는 길

18일 전

오픈AI는 AI가 인간처럼 컴퓨터에서 복잡한 작업을 수행할 수 있도록 하는 'AI 에이전트' 개발에 박차를 가하고 있다. 이는 챗GPT의 성공이 우연이었다면, 에이전트는 수년에 걸친 체계적인 연구 성과다. 2022년 연구원으로 입사한 헌터 라이트먼은 수학 경시대회 문제 해결에 특화된 '매스젠(MathGen)' 팀에서 시작해, AI의 추론 능력을 키우는 데 핵심 역할을 했다. 2023년 '스트로베리(Strawberry)' 기술을 통해 대규모 언어모델(LLM)과 강화학습(RL), 테스트 시점 계산 기법을 결합해 AI가 문제를 단계적으로 계획하고 검증하는 '사고의 흐름(chain-of-thought)'을 구현했고, 이는 2024년 초 출시된 o1 모델로 이어졌다. o1은 국제 수학 올림피아드에서 금메달을 획득하며 AI의 추론 능력이 본격적으로 입증됐다. 이러한 기술은 코딩과 같은 명확한 작업에 강점을 보이지만, 온라인 쇼핑이나 장기 주차장 찾기 같은 주관적, 복잡한 과제에서는 여전히 오류가 많다. 연구진은 이를 '데이터 문제'로 보며, 검증이 어려운 작업에 대한 학습 기법 개발에 주력 중이다. 특히 다중 에이전트가 동시에 아이디어를 탐색해 최적의 답을 선택하는 방식이 주목받고 있다. 오픈AI는 GPT-5 출시를 통해 에이전트의 성능과 사용 편의성을 높이려 하고, 사용자가 설정을 조절하지 않아도 목적을 이해하고 도구를 적절히 활용하는 '직관적 에이전트'를 목표로 한다. 그러나 구글, 앤트로픽, xAI, 메타 등 경쟁사들의 빠른 추격 속에서 오픈AI는 ‘초지능’ 시대를 선도할 수 있을지 여전히 불확실하다.

Related Links

OpenAI의 AI 리더십을 뒷받침하는 수학적 사고의 비밀: o1 모델과 미래의 인공지능 에이전트로 향하는 길 | 헤드라인 | HyperAI초신경