HyperAI초신경
Back to Headlines

o3 프로, 성능은 뛰어나지만 느린 속도와 높은 비용이 문제

17일 전

o3 프로 전환 지금부터 o3에 더 많은 컴퓨팅 자원을 투입할 수 있습니다. 이것이 바로 o3-pro입니다. 그러나 이미 ChatGPT Pro를 사용하고 있는 사용자들이 o3-pro의 월 200달러 구독 가격이나 API를 통해 사용할 때 비용이 10배 이상으로 오르는 상황에서는 선택이 어려워집니다. o3-pro의 답변은 확실히 o3보다 우수하지만, 대기 시간이 길어져 작업 흐름을 방해하는 경우가 많습니다. 예를 들어, 15분 이상의 대기 시간은 중요한 작업을 수행하는 과정에서 인간의 집중력을 깨뜨릴 수 있습니다. 그럼에도 불구하고, 이미 구독 비용을 지불한 사용자들은 질문을 대기열에 넣고 나중에 유용한 결과를 얻을 가능성이 있기 때문에, 종종 이 모델을 이용하는 것이 가치있다고 봅니다. o3-pro는 특히 경제학 문제를 해결하거나 환각(hallucination)을 줄이는 데에서 두드러진 성능을 보여주는데, 이는 여러 사용자들의 경험과 일치합니다. 그러나 Confabulations 벤치마크에서 개선되지 않았다는 점은 주목할 만합니다. 사용자들의 평가에서도 o3와 o3-pro 사이에 큰 차이가 없다는 의견이 분산되어 있었습니다. o3-pro의 성능과 사용성 OpenAI에 따르면, 전문가들이 o3-pro를 o3보다 우수하다고 평가하며, 특히 과학, 교육, 프로그래밍, 데이터 분석, 그리고 글쓰기 등에서 성능이 크게 향상되었다고 합니다. 또한 o3-pro는 더 명확하고 철저하며 지시사항을 잘 따르고 정확하다는 평가를 받았습니다. 이 모델은 웹 검색, 파일 분석, 시각적 입력에 대한 추론, Python 사용, 메모리 기반 개인화 응답 등을 포함하여 ChatGPT의 활용성을 높였습니다. 그럼에도 불구하고, o3-pro의 느린 속도는 문제점으로 지적됩니다. 예를 들어, McKay Wrigley는 o3 Pro를 사용하면서 각 요청마다 20분 이상의 대기 시간이 걸렸다고 전했습니다. clay는 o3-pro가 복잡한 문제를 해결할 때 유용하지만, 대부분의 경우 o3나 Opus, Gemini를 기본 모델로 사용하고, 필요할 때만 o3-pro로 업그레이드하는 것이 좋다고 조언했습니다. 사용자 반응 Tyler Cowen은 o3-pro가 다른 모델들보다 훨씬 덜 환각하고, 경제학 문제를 해결하는데 유용하다고 긍정적으로 평가했습니다. 그는 긴 대기 시간이 문제가 되지만, Twitter 스크롤링처럼 대기 시간 동안 다른 일을 할 수 있다고 덧붙였습니다. 반면에, Erik Hoel은 o3-pro가 많은 실수를 하고, 과대평가된 자신감을 보이며, 인용 문헌을 구분하거나 날짜에 주의를 기울이는 능력이 부족하다고 비판했습니다. Nikita Sokolsky는 o3-pro의 출력이 문법과 문장 작성면에서 개선되었지만, ‘다음 단계’로 간주하기에는 충분히 혁신적이지 않다고 지적했습니다. 산업 내부자의 평가 o3-pro의 가장 중요한 특징 중 하나는 긴 시간 동안 생각할 수 있다는 것입니다. Jerry Liu는 o3-pro가 추론에 매우 뛰어나지만 느리고 간결하게 답변한다고 설명했습니다. 이는 Deep Research 쿼리와 대비되는 점으로, Deep Research는 시간이 오래 걸리지만 불필요한 내용을 많이 포함합니다. o3의 가격 인하가 o3-pro의 출시보다 더 큰 영향을 미쳤다는 의견도 있습니다. Aaron Levie는 o3의 가격이 80% 인하됨에 따라, 같은 비용으로 5배 더 많은 출력을 얻을 수 있게 되었다며, 이는 AI 기술의 미래를 고려하여 소프트웨어를 설계하는 방식에 큰 변화를 가져올 것이라고 주장했습니다. 이는 AI 추론 비용이 1년 또는 2년 안에 10배 이상 줄일 가능성이 있다는 점을 강조합니다. 결론 o3-pro는 확실히 o3보다 우수한 성능을 보이지만, 느린 처리 속도가 주요 단점으로 작용합니다. 이 모델은 복잡한 문제를 해결하거나 정밀한 분석이 필요한 경우에 사용하면 효과적일 수 있으나, 일상적인 작업에서 사용하기에는 비효율적일 수 있습니다. 따라서, o3-pro를 사용할지는 특정 상황과 필요성에 따라 결정해야 합니다. 현재로서는 대부분의 사용자들이 o3나 다른 모델들을 기본으로 사용하고, o3-pro를 마지막 수단으로 활용하는 것이 합리적입니다.

Related Links

Hacker News