HyperAI초신경

이번 주에는 AI 분야가 매우 활발할 것으로 예상된다.

5월 13일 현지 시각에 OpenAI는 ChatGPT와 GPT-4에 대한 업데이트 출시를 라이브 방송할 예정입니다. 다음 날, 예정대로 Google I/O가 개최되었습니다. 구글의 연례 행사인 I/O 컨퍼런스와 달리, 이번에 OpenAI가 임시로 공개한 내용은 약간 과장된 면이 있습니다. 이번에는 오랜 '경쟁자'가 어떤 행동을 보일까? 두 정당의 기원을 살펴보고 대담하게 추측해 보세요!

여러 차례의 대결, 전투가 한창이다

OpenAI가 주목받은 이후, 구글은 "실망스럽다", "느린 시작", "따라잡기 어렵다"는 꼬리표를 달았습니다.가장 탐험해 볼 만한 곳은 'AI 황푸군관학교'라는 명칭이다.칭찬처럼 들리지만, 사실 이는 구글의 '씁쓸한 눈물'입니다.

우리 모두 알고 있듯이 OpenAI의 기반을 마련한 ChatGPT는 Transformer 아키텍처를 기반으로 합니다.트랜스포머는 구글이 "Attention Is All You Need"라는 논문에서 제안한 획기적인 아키텍처입니다.또한, 많은 전직 구글 임원들이 ChatGPT 릴리스 인터페이스의 감사의 글에 등장했고, 이후 많은 핵심 구글 직원들이 OpenAI로 옮겨갔습니다... 더 흥미로운 점은 구글이 "반격"을 시도할 때마다 항상 몇 가지 작은 에피소드가 있다는 것입니다.

2023년 2월, 구글은 ChatGPT를 처리하기 위해 Bard를 제안했습니다.하지만 공개된 직후, 시연 내용에 사실 오류가 있다는 사실이 밝혀졌습니다.

"제임스 웹 우주 망원경(JWST)과 그것이 발견한 것에 대해 9살짜리 아이에게 무엇을 말해줄 수 있을까요?"라는 질문에 대한 답변입니다. 바드는 이렇게 답했습니다. 외계 행성의 첫 번째 사진은 JWST가 촬영했습니다. 하지만 하버드-스미스소니언 천체물리학 센터의 연구원인 그랜트 트렘블레이는 2004년에 외계 행성의 첫 번째 사진을 촬영한 것은 유럽 남방 천문대의 초대형 망원경(VLT)이었다고 지적합니다.

Google은 2023년 5월 I/O 컨퍼런스에서 Bard의 제품 업그레이드를 시연했습니다.예를 들어, 더 많은 언어를 지원하고, 이미지 정보를 인식하고, Google 애플리케이션 및 일부 외부 애플리케이션에 연결하는 등의 기능이 추가되었습니다. 동시에 Google은 GPT-4와 비슷한 제품인 PaLM2도 출시했는데, 이는 수학, 코딩, 추론 및 자연어 생성 측면에서 개선되었습니다.

이를 바탕으로 구글 헬스 연구팀은 의학 지식 검색, 의학 용어 디코딩 등의 기능을 갖춘 Med-PaLM 2를 개발했습니다. 예상대로 Google은 AI 기능을 카피라이터, 스프레드시트 작성과 같은 사무 업무에 통합하고, 모델 측면에서는 GPT, 응용 프로그램 측면에서는 Microsoft와 비슷한 Google Workspace를 출시했습니다.

이후 많은 네티즌들은 PaLM 2와 다양한 형태의 GPT-4를 비교했고, OpenAI가 여전히 선두를 차지할 가능성이 더 컸습니다.

2023년 12월, 구글은 "가장 크고 강력한" AI 모델인 제미니를 출시했습니다.데모 효과는 정말 놀랍고, 하이엔드 버전은 성능 면에서 GPT-4와 경쟁할 수 있습니다. 하지만 시연 영상은 후반작업을 거쳐 일부 효과가 과장된 것으로 드러났습니다.

2024년 2월 8일, 구글은 Bard의 이름이 공식적으로 Gemini로 변경될 것이라고 발표했습니다.가장 강력한 모델인 제미니 울트라를 탑재한 챗봇 제미니 어드밴스드도 공식적으로 출시되었으며, ChatGPT와 동일한 "월세"인 20달러로 경쟁이 치열해 보입니다. 이번 출시의 더 중요한 의미는 Google AI가 모델명이자 제품명인 Gemini로 통합된다는 것입니다.

2024년 2월 16일, 가장 강력한 Gemini 1.0 Ultra가 출시된 지 며칠 만에 Google은 Gemini 1.5를 한꺼번에 출시했습니다.그 중 Gemini 1.5 Pro는 최대 100만 개의 초장문 컨텍스트 토큰을 지원할 수 있어 토큰 수 면에서 GPT-4를 압도하며, 오디오 및 비디오 처리 등의 작업에서 탁월한 성능을 달성합니다. 소라가 없었다면 제미니 1.5는 아마도 오랫동안 AI계에서 화제가 되었을 겁니다.

Gemini 1.5가 출시된 지 몇 시간 만에 OpenAI는 Vincent 비디오 모델 Sora를 출시했습니다.전례 없는 영상 생성 능력으로 즉각 주목을 받았으며, 1분 분량의 데모 영상은 제미니의 주목을 직접 끌었습니다.

이번 라운드에서는 기술적인 면에서는 비교가 불가능하지만, 인기 면에서는 확실히 승자가 결정됩니다. OpenAI는 Sora의 도움으로 자신의 입지를 더욱 공고히 했습니다.

OpenAI가 다시 주목을 끌까?

5월 1일, X 네티즌 지미 애플스가 다음과 같은 소식을 전한 것은 주목할 만한 일입니다.OpenAI의 검색 엔진은 5월 9일에 출시될 가능성이 있습니다.이 네티즌은 GPT-4의 출시일을 정확하게 예측한 적이 있습니다. 그는 나중에 출시일이 5월 13일로 연기되었다고 말했습니다.

블룸버그는 5월 8일, OpenAI가 새로운 검색 엔진을 내부적으로 개발 중이며, 생성적 AI 질의응답 방식을 통해 새로운 검색 경험을 제공할 것이라고 보도했습니다. 블룸버그는 검색 엔진의 특징 중 하나는 문자와 이미지를 사용하여 질문에 답할 수 있다는 것이라고 밝혔습니다. 블룸버그는 OpenAI의 검색 제품이 주력 제품인 ChatGPT의 확장판이며, ChatGPT가 인용을 포함한 웹에서 정보를 직접 얻을 수 있도록 한다고 보도했습니다. 이전 보도에서 The Verge가 이 소식을 보도했습니다.OpenAI는 AI 검색 제품 출시를 앞당기기 위해 Google 검색 부서의 엔지니어를 빼돌리고 있습니다.

이미 안정적인 검색 사업을 공략하려는 OpenAI의 움직임은 "용을 직접 공격하는 것"과 비슷해 보이지 않나요?

하지만 5월 11일, OpenAI는 공식적으로 트위터를 통해 13일 기자 회견에서는 ChatGPT와 GPT-4에 대한 업데이트만 공개할 것이며, "검색 엔진"에 대해서는 전혀 언급하지 않을 것이라고 밝혔습니다. 하지만 5월 13일이라는 날짜는 매우 흥미롭습니다. 구글이 이미 5월 14일에 Google I/O 컨퍼런스를 개최할 것이라고 발표했기 때문입니다.

그러자 샘 알트만은 자신의 카드를 직접 공개했습니다.GPT-5도 아니고 검색엔진도 아니고하지만 우리는 사람들이 좋아할 만한 새로운 것을 항상 개발하고 있어요! 제게는 마법과 같아요.

샘 알트먼이 두 개의 틀린 답을 지운 후에도, 네티즌들은 여전히 "OpenAI가 무엇을 출시할지"에 대한 추측에 열광했고, 음성 상호작용을 포함한 더 많은 단서가 공개되었습니다.

The Information에 따르면, OpenAI는 사용자에게 객체와 대화하고 인식할 수 있는 새로운 모델을 시연하여 이미지와 오디오를 더 빠르고 정확하게 이해하도록 했습니다. The Verge에 따르면, 개발자 Ananay Arora는 ChatGPT에 통화 기능이 있을 수 있다고 말했습니다. Arora는 또한 OpenAI가 실시간 오디오 및 비디오 통신을 위한 서버를 제공했다는 증거를 발견했습니다.

또한, Halliday의 공동 창립자인 indigo는 자신의 Twitter(X) 계정에 더 자세한 예측을 게시했는데, GPT-4.5를 언급했을 뿐만 아니라 OpenAI의 새로운 AI 어시스턴트가 완전한 음성 상호 작용을 지원할 것이라고 예측했습니다.

그러나 어떤 관점에서 보면,샘 알트먼은 "검색 엔진"이라는 주장을 부인했지만 ChatGPT에 "검색 기능"을 추가하지 않을 것이라고는 말하지 않았습니다.사실, 최근 들어 네티즌들은 OpenAI가 검색 분야에 진출했다는 증거를 많이 찾아냈습니다.

먼저, 밀라의 전 연구원이자 MIT 강사인 리오르 S가 이 소식을 전했습니다.OpenAI의 최신 SSL 인증서 로그에 따르면 search.chatgpt.com 하위 도메인이 생성되었음을 알 수 있습니다.

현재 이 도메인 이름에 접속하면 404나 도메인 이름 오류가 아닌, 찾을 수 없음이라는 메시지가 표시됩니다.

중국의 일부 네티즌들은 그레이스케일 테스트를 받았고, "사이버 젠 하트"는 공식 계정을 통해 테스트 결과를 공개했습니다.

보시다시피 ChatGPT의 답변은 매우 정확하고 Cyber Zen Heart는 답변 속도도 수용 가능하다고 말합니다. 하지만,ChatGPT는 실시간 정보를 얻는 데 적합하지 않습니다.Cyber Zen은 비트코인 가격을 검색하여 Google에서 찾은 가격과 비교했습니다.

또한, 한 네티즌은 자신이 OpenAI의 공식 AI 검색 페이지라고 주장하며 트위터에 데모를 직접 게시했지만, 이는 회색조 테스트 인터페이스와는 매우 달랐습니다.

현재로선 OpenAI의 검색 제품이 그레이스케일 테스트 형태로 대중에게 공개될지는 아직 알 수 없습니다. 전반적으로 경쟁자는 구글뿐만 아니라 Perplexity AI입니다. 실제로,어떤 의미에서 Perplexity AI는 OpenAI가 검색 사업에서 직접 경쟁해야 할 제품입니다.

오늘날, "세계 최초의 대화형 검색 엔진"이라고 주장하는 이 AI 툴은 각광받고 있으며, 젠슨 황의 지원을 받았고 베조스와 같은 거물들의 투자를 받았습니다. ChatGPT 스타일의 질문과 답변과 기존 검색 엔진의 링크 목록을 결합한 것이 독특합니다.

AI 시대의 검색엔진 시장 경쟁에 OpenAI는 어떤 형태로 참여할 것인가? 5월 13일 기자 회견에서 ChatGPT의 검색 기능이 공개될지 기다려 보겠습니다.

Google I/O에서 Gemini만 선두를 차지할 수 있을까?

OpenAI의 기자 회견에서 의도적이든 아니든 주요 업데이트가 공개될지는 아직 알 수 없지만, 저는 구글이 예정대로 생중계를 시청할 것이라고 믿습니다. 만약 놀라운 일이 생긴다면, 피차이가 신속하게 대응하고 하루 뒤 열리는 Google I/O 컨퍼런스에서 시간 내에 반격할 수 있을지 궁금하네요?

이에 비해 매년 열리는 Google I/O 컨퍼런스에는 신비함이 다소 부족합니다. 공식 페이지에 발표된 컨퍼런스의 주요 주제는 모바일, 웹, ML/AI, 클라우드입니다.

평소처럼 구글 CEO인 순다르 피차이는 기조연설에서 안드로이드 업데이트, 차세대 하드웨어 제품, AI 분야에서 구글의 최신 진행 상황과 성과, 그리고 구글의 AI 역량을 구글의 전체 생태계에 통합하는 것에 대해 공유할 예정입니다.

* Gemini는 Google의 전체 생태계를 강화합니다.

제미니가 올해 Google I/O 컨퍼런스의 하이라이트가 될 것임에는 의심의 여지가 없습니다. 올해 2월에 업데이트된 제미니 1.5는 컨텍스트 길이를 수백만으로 늘렸으며, 그 성능은 이미 GPT-4와 경쟁할 수 있습니다. 따라서 Google의 다음 단계는 실제 적용 문제, 즉 Gemini를 검색, 사진 및 비디오 도구, Google Maps, Gmail 및 Google Docs와 같은 작업 공간 도구와 통합하는 방법을 고려하는 것입니다.

또한, 구글은 점차적으로 자사의 AI 기능을 구글 어시스턴트에 적용해 왔습니다. 제미니의 강력한 기능으로 더욱 발전되고 인간과 유사한 자연어 음성 비서를 만들어낼 수 있을까?

첨단 대형 모델과 하드웨어 사업을 모두 소유한 회사로서 제미니와 구글의 픽셀은 어떤 불꽃을 일으킬 수 있을까요? 작년에는 Pixie라는 AI 비서가 Pixel 9에 등장할 것이라는 보도가 있었습니다.

작년 Google I/O 컨퍼런스에서 공개된 Pixel 8에는 이미 Google의 AI 기능이 탑재되어 있습니다. 구글이 자체 개발한 칩인 텐서 G3 프로세서를 탑재했으며, 오디오 매직 이레이저, 베스트 테이크, 웹페이지 번역 및 읽기 등의 기능을 갖추고 있습니다. 예를 들어, 베스트 테이크 기능은 여러 장의 단체 사진을 합성하고, 각 사진에서 다양한 사람들의 표정을 선택하여 완벽한 단체 사진을 만들어낼 수 있습니다.

평소처럼 Pixel 9는 올해 컨퍼런스에서 출시될 예정이지만, 현재까지 유출된 정보에서는 그 모습이 보이지 않습니다. 대신 Pixel 8a가 더 인기가 있었습니다. AI 비서 픽시가 등장할지는 기다려봐야 할 일이다.

또한 올해 4월에는 외신을 통해 애플과 구글이 제미니를 iOS 시스템에 통합하기 위해 협력하고 있다는 소식이 보도되었습니다. 두 회사 모두 공식적으로 이 소식을 확인하지 않았습니다. 이 소식이 사실이라면, 이는 여러 사업 분야에서 경쟁하는 두 거대 기업 간의 "세기의 협력"으로 볼 수 있습니다. 피차이가 구글 I/O 컨퍼런스에서 관련 소식을 발표할지 궁금하네요.

* 안드로이드 및 AR/XR

Google의 초석인 Android는 항상 Google I/O 컨퍼런스에서 빼놓을 수 없는 부분입니다. 올해 Android 15가 공개되었으며, 개발자 프리뷰와 초기 베타 버전이 이미 출시되었습니다. 피차이는 연설에서 시스템의 주요 업데이트 내용을 더 자세히 소개할 것으로 보인다. 이전에 공개된 정보에 따르면, Android Auto를 기반으로 한 스마트카와 스마트워치 소프트웨어 Wear OS도 선보일 예정이다.

또한 일부 언론은 피차이가 구글의 AR 소프트웨어에 대한 소식을 공유하고 삼성 등 헤드디스플레이 제조업체를 위해 개발한 안드로이드 XR 플랫폼을 소개할 것이라고 보도했습니다. 올해 초 보도에 따르면, AR 하드웨어 팀은 구글의 일련의 해고로 가장 큰 타격을 입었기 때문에 일부 언론에서는 이 팀이 자체 AR 하드웨어 개발을 포기하고 OEM 협력 모델에 전적으로 전념하고 있다고 추측했습니다. 즉, 구글은 소프트웨어 수준에 집중할 것입니다.

피차이 거 CEO의 기조연설 외에도 올해의 Google I/O 컨퍼런스에는 Google AI의 최신 개발 사항, Android의 새로운 개발 사항, 생성 AI 시대를 위한 ML 프레임워크 등 다양한 주제의 포럼이 진행됩니다. 하지만 라이브 방송은 제공되지 않습니다. 연설 후 관련 영상 자료가 공개될 예정입니다. HyperAI 역시 AI에 대한 관심을 지속해서 기울이고 심층적인 보고서를 제공할 것입니다. 기대해주세요~

마지막 말

과거에는 산업이 국가의 힘을 측정하는 중요한 척도였습니다. 오늘날 과학기술력도 협상 테이블에 등장했으며, 심지어 주요 강대국 간의 게임에서 협상의 쟁점이 되기도 했습니다. 특히 대형 모델의 인기가 여전히 높은 가운데, 실리콘 밸리 거대 기업의 모든 행보에 많은 관심이 쏠리고 있다. 2022년 말만 되면 OpenAI, 마이크로소프트, 구글 등이 항상 갑자기 대규모 업데이트를 내놓곤 했는데, 네티즌들은 "깨어나 보니 AI계가 또 바뀌었나?"라고 감탄하곤 했습니다.

2024년을 맞이하면서 기술 수준에서부터 애플리케이션 시나리오 개발, 기존 강자에서 신규 유니콘까지 경쟁은 여전히 치열해지고 있으며, 이러한 추세를 계속 지배할 수 있는 기업은 반드시 우위를 점한 기업이 되어야 합니다. 피라미드 꼭대기에 있는 큰 놈들이 어떻게 싸울지, 우리 모두 작은 의자를 옮겨 놓고 신들의 싸움을 지켜보자!

참고문헌:
1.https://36kr.com/p/2660898993824512
2.https://techcrunch.com/2024/05/09/google-i-o-2024-what-to-expect/
3.https://www.spiceworks.com/tech/tech-general/articles/google-io-2024-expectations

4.https://www.theverge.com/2024/5/11/24154307/openai-multimodal-digital-assistant-chatgpt-phone-calls

Google I/O에서 싸움이 벌어지나요? OpenAI는 하루 전에 생중계할 예정이며 ChatGPT에는 통화 기능이 있을 수 있습니다.

여러 차례의 대결, 전투가 한창이다

OpenAI가 다시 주목을 끌까?

Google I/O에서 Gemini만 선두를 차지할 수 있을까?

마지막 말