HyperAI초신경

5월 21일 이른 아침, 베이징 시간으로 Google I/O 2025 컨퍼런스가 예정대로 시작되었습니다. 구글 CEO인 순다르 피차이는 기조연설에서 여러 가지 중요한 업데이트를 발표하면서, AI 분야에서 구글의 강력한 역량과 성장률을 여실히 보여주었습니다.

"보통 I/O 몇 주 전에는 너무 많은 정보를 공개하지 않습니다. 가장 중요한 모델들은 컨퍼런스에서 공개될 예정이기 때문이죠. 하지만 제미니 시대에는 3월 화요일에 가장 스마트한 모델을 출시하거나, 알파이볼브(AlphaEvolve)와 같은 흥미로운 혁신을 일주일 전에 발표할 수도 있습니다."라고 순다르 피차이는 말했습니다. 사실, Google을 팔로우하는 독자라면 Google이 컨퍼런스 직전에 획기적인 신모델인 AlphaEvolve를 출시하여 사람들의 I/O 컨퍼런스에 대한 기대감을 높였다는 사실을 알고 있을 것입니다.

방금 끝난 기조연설에서 피차이는 기대에 부응하는 모습을 보였습니다. 그는 Gemini에 대한 일련의 업데이트 외에도 Imagen 4, Veo 3의 최신 개발품과 헤드셋, XR 안경 및 기타 제품을 출시했습니다. 이 글에서는 주요 업데이트 내용을 소개합니다⬇️

제미니 2.5 전체 시리즈 업데이트

Deep Think는 강력합니다

제미니 2.5 업데이트는 기대되었지만, 놀라움으로 가득 차 있었습니다. Google은 3월에 지금까지 가장 스마트한 모델인 Gemini 2.5 Pro를 출시했고, 2주 전에 개발자에게 Gemini 2.5 Pro Preview 버전 업데이트를 제공했습니다. 그 후 많은 대규모 모델 평가 목록에서 선두를 차지했습니다.

예를 들어,프로그래밍 벤치마크 WebDev Arena에서 1415점을 획득하여 목록에서 1위를 차지했습니다.

쌍둥이자리의 사고 능력을 더욱 탐구하려면,구글은 '딥씽크'라는 향상된 추론 모드의 테스트를 시작했습니다.이 접근 방식은 새로운 연구 기법을 사용하여 모델이 응답하기 전에 여러 가정을 고려할 수 있도록 합니다.

효과 측면에서는Gemini 2.5 Pro Deep Think 버전은 여러 어려운 벤치마크에서 좋은 성능을 보이며 OpenAI o3 및 o4-mini를 능가합니다.여기에는 다음이 포함됩니다.

* 2025년 USAMO(미국 수학올림피아드) 시험에서 우수한 성적을 거두었습니다.

* 경쟁 수준의 프로그래밍 기술을 평가하는 어려운 벤치마크인 LiveCodeBench에서 선두를 차지했습니다.

* MMMU(다중 모달 추론 테스트)에서 84.0%라는 높은 점수를 받아 뛰어난 다중 모달 추론 능력을 입증했습니다.

또한 Gemma 3 시리즈는 모바일 기기의 AI 요구 사항을 충족하도록 업데이트되었습니다.Google은 Qualcomm, MediaTek, Samsung 및 기타 제조업체와 함께 Gemma 3n이라는 새로운 첨단 프레임워크를 제안했습니다.Google DeepMind의 혁신적인 기술인 Per-Layer Embeddings(PLE)를 사용하여 상당한 메모리 사용량 최적화를 달성했습니다. 원래 모델의 매개변수 크기는 각각 50억(5B)과 80억(8B)이지만, PLE 기술을 사용하면 이러한 대형 모델을 모바일 기기에서 실행하거나 클라우드에서 실시간 추론을 수행할 수 있으며 메모리 오버헤드는 20억(2B) 또는 40억(4B) 매개변수 모델과 동일합니다. 즉, 실행하는 데 2GB 또는 3GB의 동적 메모리만 필요합니다.

Veo 3 및 Imagen 4, 창의성을 고취시키다

Veo 3는 이전 세대와 비교했을 때 비디오 품질이 크게 향상되었을 뿐만 아니라,더 중요한 점은 비디오와 오디오를 동시에 생성하는 것이 처음으로 달성되었다는 것입니다.도시 거리의 교통 소음이든, 공원에서 지저귀는 새소리든, 심지어 캐릭터 간의 대화든 Veo 3는 텍스트 프롬프트나 사용자 요구 사항에 따라 자동으로 오디오 요소를 추가할 수 있습니다.

이 모델은 립싱크와 같은 사실적인 물리적 현상에도 뛰어나며 복잡한 장면 설명을 이해하고 이를 역동적인 비디오로 변환할 수 있습니다. 현재 Veo 3가 온라인 상태입니다. 미국 내 Ultra 구독자는 Gemini 애플리케이션과 Flow에서 서비스를 이용할 수 있으며, 기업 사용자는 Vertex AI 플랫폼을 통해 사용 권한을 얻어야 합니다.

Imagen 4는 이 업그레이드의 하이라이트 중 하나입니다.빠른 이미지 생성의 장점을 유지하면서도, 이미지의 디테일 표현이 더욱 향상되었습니다.복잡한 짜임새이든, 물방울이든, 동물의 털이든 모두 완벽하게 표현될 수 있습니다.

또한 Imagen 4는 사실적이고 추상적인 스타일의 이미지를 처리하는 데도 뛰어나며, 다양한 요구 사항에 따라 인쇄, 디스플레이 및 기타 상황에 적합한 고품질 이미지를 생성할 수 있습니다. 특히, 조판 기능이 크게 개선되어 인사말 카드, 포스터, 심지어 만화책을 만드는 데 매우 적합하다는 점이 언급할 가치가 있습니다. 현재 Imagen 4는 Gemini, Whisk, Vertex AI, Google Workspace 등 여러 제품군에 통합되어 사용자가 슬라이드, 비디오, 문서 등을 사용할 수 있습니다.

Command Palette

Gemini 2.5가 완전히 업데이트되었으며 Deep Think가 OpenAI를 지원하고 압도합니다.