Gemini 2.5 Flash-Lite 안정화 및 일반 공개
2025년 7월 22일, Google은 Gemini 2.5 Flash-Lite의 안정화된 버전을 공개하며, 이 모델이 일반적으로 사용 가능하게 되었습니다. Gemini 2.5 Flash-Lite는 Gemini 2.5 모델 가족 중 가장 빠르고 비용 효율적인 모델로, 1백만 입력 토큰당 $0.10, 1백만 출력 토큰당 $0.40의 가격으로 제공됩니다. 이 모델은 지능 대비 비용 효율성을 극대화하기 위해 설계되었으며, 고도의 추론 기능도 선택적으로 활성화할 수 있습니다. Gemini 2.5 Flash-Lite는 성능과 비용 사이에서 균형을 유지하면서도 품질을 손상시키지 않는 특징을 가지고 있습니다. 특히, 실시간 번역 및 분류와 같은 지연 시간에 민감한 작업에서 우수한 성능을 발휘합니다. 이 모델의 주요 특징은 다음과 같습니다: 최고급 속도: 다양한 프롬프트에서 2.0 Flash-Lite와 2.0 Flash보다 낮은 지연 시간을 제공합니다. 비용 효율성: 가장 저렴한 2.5 모델로, 1백만 입력 토큰당 $0.10, 1백만 출력 토큰당 $0.40의 가격으로 대량의 요청을 합리적인 비용으로 처리할 수 있습니다. 오디오 입력 가격도 프리뷰 출시当时的价格降低了40%。 스마트하고 소형: 코딩, 수학, 과학, 추론, 다중 모드 이해 등 다양한 벤치마크에서 2.0 Flash-Lite보다 전반적으로 더 높은 품질을 보여줍니다. 완벽한 기능: 1백만 토큰 컨텍스트 창, 제어 가능한 사고 예산, Google Search, 코드 실행, URL 컨텍스트 등의 네이티브 도구를 지원합니다. Gemini 2.5 Flash-Lite가 출시된 이후 몇몇 성공적인 사례들이 나타났습니다. 이 중 몇 가지를 소개하겠습니다: Satlyt: 분산형 우주 컴퓨팅 플랫폼을 구축하고 있으며, 위성 데이터 처리 및 활용 방식을 혁신할 예정입니다. 2.5 Flash-Lite의 속도는 중요한 Onboard 진단에서 45%의 지연 시간 감소와 기준 모델에 비해 30%의 전력 소비 감소를 가능하게 해주었습니다. HeyGen: AI를 사용하여 비디오 콘텐츠의 아바타를 생성하며, Gemini 2.5 Flash-Lite를 활용하여 비디오 기획 자동화, 콘텐츠 분석 및 최적화, 180여 개 언어로의 번역 등을 수행합니다. 이를 통해 글로벌 사용자들에게 개인화된 경험을 제공할 수 있게 되었습니다. DocsHound: 제품 데모를 문서로 변환하는데 Gemini 2.5 Flash-Lite를 사용하여 긴 비디오를 처리하고 수천 개의 스크린샷을 추출합니다. 이는 전통적인 방법보다 훨씬 빠르게 영상을 종합 문서 및 AI 에이전트의 훈련 데이터로 변환할 수 있게 합니다. Evertune: 브랜드가 AI 모델에서 어떻게 표현되는지를 이해하는 데 도움을 줍니다. 2.5 Flash-Lite는 대량의 모델 출력을 빠르게 스캔하고 통합하여, 고객에게 동적인 시간적 인사이트를 제공하는 데 큰 역할을 하고 있습니다. 2.5 Flash-Lite를 사용하려면 코드에서 "gemini-2.5-flash-lite"를 명시하면 됩니다. 프리뷰 버전을 사용 중이라면 동일한 기본 모델을 사용하므로 "gemini-2.5-flash-lite"로 변경할 수 있습니다. 2025년 8월 25일에는 Flash-Lite의 프리뷰 별칭을 제거할 계획입니다. 개발에 참여하고 싶으신가요? Google AI Studio와 Vertex AI에서 안정화된 Gemini 2.5 Flash-Lite 버전을 지금 사용해보세요. 업계 관계자들은 Gemini 2.5 Flash-Lite의 출시를 긍정적으로 평가하고 있습니다. 이 모델은 다양한 산업에서 실시간 데이터 처리와 효율적인 비용 관리를 위해 필요한 핵심 기능들을 모두 갖추고 있으며, 특히 AI 기술의 상용화에 있어 중요한 진전을 이루었다고 보고 있습니다. Google은 AI 모델의 혁신적인 개발과 배포를 통해 기업들이 더 효율적으로 운영될 수 있도록 지원하고 있으며, Gemini 2.5 Flash-Lite는 이 노력의 일환이라고 할 수 있습니다.