Command Palette
Search for a command to run...
Gemini: Eine Familie hochleistungsfähiger multimodaler Modelle
Gemini: Eine Familie hochleistungsfähiger multimodaler Modelle
Gemini Team
Zusammenfassung
Dieser Bericht stellt eine neue Familie multimodaler Modelle vor, die Gemini, welche bemerkenswerte Fähigkeiten im Bereich Bild-, Audio-, Video- und Textverarbeitung aufweisen. Die Gemini-Familie umfasst die Größen Ultra, Pro und Nano, die für Anwendungen von komplexen Schlussfolgerungsaufgaben bis hin zu speicherbeschränkten Einsatzszenarien auf Geräten geeignet sind. Eine Evaluierung anhand einer Vielzahl von Benchmarks zeigt, dass unser leistungsfähigstes Gemini Ultra-Modell den Stand der Technik in 30 von 32 dieser Benchmarks verbessert – insbesondere ist es das erste Modell, das bei dem gut untersuchten Exam-Benchmark MMLU (Multimodal Multiple-Choice Reasoning) eine menschliche Expertenleistung erreicht hat, und es verbessert den Stand der Technik in allen 20 multimodalen Benchmarks, die wir untersucht haben. Wir glauben, dass die neuen Fähigkeiten der Gemini-Familie im Bereich cross-modale Schlussfolgerung und Sprachverarbeitung eine breite Palette von Anwendungsfällen ermöglichen werden. Wir diskutieren unseren Ansatz zur verantwortungsvollen Nachbearbeitung und Bereitstellung der Gemini-Modelle für Nutzer durch Dienste wie Gemini, Gemini Advanced, Google AI Studio und Cloud Vertex AI.