Google Gemini 3 release

Es ist da!

Gemini 3 Pro wird als Googles bisher intelligentestes KI-Modell positioniert und gilt als das neue State-of-the-Art-Flaggschiff im Bereich der großen Sprachmodelle.

Es übertrifft die Konkurrenz in zahlreichen Schlüsselbereichen. Google will damit einen noch größeren Marktanteil sichern.

Die Gemini Modelle erfreuen sich spätestens nach dem Release von Nano Banana und dem Rekordmonat bei den Downloads der Gemini App zunehmender beliebtheit. Zu recht aus unserer Sicht!

Die Entwicklung von Gemini 3 Pro wird als eine ernsthafte Verbesserung der Fähigkeit beschrieben, schwierige Probleme zu durchdenken, und nicht lediglich als inkrementelles Update. Die führende Rolle dieses Modells beruht auf drei zentralen Mehrwerten, die sich in signifikanten Sprüngen in der Argumentationsfähigkeit, der Codierungsleistung und den agentischen Funktionen widerspiegeln.

Gemini 3 Pro liefert die stärkste Reasoning-Leistung innerhalb von Googles Modellfamilie und zeichnet sich dadurch aus, dass es viele Schritte gleichzeitig denken kann, ohne den Gedankengang zu verlieren. Dies war bei früheren Modellen oft ein Problem. Auf dem Benchmark Humanity’s Last Exam, einer sehr anspruchsvollen interdisziplinären Prüfung auf Doktoranden-Niveau, erzielt Gemini 3 Pro 37,5 Prozent ohne Nutzung von Tools, was es zum neuen führenden Modell macht und die Werte von Gemini 2.5 Pro mit 21,6 Prozent und GPT-5.1 mit 26,5 Prozent deutlich übertrifft. Auch im wissenschaftlichen Wissen auf PhD-Niveau zeigt das Modell Spitzenleistung. Auf dem GPQA Diamond Benchmark erreicht es 91,9 Prozent, ebenfalls der höchste Wert im Vergleich zu GPT-5.1 mit 88,1 Prozent. Darüber hinaus zeigt Gemini 3 Pro bei visueller Logik und Mustererkennung einen sehr großen multimodalitätsbedingten Zuwachs auf dem ARC-AGI-2 Benchmark, der visuelle Argumentationsrätsel testet, und erreicht 31,1 Prozent im Vergleich zu 4,9 Prozent bei Gemini 2.5 Pro.

Google führt für Gemini 3 den Deep Think Modus ein, einen erweiterten Argumentationsmodus, der zusätzliche Denkleistung für die schwierigsten Probleme bereitstellt. In Tests übertrifft Deep Think die ohnehin beeindruckenden Leistungen von Gemini 3 Pro und erreicht 41,0 Prozent auf HLE sowie 93,8 Prozent auf GPQA Diamond, jeweils ohne Tools. Auf dem ARC-AGI-2 Benchmark erzielt Deep Think 45,1 Prozent mit Code-Ausführung, was seine Fähigkeit zur Lösung neuartiger Herausforderungen unterstreicht. Basierend auf dieser Leistung wird Gemini 3 Pro in Deep Think als Proxy für einen IQ zwischen 160 und 170 geschätzt. Dies verleiht Google theoretisch die Kapazität, Tausende von Wissensarbeitsplätzen mit „Genies“ zu besetzen, vorausgesetzt, diese IQ-Metriken sind auf KI übertragbar.

Anwender profitieren von präziseren und tiefgreifenderen Antworten, insbesondere bei mathematischen Aufgaben und Physik. Das Modell löst komplexe Probleme wie das Rolling Hexagon-Problem der Internationalen Physik-Olympiade oder schwierige Wahrscheinlichkeitsrätsel, die früher selbst für die besten Modelle unlösbar waren, und kann die mathematische Herleitung klar visualisieren. Auch in der strategischen Planung zeigt Gemini 3 Pro Stärken. Es kann komplexe Zehn-Tages-Pläne erstellen, die zahlreiche Einschränkungen und Abhängigkeiten strikt einhalten, wie beispielsweise Sponsorenfristen, Bearbeitungszeiten oder Wochenendverbote, und liefert dazu eine Begründung sowie einen alternativen Zeitplan.

Im Bereich Codierung und Generative Interfaces gilt Gemini 3 Pro als Googles bestes Modell für Vibe Coding und Agentic Coding.

Es liefert außergewöhnliche Leistungen bei der Codierung, insbesondere bei der Front-End-Entwicklung und der Erstellung interaktiver Erlebnisse. Quantitative Benchmarks bestätigen diesen Leistungssprung. Auf dem LiveCodeBench Pro erreicht Gemini 3 Pro 2.439 Elo im Vergleich zu 1.775 Elo bei Gemini 2.5 Pro. Auf dem Terminal-Bench 2.0 erreicht es 54,2 Prozent, was eine deutliche Verbesserung der autonomen Werkzeugnutzung und Code-Generierung an der Kommandozeile signalisiert. Auch auf dem SWE-Bench verbessert sich das Modell bei der autonomen Behebung von Software-Engineering-Herausforderungen von 59,6 Prozent bei Gemini 2.5 Pro auf 76,2 Prozent im Single Attempt und liegt damit auf Augenhöhe mit den besten Wettbewerbern.

Gemini 3 Pro kann nun benutzerdefinierte, interaktive Oberflächen und Tools direkt aus einfachen Prompts generieren.

Es kann interaktive Tutorials erstellen, wie beispielsweise zu Vincent Van Gogh, oder visuelle Erklärungen, wie etwa die Visualisierung eines Attention-Mechanismus aus einem wissenschaftlichen Paper. Das Modell ist in der Lage, komplexe, direkt ausführbare Spiele einmalig zu generieren, die im Browser laufen, unter ausschließlicher Nutzung von HTML, CSS und JavaScript. Dazu zählen ein minimales Minecraft-ähnliches Voxel-Welt-Spiel mit Steuerung und Schattierungseffekten, ein rundenbasiertes Strategiespiel nach dem Vorbild von Advanced Wars mit Basis-KI und ein Vampire Survivors-Klon. Darüber hinaus zeigt Gemini 3 Pro ein überlegendes strategisches Verständnis und ein tieferes Verständnis von UX-Constraints, zum Beispiel die Vermeidung bestimmter Farbtöne für eine Fitness-App für Senioren, um altersbedingte Einschränkungen zu berücksichtigen.

Google hat die agentenorientierte Entwicklungsplattform Google Antigravity eingeführt, die Gemini 3 Pro nutzt, um den gesamten Entwickler-Workflow zu optimieren. Agenten haben in dieser Umgebung direkten Zugriff auf Editor, Terminal und Browser und können komplexe End-to-End-Softwareaufgaben autonom planen, ausführen und ihren eigenen Code validieren.

Der Gemini Agent Modus in der Gemini Web-App ermöglicht es dem Modell, über die reine Beantwortung von Fragen hinauszugehen und Aufgaben aktiv für den Nutzer zu erledigen, wodurch der praktische Nutzen deutlich steigt.

Gemini 3 Pro zeigt eine verbesserte Fähigkeit zur langfristigen Planung. Auf dem Vending-Bench 2, einem Test zur Verwaltung eines simulierten Verkaufsautomaten-Geschäfts über ein volles simuliertes Jahr, erreicht das Modell einen mittleren Nettowert von 5.478,16 US-Dollar, deutlich über den Werten von Gemini 2.5 Pro mit 573,64 US-Dollar und GPT-5.1 mit 1.473,43 US-Dollar.

Und für alle die spaß an Automationen haben, der Gemini Agent bietet für Nutzer von Google AI Ultra Funktionen wie z.B. automatisiertes Inbox-Management, bei dem aktuelle E-Mails gescannt, relevante Dokumente gefunden und To-Do-Listen erstellt werden. Er kann Kalenderereignisse und E-Mails kombinieren, um ein Kontrollpanel mit den drei wichtigsten Prioritäten des Tages zu erstellen und entsprechende Zeitblöcke vorzuschlagen. Zudem ist autonomes Browsing möglich, bei dem der Agent Aufgaben wie das Buchen von Restaurantreservierungen oder das Finden komplexer Informationen eigenständig ausführt, wobei jeder Schritt nachvollziehbar dokumentiert wird. Und viele weitere Usecases.

Gemini 3 Pro verfügt über ein weltklasse Multimodalitätsverständnis und kann nahtlos Informationen aus Text, Bildern, Diagrammen, Dokumenten, langen Videos, Audio und Code verarbeiten. Im Bereich Videoanalyse setzt es neue Maßstäbe mit 87,6 Prozent auf Video-MMMU und 81,0 Prozent auf MMMU-Pro. Das Modell kann beispielsweise ein Pickleball-Match analysieren und auf Basis der Beobachtungen konkrete Trainingspläne erstellen. Durch die Fusion von multimodalen Daten ist es möglich, ein handschriftliches Rezept in koreanischer Sprache zu erkennen, zu übersetzen und in eine voll funktionsfähige, interaktive Familienrezept-App in englischer Sprache umzuwandeln. Trotz höherer Kosten als Gemini 2.5 Pro bleibt es günstiger als Claude Sonnet 4.5 und wird dank kontinuierlicher Effizienzverbesserungen und Destillationstechniken in Google Search AI Mode integriert.

Trotz der starken Verbesserung der Hard-Skill-Leistung berichten einige Nutzer von einer hohen Halluzinationsrate und Überzeugung bei falschen Antworten. Obwohl Gemini 3 Pro die höchste Rate korrekter Antworten aufweist, kann die Sturheit bei Fehlern die Nutzererfahrung negativ beeinflussen, ein Problem, das bereits bei Gemini 2.5 Pro beobachtet wurde.

Gemini 3 Pro hat laut Benchmarks die Führungsposition im LLM-Bereich übernommen.

Die Kombination aus tiefgreifender Logik, bahnbrechender Code-Generierung interaktiver Erlebnisse und erweiterten Agenten-Funktionen definiert eine neue Ära der KI. Man kann sich Gemini 3 Pro wie einen hochbegabten, voll ausgestatteten Ingenieur mit persönlichem Assistenten vorstellen. Frühere Modelle waren kluge Berater, während Gemini 3 Pro nicht nur weiß, wie man ein Problem löst, sondern auch seine eigenen interaktiven, visuellen Blaupausen erstellt und anschließend autonom handelt, um Aufgaben im Namen des Nutzers zu erledigen, sei es das Schreiben von Code oder die Organisation des Posteingangs.

KI Bits abonnieren

Verpassen Sie keine neuen Beiträge. Melden Sie sich jetzt an und erhalten Sie Zugang zu allen exklusiven Inhalten.
ihre@email.de
Abonnieren