Gemini 3.5 Flash
Gemini 3.5 Flash Modell-Übersicht
Gemini 3.5 Flash wurde als erstes Modell der Gemini-3.5-Familie von Google DeepMind am 19.05.2026 vorgestellt. Gemini 3.5 Flash erreicht beinahe die Reasoning- und Coding-Kapazitäten von der großen Gemini 3.1 Pro Version, ist dabei aber deutlich günstiger und schneller. Das Modell wurde für das Coding und den Einsatz als KI-Agent ausgelegt und überzeugt v.a. durch das gute Preis- / Leistungsverhältnis.
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Gemini 3.5 Flash Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Multimodaler Transformer |
|---|---|
| Input Kontextlänge | 1,05 Mio. |
| Output Kontextlänge | 65,54k |
| Tokenizer | Proprietärer Gemini Tokenizer |
Besonderheiten
| Dynamic Thinking | Konfigurierbares Reasoning-System |
|---|---|
| Combined Tool Use | Mehrere Tools in einer Anfrage, inkl. Google Search, Google Maps, File Search, Code Execution etc. |
Vorteile & Nachteile
Vorteile
- Sehr hohe GeschwindigkeitGemini 3.5 Flash ist bis zu 4x schneller als vergleichbare Frontier-Modelle, was den Token-Output pro Sekunde angeht.
- Sehr gutes Preis- / LeistungsverhältnisMit $1.50/$9.00 pro 1 Mio. Tokens ist Gemini 3.5 Flash rund 40% günstiger als Gemini 3.1 Pro und ca. 66% günstiger als GPT-5.5. Context Caching reduziert den Preis für betroffene Inputs um weitere 90%.
- Großes KontextfensterMit 1 Mio. Tokens maximalem Kontextfenster übertrifft Gemini 3.5 Flash Modelle vermutlich ähnlicher Größe, wie Claude Sonnet 4.6, um ein Weites.
Nachteile
- Schwächer bei reiner Long-Context-Retrieval & ReasoningLong-Context-Retrieval Benchmarks wie MRCR v2 zeigen die Schwächen des kleineren Modells auf. Mit 1 Mio. Kontextfenster erreicht Gemini 3.5 Flash nur 26,6%, bei 128k Kontextfenster 77,3% (vs. 84,9% bei Gemini 3.1 Pro). Auch bei reinen Reasoning-Benchmarks wie GPQA Diamond und Humanity's Last Exam (40,2%) führt weiterhin Gemini 3.1 Pro.
- Preisanstieg im Vergleich zu Gemini 3.0 FlashMit $1.50/$9.00 rund 3x teurer als Gemini 3 Flash (Preview). Ähnliche Preissteigerungen konnten auch bei OpenAI und Anthropic beobachtet werden, allerdings nicht in dieser Höhe.
- Viele Tokens zum Lösen von Aufgaben notwendigGemini 3.5 Flash benötigt vergleichsweise viele Output-Tokens (ca. 73 Mio. im AA Intelligence-Index-Benchmark vs. ~35 Mio. Durchschnitt), was letztendlich zu höheren Gesamtkosten bei komplexeren Aufgaben führt.
- Proprietäres KI-Modell ohne Open WeightsWie andere Modelle aus der Gemini-Reihe auch, hat Google DeepMind keine Weights für 3.5-Flash veröffentlicht. Schade, da das Modell sicherlich für Fine-Tuning interessant gewesen wäre. Als Alternativen kann man auf Gemma 4 (kleineres Modell) oder Minimax-M3 zurückgreifen.
Vergleiche Gemini 3.5 Flash mit anderen LLMs
Vergleiche Gemini 3.5 Flash mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst Google DeepMind Gemini 3.5 Flash über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.