Alle AI-Trends
Direkt in dein Postfach
Erhalte exklusive AI-Tutorials, Praxistipps und KI-News direkt in dein Postfach.
*Mit deiner Anmeldung akzeptierst du unsere Datenschutzrichtlinien.
Jetzt neu bei Byte: Unser WhatsApp Channel 📱

Gemini 3.5 Flash

Veröffentlichung
Mai 2026
Knowledge Cutoff
Januar 2026
Parameter
Unbekannt
Modellfamilie
Gemini 3.5 Flash
Proprietär

Gemini 3.5 Flash Modell-Übersicht

Gemini 3.5 Flash wurde als erstes Modell der Gemini-3.5-Familie von Google DeepMind am 19.05.2026 vorgestellt. Gemini 3.5 Flash erreicht beinahe die Reasoning- und Coding-Kapazitäten von der großen Gemini 3.1 Pro Version, ist dabei aber deutlich günstiger und schneller. Das Modell wurde für das Coding und den Einsatz als KI-Agent ausgelegt und überzeugt v.a. durch das gute Preis- / Leistungsverhältnis.

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

Max. Input
1,05 Mio. Token
Max. Output
65,54k Token
Trainingsdaten
Unbekannt
Parameter
Unbekannt
Input Preis
$1.50
Output Preis
$9.00
Vokabular
Unbekannt
Dateigröße
Unbekannt

Gemini 3.5 Flash Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.



Technologie & Daten

Technische Spezifikationen

ArchitekturMultimodaler Transformer
Input Kontextlänge1,05 Mio.
Output Kontextlänge65,54k
TokenizerProprietärer Gemini Tokenizer

Besonderheiten

Dynamic ThinkingKonfigurierbares Reasoning-System
Combined Tool UseMehrere Tools in einer Anfrage, inkl. Google Search, Google Maps, File Search, Code Execution etc.

Vorteile & Nachteile

Vorteile

  • Starke Ergebnisse in Agentic Benchmarks
    Gemini 3.5 Flash erreicht in Agentischen Benchmarks sehr gute Ergebnisse. 83,6% in MCP Atlas, 76,2% auf Terminal-Bench 2.1 und 1656 Elo in GDPval-AA. Übertrifft Gemini-3.1 Pro also deutlich, trotz der kleineren Größe.
  • Sehr hohe Geschwindigkeit
    Gemini 3.5 Flash ist bis zu 4x schneller als vergleichbare Frontier-Modelle, was den Token-Output pro Sekunde angeht.
  • Sehr gutes Preis- / Leistungsverhältnis
    Mit $1.50/$9.00 pro 1 Mio. Tokens ist Gemini 3.5 Flash rund 40% günstiger als Gemini 3.1 Pro und ca. 66% günstiger als GPT-5.5. Context Caching reduziert den Preis für betroffene Inputs um weitere 90%.
  • Großes Kontextfenster
    Mit 1 Mio. Tokens maximalem Kontextfenster übertrifft Gemini 3.5 Flash Modelle vermutlich ähnlicher Größe, wie Claude Sonnet 4.6, um ein Weites.

Nachteile

  • Schwächer bei reiner Long-Context-Retrieval & Reasoning
    Long-Context-Retrieval Benchmarks wie MRCR v2 zeigen die Schwächen des kleineren Modells auf. Mit 1 Mio. Kontextfenster erreicht Gemini 3.5 Flash nur 26,6%, bei 128k Kontextfenster 77,3% (vs. 84,9% bei Gemini 3.1 Pro). Auch bei reinen Reasoning-Benchmarks wie GPQA Diamond und Humanity's Last Exam (40,2%) führt weiterhin Gemini 3.1 Pro.
  • Preisanstieg im Vergleich zu Gemini 3.0 Flash
    Mit $1.50/$9.00 rund 3x teurer als Gemini 3 Flash (Preview). Ähnliche Preissteigerungen konnten auch bei OpenAI und Anthropic beobachtet werden, allerdings nicht in dieser Höhe.
  • Viele Tokens zum Lösen von Aufgaben notwendig
    Gemini 3.5 Flash benötigt vergleichsweise viele Output-Tokens (ca. 73 Mio. im AA Intelligence-Index-Benchmark vs. ~35 Mio. Durchschnitt), was letztendlich zu höheren Gesamtkosten bei komplexeren Aufgaben führt.
  • Proprietäres KI-Modell ohne Open Weights
    Wie andere Modelle aus der Gemini-Reihe auch, hat Google DeepMind keine Weights für 3.5-Flash veröffentlicht. Schade, da das Modell sicherlich für Fine-Tuning interessant gewesen wäre. Als Alternativen kann man auf Gemma 4 (kleineres Modell) oder Minimax-M3 zurückgreifen.

Vergleiche Gemini 3.5 Flash mit anderen LLMs

Vergleiche Gemini 3.5 Flash mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.


Alle Modelle vergleichen

Provider & APIs

Du kannst Google DeepMind Gemini 3.5 Flash über die API folgender Anbieter nutzen.

Das Modell ist derzeit bei keinen Anbietern verfügbar.