Gemini 2.5 Flash-Lite Modell-Übersicht

Gemini 2.5 Flash-Lite ist das kleinste LLM aus der Gemini 2.5 Modellfamilie. 2.5 Flash-Lite wurde auf Anwendungsfälle spezialisiert, die eine hohe Geschwindigkeit bei der Inferenz erfordern. Wie die anderen Gemini 2.5 Modelle auch, handelt es sich bei 2.5 Flash-Lite um ein hybrides Reasoning-Modell mit einem Input-Kontextfenster von 1 Mio. Tokens.

Playground API Referenz Blog Model Card Technischer Report

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

1,05 Mio. Token

65,54k Token

Unbekannt

$0.10

$0.40

Unbekannt

Gemini 2.5 Flash-Lite Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.

Gemini 2.5 Flash-Lite Benchmark Übersicht

Wissen & Sprache

GPQA Diamond

Gemini 2.5 Flash-Lite Performance im Vergleich zu anderen KI-Modellen

Benchmark	Gemini 2.5 Flash-Lite	Gemini 2.5 Pro	Gemini 3 Deep Think	Kimi K2	Qwen3	DeepSeek-V4-Pro	GPT-5.5
GPQA DiamondWissen & Sprache	82,8 %	86,4 %	93,8 %	—	—	90,1 %	93,6 %

Ergebnisse in Benchmarks

Benchmark auswählen

Darstellung der Rohdaten für den Benchmark GPQA Diamond. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
Claude Mythos Preview	94,5 %
Gemini 3.1 Pro	94,3 %
Claude Opus 4.7	94,2 %
GPT-5.5	93,6 %
GPT-5.4	92,8 %
Claude Opus 4.6	91,3 %
Kimi K2.6	90,5 %
DeepSeek-V4-Pro (Preview)	90,1 %
Claude Sonnet 4.6	89,9 %
Muse Spark	89,5 %
Kimi K2.5 (Thinking)	87,6 %
Gemini 3.1 Flash-Lite	86,9 %
GLM-5.1	86,2 %
GLM-5	86 %
MiniMax M2.5	85,2 %
Gemma 4 31B	84,3 %
MiniMax M2.1	83 %
GPT-5.4 nano	82,83 %
Gemini 2.5 Flash-Lite	82,8 %
GPT-5.4 mini	81,57 %

Vergleich von LLMs im Benchmark GPQA Diamond. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

‌
‌

Technologie & Daten

Technische Spezifikationen

Architektur	Hybrider MoE-Transformer
Input Kontextlänge	1,05 Mio.
Output Kontextlänge	65,54k
Tokenizer	SentencePiece-Unigram-Tokenizer

Besonderheiten

Besonderheit 1	Geringe Latenz
Besonderheit 2	Tool-Use Kapazitäten
Besonderheit 3	Kosteneffizienz

Vorteile & Nachteile

Vorteile

Extrem großes Kontextfenster
Mit bis zu 1 Mio. Tokens kann Gemini 2.5 Flash-Lite ganze Codebasen oder Bücher als Input verarbeiten.
Sehr kostengünstig
Im Gegensatz zu Gemini 2.5 Pro werden die Kosten bei größeren Kontextfenstern für Gemini 2.5 Flash-Lite nicht erhöht.
Unterstützt viele Modalitäten
Gemini 2.5 Flash-Lite unterstützt sowohl Text-, Bild- Audio- als auch Video-Inputs.
Flexibles Reasoning
Das hybride Reasoning-LLM lässt sich stufenweise konfigurieren, sodass hochkomplexe Aufgaben genauso sorgfältig bearbeitet werden, wie kleinere Tasks schnell umgesetzt werden können.
Sehr Hohe Geschwindigkeit
Gemini 2.5 Flash-Lite bietet selbst mit aktiviertem "Thinking" einen hohen Token-Throughput von über 100 Token pro Sekunde.

Nachteile

Limitierte Output-Qualität
Durch den Fokus auf Geschwindigkeit eignet sich Gemini 2.5 Flash-Lite weniger für komplexe Tasks, bei denen eine hohe Korrektheit vorausgesetzt wird.
Eingeschränkte Output-Länge
Mit nur 64k Token ist die Länge des Outputs in Gemini 2.5 Flash-Lite deutlich eingeschränkt.
API für Entwickler unübersichtlich
Die Einrichtung sowie der Zugriff auf API-Schnittstellen ist bei Google deutlich umständlicher, als bei anderen LLM-Entwicklern.

Vergleiche Gemini 2.5 Flash-Lite mit anderen LLMs

Vergleiche Gemini 2.5 Flash-Lite mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.

Entwickler	Modell⇅	Lizenz⇅	Parameter ⇅	Input-Tokens ⇅	Output-Tokens ⇅	Input-Preis ⇅	Output-Preis ⇅	Veröffentlichung
DeepSeek AI	DeepSeek-V4-Pro	MIT	1.600 Mrd.	1 Mio.	384k	$1.74	$0.87	24.04.2026
OpenAI	GPT-5.5	Proprietär	Unbekannt	1,05 Mio.	128k	$5.00	$30.00	23.04.2026
Moonshot AI	Kimi K2.6	MIT	1.000 Mrd.	262,14k	262,14k	$0.75	$3.50	20.04.2026
Anthropic	Claude Opus 4.7	Proprietär	Unbekannt	1 Mio.	128k	$5.00	$25.00	16.04.2026
Meta AI	Muse Spark	Proprietär	Unbekannt	262k	unbekannt	unbekannt	unbekannt	08.04.2026
Z.ai	GLM-5.1	MIT	744 Mrd.	202,75k	128k	$1.40	$4.40	07.04.2026
Anthropic	Claude Mythos	Proprietär	Unbekannt	1 Mio.	128k	$25.00	$125.00	07.04.2026
Google DeepMind	Gemma 4	Apache 2.0	30,7 Mrd.	262,14k	131,07k	$0.14	$0.40	02.04.2026
MiniMax	MiniMax M2.7	MIT	230 Mrd.	204,8k	131,07k	$0.30	$1.20	18.03.2026
Google DeepMind	Gemini 2.5 Pro	Proprietär	Unbekannt	1,05 Mio.	65,54k	$0.10	$0.40	22.07.2025

‌
Alle Modelle vergleichen

Provider & APIs

Du kannst Google DeepMind Gemini 2.5 Flash-Lite über die API folgender Anbieter nutzen.

Das Modell ist derzeit bei keinen Anbietern verfügbar.

‌
‌
‌