Gemini 2.5 Pro

Veröffentlichung

Juni 2025

Knowledge Cutoff

Januar 2025

Parameter

Unbekannt

Modellfamilie

Gemini 2.5 Pro

Proprietär

Zum Modell

Gemini 2.5 Flash Modell-Übersicht

Playground API Referenz Blog Model Card Technischer Report

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

Max. Input

1,05 Mio. Token

Max. Output

65,54k Token

Trainingsdaten

Unbekannt

Parameter

Unbekannt

Input Preis

$0.30

Output Preis

$2.50

Vokabular

Unbekannt

Dateigröße

Unbekannt

Gemini 2.5 Flash Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.

Ergebnisse in Benchmarks

Benchmark auswählen

Darstellung der Rohdaten für den Benchmark Aider Polyglot. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
Claude Opus 4.5	89,4 %
GPT-5	88 %
GPT-5 Pro	88 %
OpenAI o3-mini	60,4 %
OpenAI o4-mini	58,2 %
Gemini 2.5 Flash	56,7 %
GPT-5 nano	48,4 %
Qwen3 30B A3B Instruct 2507	35,6 %

Vergleich von LLMs im Benchmark Aider Polyglot. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark American Invitational Mathematics Examination 2025. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
Grok-4 Heavy	100 %
GPT-5	99,6 %
Grok-4	98,8 %
MiniMax-M2	78 %
Claude Opus 4	75,5 %
Gemini 2.5 Flash	72 %
Claude Sonnet 4	70,5 %
Gemini 2.5 Flash-Lite	63,1 %

Vergleich von LLMs im Benchmark American Invitational Mathematics Examination 2025. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark LiveCodeBench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
DeepSeek-v3.2 Speciale	88,7 %
DeepSeek-v3.2 Thinking	83,3 %
Kimi K2 Thinking	83,1 %
GLM-4.5	72,9 %
GLM-4.5 Air	70,7 %
Gemini 2.5 Flash	59,3 %
Claude Sonnet 4	55,9 %
Kimi K2 (0905)	53,7 %

Vergleich von LLMs im Benchmark LiveCodeBench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark SWE-bench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
Claude Opus 4.5	80,9 %
Claude Sonnet 4.5	77,2 %
GPT-5.1	76,3 %
OpenAI o3-mini	49,3 %
DeepSeek-R1-0120	49,2 %
Gemini 2.5 Flash	48,9 %

Vergleich von LLMs im Benchmark SWE-bench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

‌
‌

Technologie & Daten

Technische Spezifikationen

Architektur	Hybrider MoE-Transformer
Input Kontextlänge	1,05 Mio.
Output Kontextlänge	65,54k
Tokenizer	SentencePiece-Unigram-Tokenizer

Besonderheiten

Besonderheit 1	Adaptive Thinking
Besonderheit 2	Tool-Use Kapazitäten
Besonderheit 3	Großes Kontextfenster

Vorteile & Nachteile

Vorteile

Extrem großes Kontextfenster
Mit bis zu 1 Mio. Tokens kann Gemini 2.5 Flash ganze Codebasen oder Bücher als Input verarbeiten.
Günstige Preise
Im Gegensatz zu Gemini 2.5 Pro werden die Kosten bei größeren Kontextfenstern für Gemini 2.5 Flash nicht erhöht.
Unterstützt viele Modalitäten
Neben Text- und Bildeingaben kann Gemini 2.5 Flash auch Audio- und Video-Input nativ im selben Modell verarbeiten.
Flexibles Reasoning
Das hybride Reasoning-LLM lässt sich stufenweise konfigurieren, sodass hochkomplexe Aufgaben genauso sorgfältig bearbeitet werden, wie kleinere Tasks schnell umgesetzt werden können.
Hohe Geschwindigkeit
Gemini 2.5 Flash bietet selbst mit aktiviertem "Thinking" einen hohen Token-Throughput von ca. 100 Token pro Sekunde.

Nachteile

Geringer Output
Mit nur 64k Token ist die Länge des Outputs in Gemini 2.5 Flash deutlich eingeschränkt.
API für Entwickler unübersichtlich
Die Einrichtung sowie der Zugriff auf API-Schnittstellen ist bei Google deutlich umständlicher, als bei anderen LLM-Entwicklern.

Vergleiche Gemini 2.5 Flash mit anderen LLMs

Vergleiche Gemini 2.5 Flash mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.

Entwickler	Modell⇅	Lizenz⇅	Parameter ⇅	Input-Tokens ⇅	Output-Tokens ⇅	Input-Preis ⇅	Output-Preis ⇅	GPQA
DeepSeek AI	DeepSeek-v3.2 Speciale	MIT	685 Mrd.	131,07k	64k	$0.28	$0.42	88,7 %
DeepSeek AI	DeepSeek-v3.2	MIT	685 Mrd.	131,07k	64k	$0.28	$0.42	83,3 %
Moonshot AI	Kimi K2 Thinking	MIT	1.000 Mrd.	262,14k	262,14k	$0.60	$2.50	83,1 %
MiniMax	MiniMax-M2	MIT	230 Mrd.	204,8k	131,07k	$0.30	$1.20	83 %
Z.ai	GLM-4.6	MIT	355 Mrd.	200k	128k	$0.60	$2.00	82,8 %
xAI	Grok-4 Heavy	Proprietär	Unbekannt	256k	256k	$3.00	$15.00	79,4 %
xAI	Grok 4	Proprietär	Unbekannt	256k	256k	$3.00	$15.00	79,3 %
Google DeepMind	Gemini 2.5 Pro	Proprietär	Unbekannt	1,05 Mio.	65,54k	$1.25	$10.00	74,2 %
Alibaba	Qwen3	Apache 2.0	235 Mrd.	262,14k	81,92k	$0.13	$0.60	74,1 %
Google DeepMind	Unbekannt	Unbekannt	Unbekannt	unbekannt	unbekannt	unbekannt	unbekannt	59,3 %

‌
Alle Modelle vergleichen

Provider & APIs

Du kannst Google DeepMind Gemini 2.5 Flash über die API folgender Anbieter nutzen.

Das Modell ist derzeit bei keinen Anbietern verfügbar.