Alle AI-Trends
Direkt in dein Postfach
Erhalte exklusive AI-Tutorials, Praxistipps und KI-News direkt in dein Postfach.
*Mit deiner Anmeldung akzeptierst du unsere Datenschutzrichtlinien.
Jetzt neu bei Byte: Werde Teil der größten AI-Community in Deutschland

Gemini 2.5 Pro

Veröffentlichung
Juni 2025
Knowledge Cutoff
Januar 2025
Parameter
Unbekannt
Modellfamilie
Gemini 2.5 Pro
Proprietär

Gemini 2.5 Flash Modell-Übersicht

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

Max. Input
1,05 Mio. Token
Max. Output
65,54k Token
Trainingsdaten
Unbekannt
Parameter
Unbekannt
Input Preis
$0.30
Output Preis
$2.50
Vokabular
Unbekannt
Dateigröße
Unbekannt

Gemini 2.5 Flash Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.



Technologie & Daten

Technische Spezifikationen

ArchitekturHybrider MoE-Transformer
Input Kontextlänge1,05 Mio.
Output Kontextlänge65,54k
TokenizerSentencePiece-Unigram-Tokenizer

Besonderheiten

Besonderheit 1Adaptive Thinking
Besonderheit 2Tool-Use Kapazitäten
Besonderheit 3Großes Kontextfenster

Vorteile & Nachteile

Vorteile

  • Extrem großes Kontextfenster
    Mit bis zu 1 Mio. Tokens kann Gemini 2.5 Flash ganze Codebasen oder Bücher als Input verarbeiten.
  • Günstige Preise
    Im Gegensatz zu Gemini 2.5 Pro werden die Kosten bei größeren Kontextfenstern für Gemini 2.5 Flash nicht erhöht.
  • Unterstützt viele Modalitäten
    Neben Text- und Bildeingaben kann Gemini 2.5 Flash auch Audio- und Video-Input nativ im selben Modell verarbeiten.
  • Flexibles Reasoning
    Das hybride Reasoning-LLM lässt sich stufenweise konfigurieren, sodass hochkomplexe Aufgaben genauso sorgfältig bearbeitet werden, wie kleinere Tasks schnell umgesetzt werden können.
  • Hohe Geschwindigkeit
    Gemini 2.5 Flash bietet selbst mit aktiviertem "Thinking" einen hohen Token-Throughput von ca. 100 Token pro Sekunde.

Nachteile

  • Geringer Output
    Mit nur 64k Token ist die Länge des Outputs in Gemini 2.5 Flash deutlich eingeschränkt.
  • API für Entwickler unübersichtlich
    Die Einrichtung sowie der Zugriff auf API-Schnittstellen ist bei Google deutlich umständlicher, als bei anderen LLM-Entwicklern.

Vergleiche Gemini 2.5 Flash mit anderen LLMs

Vergleiche Gemini 2.5 Flash mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.


Alle Modelle vergleichen

Provider & APIs

Du kannst Google DeepMind Gemini 2.5 Flash über die API folgender Anbieter nutzen.

Das Modell ist derzeit bei keinen Anbietern verfügbar.