Gemini 2.5 Pro
Veröffentlichung
Juli 2025
Knowledge Cutoff
Januar 2025
Parameter
Unbekannt
Modellfamilie
Gemini 2.5 Pro
Proprietär
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Max. Input
1,05 Mio. Token
Max. Output
65,54k Token
Trainingsdaten
Unbekannt
Parameter
Unbekannt
Input Preis
$0.10
Output Preis
$0.40
Vokabular
Unbekannt
Dateigröße
Unbekannt
Gemini 2.5 Flash-Lite Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
Architektur | Hybrider MoE-Transformer |
---|---|
Input Kontextlänge | 1,05 Mio. |
Output Kontextlänge | 65,54k |
Tokenizer | SentencePiece-Unigram-Tokenizer |
Besonderheiten
Besonderheit 1 | Geringe Latenz |
---|---|
Besonderheit 2 | Tool-Use Kapazitäten |
Besonderheit 3 | Kosteneffizienz |
Vorteile & Nachteile
Vorteile
- Extrem großes KontextfensterMit bis zu 1 Mio. Tokens kann Gemini 2.5 Flash-Lite ganze Codebasen oder Bücher als Input verarbeiten.
- Sehr kostengünstigIm Gegensatz zu Gemini 2.5 Pro werden die Kosten bei größeren Kontextfenstern für Gemini 2.5 Flash-Lite nicht erhöht.
- Unterstützt viele ModalitätenGemini 2.5 Flash-Lite unterstützt sowohl Text-, Bild- Audio- als auch Video-Inputs.
- Flexibles ReasoningDas hybride Reasoning-LLM lässt sich stufenweise konfigurieren, sodass hochkomplexe Aufgaben genauso sorgfältig bearbeitet werden, wie kleinere Tasks schnell umgesetzt werden können.
- Sehr Hohe GeschwindigkeitGemini 2.5 Flash-Lite bietet selbst mit aktiviertem "Thinking" einen hohen Token-Throughput von über 100 Token pro Sekunde.
Nachteile
- Limitierte Output-QualitätDurch den Fokus auf Geschwindigkeit eignet sich Gemini 2.5 Flash-Lite weniger für komplexe Tasks, bei denen eine hohe Korrektheit vorausgesetzt wird.
- Eingeschränkte Output-LängeMit nur 64k Token ist die Länge des Outputs in Gemini 2.5 Flash-Lite deutlich eingeschränkt.
- API für Entwickler unübersichtlichDie Einrichtung sowie der Zugriff auf API-Schnittstellen ist bei Google deutlich umständlicher, als bei anderen LLM-Entwicklern.
Vergleiche Gemini 2.5 Flash-Lite mit anderen LLMs
Vergleiche Gemini 2.5 Flash-Lite mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst Google DeepMind Gemini 2.5 Flash-Lite über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.