Alle AI-Trends
Direkt in dein Postfach
Erhalte exklusive AI-Tutorials, Praxistipps und KI-News direkt in dein Postfach.
*Mit deiner Anmeldung akzeptierst du unsere Datenschutzrichtlinien.
Jetzt neu bei Byte: Unser WhatsApp Channel 📱

Gemini 3.1 Flash-Lite

Veröffentlichung
März 2026
Knowledge Cutoff
Januar 2025
Parameter
Unbekannt
Modellfamilie
Gemini 3.1 Flash-Lite
Proprietär

Gemini 3.1 Flash-Lite Modell-Übersicht

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

Max. Input
1,05 Mio. Token
Max. Output
65,54k Token
Trainingsdaten
Unbekannt
Parameter
Unbekannt
Input Preis
$0.25
Output Preis
$1.50
Vokabular
Unbekannt
Dateigröße
Unbekannt

Gemini 3.1 Flash-Lite Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.



Technologie & Daten

Technische Spezifikationen

ArchitekturTransformer
Input Kontextlänge1,05 Mio.
Output Kontextlänge65,54k
TokenizerGoogle SentencePiece Tokenizer

Besonderheiten

Anpassbare Thinking LevelsVier Reasoning-Stufen: Minimal, Low, Medium und High.
Search GroundingIntegrierte Google-Suche
Code ExecutionNatives Ausführen von Code innerhalb der API-Umgebung.

Vorteile & Nachteile

Vorteile

  • Extrem kosteneffizient
    Mit nur $0,25/ 1 Mio. Input- und $1,50 / Mio. Output-Tokens ist Gemini 3.1 Flash-Lite ca. 8x günstiger als Gemini 3.1 Pro und lässt sich für viele reale Anwendungsfälle nutzen.
  • Hohe Geschwindigkeit
    Laut Angaben von Google DeepMind erreicht Gemini 3.1 Flash-Lite bis zu 363 Token pro Sekunde. Kombiniert mit der schnellen Time-to-First-Token Geschwindigkeit lässt sich das Modell damit hervorragend für Low-Latency-Apps verwenden.
  • 1M Token Kontextfenster
    Mit bis zu 1 Million Token (multimodalem) Kontext kann Gemini 3.1 Flash-Lite große Kontexte verarbeiten.
  • Starke multimodale Fähigkeiten
    3.1 Flash-Lite verarbeitet Text, Bilder, Audio, Video und PDFs. Dabei erreicht es in vielen Multimodal-Benchmarks starke Ergebnisse (VideoMMMU: 84,8 %, MMMU-Pro: 76,8 %).

Nachteile

  • Preview-Version
    Wie von Google bereits bekannt, wird auch Gemini 3.1 Flash-Lite zunächst als Preview-Version veröffentlicht. Änderungen an der API oder der erwarteten Output-Qualität ist damit möglich.
  • Nur bis zu 64k Text-Output
    Trotz multimodaler Eingabe beschränkt sich die Ausgabe von Gemini 3.1 Flash-Lite auf eher niedrige 64k Token Text-Output.
  • Proprietäres Modell
    Das Modell ist ausschließlich über Googles APIs nutzbar und kann nicht lokal betrieben werden. Auch Fine-Tuning von Gemini 3.1 Flash-Lite ist nicht möglich.

Vergleiche Gemini 3.1 Flash-Lite mit anderen LLMs

Vergleiche Gemini 3.1 Flash-Lite mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.


Alle Modelle vergleichen

Provider & APIs

Du kannst Google DeepMind Gemini 3.1 Flash-Lite über die API folgender Anbieter nutzen.

Das Modell ist derzeit bei keinen Anbietern verfügbar.