Alle AI-Trends
Direkt in dein Postfach
Erhalte exklusive AI-Tutorials, Praxistipps und KI-News direkt in dein Postfach.
*Mit deiner Anmeldung akzeptierst du unsere Datenschutzrichtlinien.
Jetzt neu: Byte Pulse – Token-Limits von Claude Code, Codex & Co. tracken! 

GLM 5.2

Veröffentlichung
Juni 2026
Knowledge Cutoff
Unbekannt
Parameter
753 Mrd.
Modellfamilie
GLM 5.2
MIT

GLM 5.2 Modell-Übersicht

GLM-5.2 ist das aktuelle Flaggschiff von Z.ai (ehemals Zhipu AI) und folgt auf GLM-5.1. Im Vergleich zum Vorgänger kann GLM-5.2 mit Kontextfenstern von bis zu 1 Mio. Token arbeiten und kombiniert dabei zwei verschiedene Thinking-Effort-Stufen (High und Max). Z.ai positioniert das Modell klar für Agentic Coding über ganze Repositories hinweg. Anwendungsgebiete sind z.B. Refactorings, die Quellcode, Tests und Konfiguration gemeinsam im Kontext halten. GLM-5.2 setzt sich an die Spitze der Open Weights Modelle und überholt laut namhaften Researchern wie Jeremy Howard teilweise sogar proprietäre Modelle wie Claude Opus 4.8 oder GPT-5.5.

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

Max. Input
1,05 Mio. Token
Max. Output
131,07k Token
Trainingsdaten
Unbekannt
Parameter
753 Mrd.
Input Preis
$1.40
Output Preis
$4.40
Vokabular
154,88k
Dateigröße
1403,19 GB

GLM 5.2 Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.

Technologie & Daten

Technische Spezifikationen

ArchitekturMoE-Transformer
Input Kontextlänge1,05 Mio.
Output Kontextlänge131,07k
TokenizerProprietärer GLM-Tokenizer

Besonderheiten

Großes KontextfensterBis zu 1 Mio. Token Kontextfenster, 5x von GLM-5.1
Anthropic-kompatibler EndpointLässt sich über einen Anthropic-kompatiblen Endpoint und das Model Context Protocol (MCP) in bestehende Agent-Workflows einbinden.
Context CachingImplizites Caching senkt die Kosten wiederkehrender Kontexte in langen Konversationen.

Vorteile & Nachteile

Vorteile

  • Großes 1 Mio. Token-Kontextfenster
    Mit 1 Mio. Token fasst GLM-5.2 das Fünffache von GLM-5.1 (200K) und kann ein mittelgroßes Repository inklusive Tests und Verlauf in einer Session halten, statt ständig zusammenzufassen.
  • Deutlich günstiger als westliche Frontier-Modelle
    Mit $1,40 / $4,40 pro 1 Mio. Input-/Output-Token und Cached Input für $0,26/M liegt GLM-5.2 deutlich unter vergleichbaren Modellen. Der GLM Coding Plan startet bei $18/Monat.
  • Offene Gewichte unter MIT-Lizenz
    Die Weights von GLM-5.2 sind frei unter der MIZ-Lizenz (kommerziell) nutzbar und lokal deploybar, insofern man die notwendige Hardware aufbringen kann.
  • Breite Agentic-Coding-Integration
    Über einen Anthropic-kompatiblen Endpoint und MCP arbeitet GLM-5.2 direkt mit Claude Code, Cline, OpenCode, Roo Code, Kilo Code, Crush und Goose zusammen.

Nachteile

  • Nur Text, keine Bildverarbeitung
    GLM-5.2 verarbeitet ausschließlich Text. Für Vision-Aufgaben verweist Z.ai auf separate Modelle wie GLM-5V-Turbo, was der Haupt-Nachteil von GLM-5.2 ist.

Vergleiche GLM 5.2 mit anderen LLMs

Vergleiche GLM 5.2 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.


Alle Modelle vergleichen

Provider & APIs

Du kannst Z.ai GLM 5.2 über die API folgender Anbieter nutzen.