GLM 5.2 von Z.ai

GLM 5.2 Modell-Übersicht

GLM-5.2 ist das aktuelle Flaggschiff von Z.ai (ehemals Zhipu AI) und folgt auf GLM-5.1. Im Vergleich zum Vorgänger kann GLM-5.2 mit Kontextfenstern von bis zu 1 Mio. Token arbeiten und kombiniert dabei zwei verschiedene Thinking-Effort-Stufen (High und Max). Z.ai positioniert das Modell klar für Agentic Coding über ganze Repositories hinweg. Anwendungsgebiete sind z.B. Refactorings, die Quellcode, Tests und Konfiguration gemeinsam im Kontext halten. GLM-5.2 setzt sich an die Spitze der Open Weights Modelle und überholt laut namhaften Researchern wie Jeremy Howard teilweise sogar proprietäre Modelle wie Claude Opus 4.8 oder GPT-5.5.

Playground API Dokumentation Hugging Face

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

1,05 Mio. Token

131,07k Token

Unbekannt

753 Mrd.

$1.40

$4.40

154,88k

1403,19 GB

GLM 5.2 Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.

Technologie & Daten

Technische Spezifikationen

Architektur	MoE-Transformer
Input Kontextlänge	1,05 Mio.
Output Kontextlänge	131,07k
Tokenizer	Proprietärer GLM-Tokenizer

Besonderheiten

Großes Kontextfenster	Bis zu 1 Mio. Token Kontextfenster, 5x von GLM-5.1
Anthropic-kompatibler Endpoint	Lässt sich über einen Anthropic-kompatiblen Endpoint und das Model Context Protocol (MCP) in bestehende Agent-Workflows einbinden.
Context Caching	Implizites Caching senkt die Kosten wiederkehrender Kontexte in langen Konversationen.

Vorteile & Nachteile

Vorteile

Großes 1 Mio. Token-Kontextfenster
Mit 1 Mio. Token fasst GLM-5.2 das Fünffache von GLM-5.1 (200K) und kann ein mittelgroßes Repository inklusive Tests und Verlauf in einer Session halten, statt ständig zusammenzufassen.
Deutlich günstiger als westliche Frontier-Modelle
Mit $1,40 / $4,40 pro 1 Mio. Input-/Output-Token und Cached Input für $0,26/M liegt GLM-5.2 deutlich unter vergleichbaren Modellen. Der GLM Coding Plan startet bei $18/Monat.
Offene Gewichte unter MIT-Lizenz
Die Weights von GLM-5.2 sind frei unter der MIZ-Lizenz (kommerziell) nutzbar und lokal deploybar, insofern man die notwendige Hardware aufbringen kann.
Breite Agentic-Coding-Integration
Über einen Anthropic-kompatiblen Endpoint und MCP arbeitet GLM-5.2 direkt mit Claude Code, Cline, OpenCode, Roo Code, Kilo Code, Crush und Goose zusammen.

Nachteile

Nur Text, keine Bildverarbeitung
GLM-5.2 verarbeitet ausschließlich Text. Für Vision-Aufgaben verweist Z.ai auf separate Modelle wie GLM-5V-Turbo, was der Haupt-Nachteil von GLM-5.2 ist.

Vergleiche GLM 5.2 mit anderen LLMs

Vergleiche GLM 5.2 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.

Entwickler	Modell⇅	Lizenz⇅	Parameter ⇅	Input-Tokens ⇅	Output-Tokens ⇅	Input-Preis ⇅	Output-Preis ⇅	Veröffentlichung
Z.ai	GLM 5.2	MIT	753 Mrd.	1,05 Mio.	131,07k	$1.40	$4.40	16.06.2026
Anthropic	Claude Fable 5	Proprietär	Unbekannt	1 Mio.	128k	$10.00	$50.00	09.06.2026
MiniMax	MiniMax M3	Andere	Unbekannt	1 Mio.	512k	$0.60	$2.40	01.06.2026
Anthropic	Claude Opus 4.8	Proprietär	Unbekannt	1 Mio.	128k	$5.00	$25.00	28.05.2026
Google DeepMind	Gemini 3.5 Flash	Proprietär	Unbekannt	1,05 Mio.	65,54k	$1.50	$9.00	19.05.2026
DeepSeek AI	DeepSeek-V4-Pro	MIT	1.600 Mrd.	1 Mio.	384k	$1.74	$0.87	24.04.2026
OpenAI	GPT-5.5	Proprietär	Unbekannt	1,05 Mio.	128k	$5.00	$30.00	23.04.2026
Moonshot AI	Kimi K2.6	MIT	1.000 Mrd.	262,14k	262,14k	$0.75	$3.50	20.04.2026
Anthropic	Claude Opus 4.7	Proprietär	Unbekannt	1 Mio.	128k	$5.00	$25.00	16.04.2026
Meta AI	Muse Spark	Proprietär	Unbekannt	262k	unbekannt	unbekannt	unbekannt	08.04.2026

‌
Alle Modelle vergleichen

Provider & APIs

Du kannst Z.ai GLM 5.2 über die API folgender Anbieter nutzen.

Zai
Token (in)
Unbekannt
Token (out)
Unbekannt
Latenz
Unbekannt
USD / 1M Input
$1.40
USD / 1M Output
$4.40
Throughput
Unbekannt

‌
‌
‌