GLM-5 Modell-Übersicht

GLM-5 ist das neue SOTA-Modell von Z.ai (ehemals Zhipu AI) und der Nachfolger von GLM-4.7. GLM-5 wurde am 11. Februar 2026 veröffentlicht und gilt zum Zeitpunkt der Veröffentlichung als das beste Open-Weights Modell, das sich herunterladen und sich lokal auf Rechnern ausführen lässt. Mit 744 Milliarden Parametern (40B aktiv) in einer Mixture-of-Experts-Architektur wurde es laut Z.ai vollständig auf Huawei Ascend Chips trainiert. Es gilt damit als erstes Frontier-MoE-Modell, das komplett ohne NVIDIA-Hardware trainiert werden konnte. GLM-5 integriert den Sparse Attention Mechanismus von DeepSeek für effiziente Verarbeitung langer Inputs sowie eine eigene Reinforcement-Learning Struktur für das Post-Training. GLM-5 übertrifft teilweise die Benchmark Scores westlicher Modelle und weist laut ArtificialAnalysis.ai die niedrigsten Halluzinationsraten aktueller Frontier-Modelle auf. Zusammen mit MiniMax-M2.5 (zeitgleich veröffentlicht) führt GLM-5 die Benchmarks der Open-Source LLMs an.

Playground API Dokumentation Hugging Face GitHub System Card Blog

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

200k Token

128k Token

28.500 Mrd.

744 Mrd.

$1.00

$3.20

154,88k

1404,19 GB

GLM-5 Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.

GLM-5 Benchmark Übersicht

GLM-5 Performance im Vergleich zu anderen KI-Modellen

Benchmark	GLM-5	GLM-4.7	GLM-5.1	GPT-5.3-Codex	MiniMax-M2.5	Claude Fable 5	MiniMax M3
GPQA DiamondWissen & Sprache	86 %	85,7 %	86,2 %	—	85,2 %	93,2 %	—
SWE-bench VerifiedProgrammierung	77,8 %	73,8 %	—	—	80,2 %	Top 95 %	80,5 %
τ²-BenchAgentische Aufgaben	89,7 %	87,4 %	70,6 %	—	—	—	—

Ergebnisse in Benchmarks

Benchmark auswählen

Darstellung der Rohdaten für den Benchmark GPQA Diamond. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
Claude Mythos Preview	94,5 %
Gemini 3.1 Pro	94,3 %
Claude Opus 4.7	94,2 %
Claude Opus 4.8	93,6 %
GPT-5.5	93,6 %
Claude Fable 5	93,18 %
GPT-5.4	92,8 %
Claude Opus 4.6	91,3 %
Kimi K2.6	90,5 %
DeepSeek-V4-Pro (Preview)	90,1 %
Claude Sonnet 4.6	89,9 %
Muse Spark	89,5 %
Kimi K2.5 (Thinking)	87,6 %
Gemini 3.1 Flash-Lite	86,9 %
GLM-5.1	86,2 %
GLM-5	86 %
MiniMax M2.5	85,2 %
Gemma 4 31B	84,3 %
GPT-5.4 nano	82,83 %
GPT-5.4 mini	81,57 %

Vergleich von LLMs im Benchmark GPQA Diamond. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark SWE-bench Verified. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
Claude Fable 5	95 %
Claude Mythos Preview	93,9 %
Claude Opus 4.8	88,6 %
Claude Opus 4.7	87,6 %
Claude Opus 4.5	80,9 %
Claude Opus 4.6	80,8 %
DeepSeek-V4-Pro (Preview)	80,6 %
Gemini 3.1 Pro	80,6 %
MiniMax-M3	80,5 %
Kimi K2.6	80,2 %
MiniMax M2.5	80,2 %
GPT-5.2	80 %
MiniMax M2.7	79,9 %
Claude Sonnet 4.6	79,6 %
GLM-5	77,8 %
Muse Spark	77,4 %
Kimi K2.5 (Thinking)	76,8 %
Qwen3.5-397B-A17B	76,4 %
MiniMax M2.1	74 %
GLM-4.7	73,8 %

Vergleich von LLMs im Benchmark SWE-bench Verified. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark τ²-Bench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
Claude Opus 4.6	95,6 %
Gemini 3.1 Pro	95,1 %
Claude Sonnet 4.6	94,8 %
Claude Opus 4.5	93,55 %
Muse Spark	91,5 %
GPT-5.2	90,35 %
GLM-5	89,7 %
GPT-5.4 nano	88,38 %
GLM-4.7	87,4 %
MiniMax M2.1	87 %
Qwen3.5-397B-A17B	86,7 %
Gemini 3 Pro	85,4 %
DeepSeek-v3.2 Thinking	80,3 %
GPT-5.1	80,2 %
MiniMax-M2	77,2 %
Gemma 4 31B	76,9 %
Claude Haiku 4.5	76,6 %
GPT-5.4 mini	74,1 %
GLM-5.1	70,6 %
Nemotron 3 Super	61,15 %

Vergleich von LLMs im Benchmark τ²-Bench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

‌
‌

Technologie & Daten

Technische Spezifikationen

Architektur	MoE-Transformer
Input Kontextlänge	200k
Output Kontextlänge	128k
Tokenizer	GLM Tokenizer

Besonderheiten

Neue Reinforcement-Learning-Infrastruktur	"Slime" (asynchrones RL)
Attention Mechanismus	DeepSeek Sparse Attention (DSA)
Adaptive Thinking Mode	Auswahlmöglichkeiten aus verschiedenen Reasoning-Modi

Vorteile & Nachteile

Vorteile

Führendes Open-Source-Modell
GLM-5 ist das erste Open-Weight-Modell, das einen Score von 50+ auf dem Artificial Analysis Intelligence Index erreicht. Es liegt auf einem Level mit proprietären westlichen Modellen wie Opus-4.5 und GPT-5.2 (high
Niedrige Halluzinationsrate
GLM-5 erreicht die niedrigste jemals gemessene Halluzinationsrate aller von ArtificialAnalysis.ai getesteten Modelle.
Starke Coding- und Agent-Fähigkeiten
GLM-5 erreicht mit 77,8% im SWE-bench Verified, 75,9 in BrowseComp (Top-Platzierung) und 89,7% im τ²-Benchmark hervorragende Ergebnisse, auf dem Level proprietärer Modelle.
Open Weights unter MIT-Lizenz
Z.ai veröffentlicht GLM-5 vollständig open-source auf HuggingFace. Du kannst die Gewichte herunterladen und das Modell lokal deployen und ausführen, vorausgesetzt, deine Hardware ist stark genug. Kommerzielle Nutzung erlaubt.
Unabhängig von NVIDIA-Hardware
Dass GLM-5 angeblich ohne NVIDIA Hardware trainiert werden konnte, könnte einen Durchbruch im LLM-Training bedeuten. Die Abhängigkeit chinesischer Modelle von US-Firmen wird immer weiter abgebaut.
Gutes Preis-/Leistungsverhältnis
Mit $1,00 / $3,20 pro Million Input- / Output-Tokens ist GLM-5 deutlich günstiger als vergleichbare Frontier-Modelle von Anthropic oder OpenAI.

Nachteile

Nur Text-Input
GLM-5 ist kein multimodales LLM. Für Bilder / Computer Vision wird ein separates Modell, vmtl zukünftig GLM-5V benötigt.
Sehr hohe Hardware-Anforderungen
In BF16-Präzision ist GLM-5 ca. 1,51 TB groß. Um das Modell lokal ausführen zu können, muss man damit rechnen, dass mind. 8 leistungsstarke GPUs benötigt werden.
Politischer Bias
Wie bei anderen chinesischen Modellen auch, muss davon ausgegangen werden, dass das Modelle unter politischen Einflüssen trainiert wurde und entsprechend eine Interpretation der Historie Chinas widergibt.

Vergleiche GLM-5 mit anderen LLMs

Vergleiche GLM-5 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.

Entwickler	Modell⇅	Lizenz⇅	Parameter ⇅	Input-Tokens ⇅	Output-Tokens ⇅	Input-Preis ⇅	Output-Preis ⇅	Veröffentlichung
Anthropic	Claude Fable 5	Proprietär	Unbekannt	1 Mio.	128k	$10.00	$50.00	09.06.2026
MiniMax	MiniMax M3	Andere	Unbekannt	1 Mio.	512k	$0.60	$2.40	01.06.2026
Anthropic	Claude Opus 4.8	Proprietär	Unbekannt	1 Mio.	128k	$5.00	$25.00	28.05.2026
Google DeepMind	Gemini 3.5 Flash	Proprietär	Unbekannt	1,05 Mio.	65,54k	$1.50	$9.00	19.05.2026
DeepSeek AI	DeepSeek-V4-Pro	MIT	1.600 Mrd.	1 Mio.	384k	$1.74	$0.87	24.04.2026
OpenAI	GPT-5.5	Proprietär	Unbekannt	1,05 Mio.	128k	$5.00	$30.00	23.04.2026
Moonshot AI	Kimi K2.6	MIT	1.000 Mrd.	262,14k	262,14k	$0.75	$3.50	20.04.2026
Anthropic	Claude Opus 4.7	Proprietär	Unbekannt	1 Mio.	128k	$5.00	$25.00	16.04.2026
Meta AI	Muse Spark	Proprietär	Unbekannt	262k	unbekannt	unbekannt	unbekannt	08.04.2026
Z.ai	GLM-5	MIT	744 Mrd.	200k	128k	$1.00	$3.20	11.02.2026

‌
Alle Modelle vergleichen

Provider & APIs

Du kannst Z.ai GLM-5 über die API folgender Anbieter nutzen.

Das Modell ist derzeit bei keinen Anbietern verfügbar.

GLM-5 Modell-Übersicht

Features

Tools

Multimodalität

Finetuning

Details zum Modell

GLM-5 Benchmark Scores

GLM-5 Benchmark Übersicht

Wissen & Sprache

Programmierung

Agentische Aufgaben

GLM-5 Performance im Vergleich zu anderen KI-Modellen

Ergebnisse in Benchmarks

Technologie & Daten

Technische Spezifikationen

Besonderheiten

Vorteile & Nachteile

Vorteile

Nachteile

Vergleiche GLM-5 mit anderen LLMs

Provider & APIs

GLM-5 Benchmark Übersicht

Wissen & Sprache

Programmierung

Agentische Aufgaben

GLM-5 Performance im Vergleich zu anderen KI-Modellen

Ergebnisse in Benchmarks