GLM-5
GLM-5 Modell-Übersicht
GLM-5 ist das neue SOTA-Modell von Z.ai (ehemals Zhipu AI) und der Nachfolger von GLM-4.7. GLM-5 wurde am 11. Februar 2026 veröffentlicht und gilt zum Zeitpunkt der Veröffentlichung als das beste Open-Weights Modell, das sich herunterladen und sich lokal auf Rechnern ausführen lässt. Mit 744 Milliarden Parametern (40B aktiv) in einer Mixture-of-Experts-Architektur wurde es laut Z.ai vollständig auf Huawei Ascend Chips trainiert. Es gilt damit als erstes Frontier-MoE-Modell, das komplett ohne NVIDIA-Hardware trainiert werden konnte. GLM-5 integriert den Sparse Attention Mechanismus von DeepSeek für effiziente Verarbeitung langer Inputs sowie eine eigene Reinforcement-Learning Struktur für das Post-Training. GLM-5 übertrifft teilweise die Benchmark Scores westlicher Modelle und weist laut ArtificialAnalysis.ai die niedrigsten Halluzinationsraten aktueller Frontier-Modelle auf. Zusammen mit MiniMax-M2.5 (zeitgleich veröffentlicht) führt GLM-5 die Benchmarks der Open-Source LLMs an.
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
GLM-5 Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | MoE-Transformer |
|---|---|
| Input Kontextlänge | 200k |
| Output Kontextlänge | 128k |
| Tokenizer | GLM Tokenizer |
Besonderheiten
| Neue Reinforcement-Learning-Infrastruktur | "Slime" (asynchrones RL) |
|---|---|
| Attention Mechanismus | DeepSeek Sparse Attention (DSA) |
| Adaptive Thinking Mode | Auswahlmöglichkeiten aus verschiedenen Reasoning-Modi |
Vorteile & Nachteile
Vorteile
- Führendes Open-Source-ModellGLM-5 ist das erste Open-Weight-Modell, das einen Score von 50+ auf dem Artificial Analysis Intelligence Index erreicht. Es liegt auf einem Level mit proprietären westlichen Modellen wie Opus-4.5 und GPT-5.2 (high
- Niedrige HalluzinationsrateGLM-5 erreicht die niedrigste jemals gemessene Halluzinationsrate aller von ArtificialAnalysis.ai getesteten Modelle.
- Starke Coding- und Agent-FähigkeitenGLM-5 erreicht mit 77,8% im SWE-bench Verified, 75,9 in BrowseComp (Top-Platzierung) und 89,7% im τ²-Benchmark hervorragende Ergebnisse, auf dem Level proprietärer Modelle.
- Open Weights unter MIT-LizenzZ.ai veröffentlicht GLM-5 vollständig open-source auf HuggingFace. Du kannst die Gewichte herunterladen und das Modell lokal deployen und ausführen, vorausgesetzt, deine Hardware ist stark genug. Kommerzielle Nutzung erlaubt.
- Unabhängig von NVIDIA-HardwareDass GLM-5 angeblich ohne NVIDIA Hardware trainiert werden konnte, könnte einen Durchbruch im LLM-Training bedeuten. Die Abhängigkeit chinesischer Modelle von US-Firmen wird immer weiter abgebaut.
Nachteile
- Nur Text-InputGLM-5 ist kein multimodales LLM. Für Bilder / Computer Vision wird ein separates Modell, vmtl zukünftig GLM-5V benötigt.
- Sehr hohe Hardware-AnforderungenIn BF16-Präzision ist GLM-5 ca. 1,51 TB groß. Um das Modell lokal ausführen zu können, muss man damit rechnen, dass mind. 8 leistungsstarke GPUs benötigt werden.
- Politischer BiasWie bei anderen chinesischen Modellen auch, muss davon ausgegangen werden, dass das Modelle unter politischen Einflüssen trainiert wurde und entsprechend eine Interpretation der Historie Chinas widergibt.
Vergleiche GLM-5 mit anderen LLMs
Vergleiche GLM-5 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst Z.ai GLM-5 über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.