Kimi K2 Thinking
Veröffentlichung
November 2025
Knowledge Cutoff
Dezember 2024
Parameter
1.000 Mrd.
Modellfamilie
Kimi K2 Thinking
MIT
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Max. Input
262,14k Token
Max. Output
262,14k Token
Trainingsdaten
15.500 Mrd.
Parameter
1.000 Mrd.
Input Preis
$0.60
Output Preis
$2.50
Vokabular
163,84k
Dateigröße
553,42 GB
Kimi K2 Thinking Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Mixture-of-Experts (MoE) Transformer |
|---|---|
| Input Kontextlänge | 262,14k |
| Output Kontextlänge | 262,14k |
| Tokenizer | GPT-4o-ähnlicher Tokenizer |
Besonderheiten
| Offenes Chain-of-Thought Reasoning | CoT-Tokens während der Inferenz frei einsehbar |
|---|---|
| Native INT4-Quantisierung | Quantization-Aware Training (QAT) |
Vorteile & Nachteile
Vorteile
- SOTA-Reasoning-ModellK2 Thinking erreicht 44,9% im HLE-Benchmark und übertrifft damit GPT-5 (41,7%) und Grok-4 (38,6%). Kimi-K2 Thinking ist zur Veröffentlichung das leistungsstärkste Open Source Modell.
- Auf Agentische Aufgaben trainiertKimi K2 Thinking kann 200-300 autonome Tool-Calls ohne externes Eingreifen ausführen.
- Sehr gutes Coding-ModellDie Ergebnisse in den großen Coding-Benchmarks (71,3% im SWE-Bench Verified und 83,1% in LiveCodeBench v6) zeigen, dass sich Kimi K2 Thinking gut als Coding-Modell nutzen lässt, dass sich sogar lokal ausführen lässt.
- Open Source mit MIT LizenzDie angepasste MIT Lizenz ermöglicht die kommerzielle Nutzung von Kimi K2 Thinking mit minimalen Einschränkungen (große Projekte mit >100 Mio. monatlichen Nutzern oder >$20M Umsatz/Monat müssen "Kimi K2" im UI anzeigen).
- Sehr günstige InferenzKimi K2 ist ca. 6x günstiger als Claude Sonnet 4 und 20x günstiger als OpenAI-o3. Die API von Kimi K2 ist OpenAI-kompatibel.
Nachteile
- Potenzielle OverproductionBei schwierigen Reasoning-Aufgaben oder unklaren Tool-Definitionen verliert sich Kimi K2 Thinking manchmal im Denkprozess und generiert zu viele Thinking-Tokens, was die Qualität des Outputs stark einschränken kann.
- Hohe Hardware-AnforderungenKimi-K2-Thinking ist mit ca. 584 GB Modellgröße und 1 Bio. Parametern sehr groß und es werden leistungsstarke Recheneinheiten mit viel Speicher für die lokale Inferenz benötigt.
- Modell-BiasWie andere chinesissche Modelle auch, verschleiert Kimi K2 dunkle Episoden chinesischer Geschichte und weist somit einen Bias auf.
- Kein Datenschutz beim ChatbotWer Kimi K2 über die offizielle Website oder App verwendet, gibt seine Daten preis.
Vergleiche Kimi K2 Thinking mit anderen LLMs
Vergleiche Kimi K2 Thinking mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst Moonshot AI Kimi K2 Thinking über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.