Kimi K2.6
Veröffentlichung
April 2026
Knowledge Cutoff
Unbekannt
Parameter
1.000 Mrd.
Modellfamilie
Kimi K2.6
MIT
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Max. Input
262,14k Token
Max. Output
262,14k Token
Trainingsdaten
Unbekannt
Parameter
1.000 Mrd.
Input Preis
$0.75
Output Preis
$3.50
Vokabular
163,84k
Dateigröße
554,30 GB
Kimi K2.6 Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | MoE-Transformer |
|---|---|
| Input Kontextlänge | 262,14k |
| Output Kontextlänge | 262,14k |
| Tokenizer | Proprietärer Tokenizer |
Besonderheiten
| Agent Swarm 2.0 | Ermöglicht lange autonome Workflows mit einer Vielzahl an Sub-Agenten |
|---|---|
| Preserve Thinking Mode | Behält Reasoning-Ketten über mehrere Turns hinweg, anstatt sie zurückzusetzen. |
| Native Video-Verarbeitung | Verarbeitet Videos (mp4, mov, avi, webm, 3gpp u.a.) bis 2K-Auflösung direkt im selben Modell. |
Vorteile & Nachteile
Vorteile
- SOTA Open Weights ModellKimi-K2.6 gehört zum Zeitpunkt der Veröffentlichung zu den führenden Open Weights LLMs. In Benchmarks liegt es knapp vor GLM-5.1, deutlich vor DeepSeek V4 Pro und gleichauf mit MiMo-2.5.
- Beliebtes OpenClawd ModellKimi-K2.6 lässt sich lokal ausführen und wird gleichzeitig bei guter Leistung und Token-Throughput über eine Cloud-API angeboten. Damit ist das Modell beliebt unter OpenClawd oder Pi.dev Nutzern.
- Native MultimodalitätK2.6 ist das erste Kimi-LLM mit nativer Video-Unterstützung. Zusätzlich können auch Audio- und Bildinputs nativ verarbeitet werden.
- Open Weights unter Modified MITKimi-K2.6 lässt sich vollständig von HuggingFace herunterladen und lokal deployen (ca. 594 GB Modellgröße).
- Wettbewerbsfähige API-PreiseMit $0.95/$4.00 pro Million Tokens über die offizielle Moonshot API (und teils günstigerem Pricing über andere Inferenz-Anbieter), bietet Kimi-K2.6 fast die Leistung von proprietären SOTA-Modellen zu einem deutlich günstigerem Pricing.
Nachteile
- Hohe Hardware-AnforderungenWer Kimi-K2.6 lokal deployen möchte, benötigt teure Hardware. Empfohlen werden mindestens 4× H100-GPUs oder vergleichbare Datacenter-Hardware.
- Web-Search nicht mit Thinking-Modus kompatibelDie integrierte Web-Suche ist temporär (zum Zeitpunkt unseres Kimi-K2.6 Tests) nicht mit dem Thinking-Modus kombinierbar.
- Sehr junges ModellErst seit 20. April 2026 verfügbar, Community-Feedback und Production-Erfahrungen noch begrenzt.
Vergleiche Kimi K2.6 mit anderen LLMs
Vergleiche Kimi K2.6 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst Moonshot AI Kimi K2.6 über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.