DeepSeek-V4-Pro
DeepSeek-V4-Pro (Preview) Modell-Übersicht
DeepSeek-V4-Pro (Preview) ist ein Flaggschiff-Modell von DeepSeek AI, das am 24. April 2026 veröffentlicht wurde. Mit 1,6 Billionen Gesamtparametern (49 Milliarden aktiv) in einer Mixture-of-Experts-Architektur und einem nativen 1-Million-Token-Kontextfenster gehört es zu den größten Open Weights Modellen. Das Modell kombiniert Compressed Sparse Attention (CSA) und Heavily Compressed Attention (HCA) zu einem hybriden Attention-Mechanismus, der bei 1M-Token-Kontext nur 27% der Inference-FLOPs und 10% des KV-Cache von DeepSeek-V3.2 benötigt. Bei der Nutzung gibt es drei verschiedene Reasoning-Modi. DeepSeek-V4-Pro sollte die Lücke zu Frontier-Modellen wie GPT-5.5 und Claude Opus 4.7 schließen, enttäusche allerdings und fiel in vielen Benchmarks sogar hinter andere Open Source Modelle wie z.B. Kimi-K2.6.
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
DeepSeek-V4-Pro (Preview) Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Sparse MoE-Transformer |
|---|---|
| Input Kontextlänge | 1 Mio. |
| Output Kontextlänge | 384k |
| Tokenizer | DeepSeek V4 Tokenizer (encoding_dsv4) |
Besonderheiten
| 1 Mio. Token-Kontextfenster | DeepSeek V4 kann bis zu 1 Mio. Input-Tokens verarbeiten |
|---|
Vorteile & Nachteile
Vorteile
- Gute Benchmark ErgebnisseDeepSeek V4 Pro erreicht 93.5% im LiveCodeBench (vor Gemini 3.1 Pro mit 91.7% und Claude Opus 4.7 mit 88.8%) sowie 80.6% bei SWE-Bench Verified mit nur ~14% der Kosten von GPT-5.5.
- Größtes Open-Weights-Modell weltweitDeepSeek V4 hat 1,6 Billionen Parameter und wurde vollständig unter MIT-Lizenz auf Hugging Face verfügbar gemacht. Das Modell lässt sich lokal deployen und ohne Internetverbindung verwenden, passende Hardware vorausgesetzt.
- Drei wählbare Reasoning-ModiNon-Think, Think High und Think Max erlauben pro Request die Wahl der Reasoning-Tiefe für mehr Einfluss auf Latenz und Tokenverbrauch.
Nachteile
- DeepSeek V4 bleibt hinter den Erwartungen zurückSowohl in den Benchmarks, als auch in subjektiven Tests bleibt DeepSeek V4 hinter den (hohen) Erwartungen an das Modell zurück. Der Vorsprung führender (proprietärer) US-Modelle scheint sich zum Veröffentlichungszeitpunkt zu vergrößern und viele Open-Source Nutzer greifen eher auf Kimi-K2.6 oder GLM-5.1 zurück.
- Kein Multimodal-SupportDeepSeek V4 ist aktuell ein rein textbasiertes LLM. Für die Verarbeitung von Bildern, Audio oder Video sind zusätzliche Modelle notwendig.
Vergleiche DeepSeek-V4-Pro (Preview) mit anderen LLMs
Vergleiche DeepSeek-V4-Pro (Preview) mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst DeepSeek AI DeepSeek-V4-Pro (Preview) über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.