DeepSeek-V4-Pro von DeepSeek AI

DeepSeek-V4-Pro Modell-Übersicht

DeepSeek-V4-Pro (Preview) ist das neueste Flaggschiff-Modell von DeepSeek AI, veröffentlicht am 24. April 2026. Mit 1,6 Billionen Gesamtparametern (49 Milliarden aktiv) in einer Mixture-of-Experts-Architektur und einem nativen 1-Million-Token-Kontextfenster setzt es neue Maßstäbe unter Open-Weights-Modellen. Das Modell kombiniert Compressed Sparse Attention (CSA) und Heavily Compressed Attention (HCA) zu einem hybriden Attention-Mechanismus, der bei 1M-Token-Kontext nur 27% der Inference-FLOPs und 10% des KV-Cache von DeepSeek-V3.2 benötigt. Drei Reasoning-Modi (Non-Think, Think High, Think Max) ermöglichen feingranulare Steuerung der Reasoning-Tiefe. DeepSeek-V4-Pro schließt die Lücke zu Frontier-Modellen wie GPT-5.5 und Claude Opus 4.7 zu einem Bruchteil der Kosten.

API Dokumentation Hugging Face API Pricing Chat Interface

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

1 Mio. Token

Unbekannt

32.000 Mrd.

1.600 Mrd.

$1.74

$3.48

Unbekannt

DeepSeek-V4-Pro Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.

Technologie & Daten

Technische Spezifikationen

Architektur	Sparse MoE-Architektur mit 1,6T Gesamtparametern (49B aktiv), kombiniert mit hybridem Attention-Mechanismus aus Compressed Sparse Attention (CSA) und Heavily Compressed Attention (HCA) sowie Manifold-Constrained Hyper-Connections (mHC).
Input Kontextlänge	1 Mio.
Output Kontextlänge	Unbekannt
Tokenizer	DeepSeek V4 Tokenizer (encoding_dsv4)

Besonderheiten

1M-Token-Kontextfenster	Natives 1-Million-Token-Kontextfenster für Long-Context-Workflows mit ganzen Codebases oder umfangreichen Dokumenten.
Drei Reasoning-Modi	Non-Think (schnell), Think High (logische Analyse) und Think Max (volle Reasoning-Tiefe) – per Request umschaltbar.
Hybrid Attention (CSA + HCA)	Kombination aus Compressed Sparse Attention und Heavily Compressed Attention für massive Long-Context-Effizienz.
128 parallele Function-Calls	Unterstützt bis zu 128 parallel ausgeführte Tool-Aufrufe pro Turn für agentische Workflows.
Manifold-Constrained Hyper-Connections	Verstärkte Residual-Connections für stabile Signal-Propagation über alle Layer.

Vorteile & Nachteile

Vorteile

Frontier-Coding-Performance zum Bruchteil des Preises
93.5% auf LiveCodeBench (vor Gemini 3.1 Pro mit 91.7% und Claude Opus 4.7 mit 88.8%) sowie 80.6% auf SWE-Bench Verified bei nur ~14% der Kosten von GPT-5.5.
Größtes Open-Weights-Modell weltweit
1,6 Billionen Parameter unter MIT-Lizenz auf Hugging Face verfügbar – vollständig lokal deploybar mit vLLM, SGLang oder Huawei Ascend.
1-Million-Token-Kontext mit drastischer Effizienzsteigerung
Bei 1M-Kontext nur 27% FLOPs und 10% KV-Cache gegenüber DeepSeek-V3.2 – ermöglicht ökonomische Long-Context-Workloads.
Drei wählbare Reasoning-Modi
Non-Think, Think High und Think Max erlauben pro Request die optimale Balance zwischen Latenz, Kosten und Reasoning-Tiefe.
Wettbewerbsfähig auf Codeforces
Codeforces-Rating von 3206 platziert das Modell auf etwa Rang 23 unter realen menschlichen Wettbewerbsteilnehmern.

Nachteile

Kein Multimodal-Support
Aktuell rein textbasiert – keine Verarbeitung von Bildern, Audio oder Video. Multimodale Fähigkeiten sind laut DeepSeek auf der Roadmap, aber noch nicht verfügbar.
Schwächer als Frontier-Modelle bei HLE
37.7% auf Humanity's Last Exam liegen unter GPT-5.5 (~41%), Claude Opus 4.7 (~40%) und Gemini 3.1 Pro (44.4%).
Hohe Hardware-Anforderungen für lokales Deployment
1,6T Parameter erfordern Datacenter-GPUs oder Multi-Node-Cluster – Consumer-Hardware reicht selbst mit FP4-Quantisierung nicht aus.
Preview-Status
Modell ist als Preview gelabelt; Stabilität, Tool-Calling-Konsistenz und finale Architektur können sich bis zur stabilen Version noch ändern.
Schwächer bei UI-Generierung als Claude Opus
DeepSeek V4-Pro produziert weniger dashboard-fertige UI-Outputs (Charts, Metric Cards, Datentabellen) als Claude Opus 4.x.

Vergleiche DeepSeek-V4-Pro mit anderen LLMs

Vergleiche DeepSeek-V4-Pro mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.

Entwickler	Modell⇅	Lizenz⇅	Parameter ⇅	Input-Tokens ⇅	Output-Tokens ⇅	Input-Preis ⇅	Output-Preis ⇅	Veröffentlichung
DeepSeek AI	DeepSeek-V4-Pro	MIT	1.600 Mrd.	1 Mio.	unbekannt	$1.74	$3.48	24.04.2026
OpenAI	GPT-5.5	Proprietär	Unbekannt	1,05 Mio.	128k	$5.00	$30.00	23.04.2026
Moonshot AI	Kimi K2.6	Andere	1.000 Mrd.	262,14k	32,77k	$0.95	$4.00	20.04.2026
Anthropic	Claude Opus 4.7	Proprietär	Unbekannt	1 Mio.	128k	$5.00	$25.00	16.04.2026
Z.ai	GLM-5.1	MIT	744 Mrd.	202,75k	128k	$1.40	$4.40	07.04.2026
Anthropic	Claude Mythos	Proprietär	Unbekannt	1 Mio.	128k	$25.00	$125.00	07.04.2026
Google DeepMind	Gemma 4	Apache 2.0	30,7 Mrd.	262,14k	131,07k	$0.14	$0.40	02.04.2026
MiniMax	MiniMax M2.7	MIT	230 Mrd.	204,8k	131,07k	$0.30	$1.20	18.03.2026
OpenAI	GPT-5.4 nano	Proprietär	Unbekannt	400k	128k	$0.20	$1.25	17.03.2026
OpenAI	GPT-5.4 mini	Proprietär	Unbekannt	400k	128k	$0.75	$4.50	17.03.2026

‌
Alle Modelle vergleichen

Provider & APIs

Du kannst DeepSeek AI DeepSeek-V4-Pro über die API folgender Anbieter nutzen.

Das Modell ist derzeit bei keinen Anbietern verfügbar.