Deepseek-R1
Veröffentlichung
Januar 2025
Knowledge Cutoff
Oktober 2023
Parameter
671 Mrd.
Modellfamilie
Deepseek-R1
MIT
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Max. Input
163,84k Token
Max. Output
163,84k Token
Trainingsdaten
14.800 Mrd.
Parameter
671 Mrd.
Input Preis
$0.70
Output Preis
$2.40
Vokabular
129,28k
Dateigröße
641,30 GB
DeepSeek-R1-0120 Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
Architektur | Decoder-only Transformer |
---|---|
Input Kontextlänge | 163,84k |
Output Kontextlänge | 163,84k |
Tokenizer | SentencePiece |
Besonderheiten
Besonderheit 1 | Direkter Zugriff auf CoT-Output |
---|---|
Besonderheit 2 | JSON-Output |
Besonderheit 3 | Distillierte Versionen und Quantisierungsgrade |
Vorteile & Nachteile
Vorteile
- Open-SourceDeepSeek-R1 wurde als Open-Source Modell mit MIT-Lizenz veröffentlicht.
- Lokal ausführbarDas Modell lässt sich herunterladen und über Programme wie LM Studio oder OpenLlama lokal ausführen.
- Viele Versionen verfügbarNeben dem Hauptmodell sind viele kleinere, distillierte Modelle verfügbar.
- Reasoning-KapazitätenDeepSeek-R1 ist ein Reasoning-LLM, das den vollständigen
<think> Prozess ausgibt.</think>
Nachteile
- Modell-BiasDas Modell wurde nicht mit neutralen Daten trainiert und verschleiert dunkle Episoden chinesischer Geschichte.
- Kein Datenschutz beim ChatbotWer DeepSeek-R1 über die offizielle Website oder App verwendet, gibt seine Daten preis.
- Fehlende MultimodalitätDas Modell kann nur mit Text- und nicht mit Bild- oder Audio-Daten umgehen.
Vergleiche DeepSeek-R1-0120 mit anderen LLMs
Vergleiche DeepSeek-R1-0120 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst DeepSeek AI DeepSeek-R1-0120 über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.