Nemotron 3 Super
Veröffentlichung
März 2026
Knowledge Cutoff
Juni 2025
Parameter
120,6 Mrd.
Modellfamilie
Nemotron 3 Super
Open Model License
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Max. Input
1,05 Mio. Token
Max. Output
32,77k Token
Trainingsdaten
25.000 Mrd.
Parameter
120,6 Mrd.
Input Preis
$0.30
Output Preis
$0.75
Vokabular
131,07k
Dateigröße
230,25 GB
Nemotron 3 Super Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Hybrid |
|---|---|
| Input Kontextlänge | 1,05 Mio. |
| Output Kontextlänge | 32,77k |
| Tokenizer | Proprietär |
Besonderheiten
| Latent Mixture-of-Experts (LatentMoE) | Komprimiert Tokens in einen latenten Raum vor dem Expert-Routing, wodurch 4x mehr Experten bei identischen Rechenkosten aktiviert werden können. |
|---|---|
| Multi-Token Prediction (MTP) | Sagt mehrere zukünftige Tokens in einem Forward-Pass vorher. |
| Konfigurierbares Reasoning | Stufen: deaktiviert, niedrig (low_effort) oder vollständig (enable_thinking). |
Vorteile & Nachteile
Vorteile
- Vollständig offenes LLMNVIDIA veröffentlicht ausführliche Informationen und Details zum Trainingsprozess von Nemotron 3 Super. Es lassen sich sowohl die Model Weights, als auch Trainingssätze für eigene Modelle herunterladen.
- Ideal für Forscher und EntwicklerDurch die Transparenz und veröffentlichten Datensätze dürfte Nemotron 3 Super insbesondere KI-Forscher begeistern.
- Sehr hoher ThroughputNVIDIA Nemotron 3 Super erreicht im Vergleich zu GPT-OSS (120B) einen ca. 2,2x höheren Token-Throughput.
- Gutes Preis-Leistungs-VerhältnisBei API Anbietern wie DeepInfra lässt sich Nemotron 3 Super bereits ab $0,10 / 1 Mio. Input- und $0,50 / 1 Mio. Output-Tokens nutzen. Außerdem lässt sich das Modell lokal deployen – ausreichende Hardware vorausgesetzt.
Nachteile
- Sehr hohe Hardware-AnforderungenLaut Angaben von NVIDIA werden mindestens 8x H100-80GB GPUs für ein BF16-Deployment empfohlen.
- API-Anbieter begrenzen KontextfensterDie meisten API-Anbieter beschränken das Kontextfenster aktuell auf 262K Token statt der nativen 1 Mio. Tokens.
- Keine MultimodalitätNVIDIA Nemotron 3 Super verarbeitet ausschließlich Text, keine Bild-, Audio- oder Video-Inhalte.
- Neuartige Architektur mit begrenztem ÖkosystemDie Hybrid-Mamba-Transformer-LatentMoE-Architektur ist noch jung. Bewährte reine Transformer-MoE-Architekturen bieten breitere Tool-Unterstützung und mehr Stabilität.
Vergleiche Nemotron 3 Super mit anderen LLMs
Vergleiche Nemotron 3 Super mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst NVIDIA Nemotron 3 Super über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.