Nemotron 3 Super
Nemotron 3 Super Modell-Übersicht
Nemotron 3 Super ist ein Open-Weights-Modell von NVIDIA aus der Nemotron-3-Familie. Vorgestellt wurde Nemotron Super 3 auf der GTC 2026. Das LLM kombiniert eine Hybride Architektur aus Mamba-2-Layern, Transformer-Attention-Layern und Latent-Mixture-of-Experts (LatentMoE) zu einem 120B-Parameter-Modell, das 12B Parameter pro Token aktiviert. Nemotron 3 Super kann ein Kontextfenster von bis zu 1 Mio. Tokens verarbeiten und ist für den Einsatz als KI-Agent und für Multi-Step-Workflows optimiert.
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Nemotron 3 Super Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Hybrid |
|---|---|
| Input Kontextlänge | 1,05 Mio. |
| Output Kontextlänge | 32,77k |
| Tokenizer | Proprietär |
Besonderheiten
| Latent Mixture-of-Experts (LatentMoE) | Komprimiert Tokens in einen latenten Raum vor dem Expert-Routing, wodurch 4x mehr Experten bei identischen Rechenkosten aktiviert werden können. |
|---|---|
| Multi-Token Prediction (MTP) | Sagt mehrere zukünftige Tokens in einem Forward-Pass vorher. |
| Konfigurierbares Reasoning | Stufen: deaktiviert, niedrig (low_effort) oder vollständig (enable_thinking). |
Vorteile & Nachteile
Vorteile
- Vollständig offenes LLMNVIDIA veröffentlicht ausführliche Informationen und Details zum Trainingsprozess von Nemotron 3 Super. Es lassen sich sowohl die Model Weights, als auch Trainingssätze für eigene Modelle herunterladen.
- Ideal für Forscher und EntwicklerDurch die Transparenz und veröffentlichten Datensätze dürfte Nemotron 3 Super insbesondere KI-Forscher begeistern.
- Sehr hoher ThroughputNVIDIA Nemotron 3 Super erreicht im Vergleich zu GPT-OSS (120B) einen ca. 2,2x höheren Token-Throughput.
- Gutes Preis-Leistungs-VerhältnisBei API Anbietern wie DeepInfra lässt sich Nemotron 3 Super bereits ab $0,10 / 1 Mio. Input- und $0,50 / 1 Mio. Output-Tokens nutzen. Außerdem lässt sich das Modell lokal deployen – ausreichende Hardware vorausgesetzt.
Nachteile
- Sehr hohe Hardware-AnforderungenLaut Angaben von NVIDIA werden mindestens 8x H100-80GB GPUs für ein BF16-Deployment empfohlen.
- API-Anbieter begrenzen KontextfensterDie meisten API-Anbieter beschränken das Kontextfenster aktuell auf 262K Token statt der nativen 1 Mio. Tokens.
- Keine MultimodalitätNVIDIA Nemotron 3 Super verarbeitet ausschließlich Text, keine Bild-, Audio- oder Video-Inhalte.
- Neuartige Architektur mit begrenztem ÖkosystemDie Hybrid-Mamba-Transformer-LatentMoE-Architektur ist noch jung. Bewährte reine Transformer-MoE-Architekturen bieten breitere Tool-Unterstützung und mehr Stabilität.
Vergleiche Nemotron 3 Super mit anderen LLMs
Vergleiche Nemotron 3 Super mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst NVIDIA Nemotron 3 Super über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.