Alle AI-Trends
Direkt in dein Postfach
Erhalte exklusive AI-Tutorials, Praxistipps und KI-News direkt in dein Postfach.
*Mit deiner Anmeldung akzeptierst du unsere Datenschutzrichtlinien.
Jetzt neu bei Byte: Unser WhatsApp Channel 📱

Nemotron 3 Super

Veröffentlichung
März 2026
Knowledge Cutoff
Juni 2025
Parameter
120,6 Mrd.
Modellfamilie
Nemotron 3 Super
Open Model License

Nemotron 3 Super Modell-Übersicht

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

Max. Input
1,05 Mio. Token
Max. Output
32,77k Token
Trainingsdaten
25.000 Mrd.
Parameter
120,6 Mrd.
Input Preis
$0.30
Output Preis
$0.75
Vokabular
131,07k
Dateigröße
230,25 GB

Nemotron 3 Super Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.



Technologie & Daten

Technische Spezifikationen

ArchitekturHybrid
Input Kontextlänge1,05 Mio.
Output Kontextlänge32,77k
TokenizerProprietär

Besonderheiten

Latent Mixture-of-Experts (LatentMoE)Komprimiert Tokens in einen latenten Raum vor dem Expert-Routing, wodurch 4x mehr Experten bei identischen Rechenkosten aktiviert werden können.
Multi-Token Prediction (MTP)Sagt mehrere zukünftige Tokens in einem Forward-Pass vorher.
Konfigurierbares ReasoningStufen: deaktiviert, niedrig (low_effort) oder vollständig (enable_thinking).

Vorteile & Nachteile

Vorteile

  • Vollständig offenes LLM
    NVIDIA veröffentlicht ausführliche Informationen und Details zum Trainingsprozess von Nemotron 3 Super. Es lassen sich sowohl die Model Weights, als auch Trainingssätze für eigene Modelle herunterladen.
  • Ideal für Forscher und Entwickler
    Durch die Transparenz und veröffentlichten Datensätze dürfte Nemotron 3 Super insbesondere KI-Forscher begeistern.
  • Sehr hoher Throughput
    NVIDIA Nemotron 3 Super erreicht im Vergleich zu GPT-OSS (120B) einen ca. 2,2x höheren Token-Throughput.
  • Gutes Preis-Leistungs-Verhältnis
    Bei API Anbietern wie DeepInfra lässt sich Nemotron 3 Super bereits ab $0,10 / 1 Mio. Input- und $0,50 / 1 Mio. Output-Tokens nutzen. Außerdem lässt sich das Modell lokal deployen – ausreichende Hardware vorausgesetzt.

Nachteile

  • Sehr hohe Hardware-Anforderungen
    Laut Angaben von NVIDIA werden mindestens 8x H100-80GB GPUs für ein BF16-Deployment empfohlen.
  • API-Anbieter begrenzen Kontextfenster
    Die meisten API-Anbieter beschränken das Kontextfenster aktuell auf 262K Token statt der nativen 1 Mio. Tokens.
  • Keine Multimodalität
    NVIDIA Nemotron 3 Super verarbeitet ausschließlich Text, keine Bild-, Audio- oder Video-Inhalte.
  • Neuartige Architektur mit begrenztem Ökosystem
    Die Hybrid-Mamba-Transformer-LatentMoE-Architektur ist noch jung. Bewährte reine Transformer-MoE-Architekturen bieten breitere Tool-Unterstützung und mehr Stabilität.

Vergleiche Nemotron 3 Super mit anderen LLMs

Vergleiche Nemotron 3 Super mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.


Alle Modelle vergleichen

Provider & APIs

Du kannst NVIDIA Nemotron 3 Super über die API folgender Anbieter nutzen.

Das Modell ist derzeit bei keinen Anbietern verfügbar.