Fugu Ultra
Fugu Ultra Modell-Übersicht
Fugu Ultra ist die leistungsorientierte Variante von Sakana Fugu, einem LLM-Orchestrierungs-Systems von Sakana AI. Fugu Ultra ist selbst kein Frontier-Modell sondern eher ein kleines LLM mit rund 7 Mrd. Parameter, das einen Pool externer Modelle als Agenten ansteuert, Aufgaben delegiert, Ergebnisse verifiziert und zusammenführt. Je nach Schwierigkeit routet der Orchestrierungs-Agent zwischen einem und drei Sub-Agenten, was die Qualität erhöhen, aber sich auch spürbar auf Kosten und Latenz auswirkt. Laut Sakana AI selbst liegt das System auf Augenhöhe mit Fable 5, Mythos Preview, Opus 4.8 und Gemini 3.1 Pro. Auf subjektiver Basis berichteten aber bereits am Tag der Veröffentlichung viele User, dass sie vom Output nicht überzeugt bzw. enttäuscht waren. Für schnellere, günstigere Anfragen wurde ein Schwestermodell Fugu (ohne Ultra) veröffentlicht.
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Fugu Ultra Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Orchestrator LLM |
|---|---|
| Input Kontextlänge | 1 Mio. |
| Output Kontextlänge | 1 Mio. |
| Tokenizer | unbekannt |
Besonderheiten
| Gelernte Orchestrierung | Entscheidet selbst, ob eine Anfrage direkt beantwortet oder an mehrere Spezialmodelle delegiert wird. |
|---|---|
| Rekursiver Agenten-Pool | 1-3 Agenten |
| Integrierte Web-Suche | Built-in web_search-Tool |
| Steuerbares Reasoning-Budget | high, xhigh, max |
| API-Kompatibilität | OpenAI-kompatibel |
Vorteile & Nachteile
Vorteile
- Frontier-Niveau ohne eigenes Frontier-ModellStatt ein riesiges Modell zu trainieren, orchestriert ein ~7B-Modell fremde Spitzenmodelle. Sakana AI gibt an, dass das System über Fugu-Ultra in Benchmarks wie GPQA-Diamond und LiveCodeBench v6 auf Augenhöhe mit Fable 5, Opus 4.8 und Gemini 3.1 Pro steht.
- Sehr großes multimodales Kontextfenster1 Mio. Token Kontext und Bild-Eingabe (Vision) decken lange Dokumente, Codebases und multimodale Aufgaben ab.
- KI-Agenten out-of-the-BoxTool-Calls, integrierte Web-Suche, strukturierte JSON-Ausgabe und steuerbares Reasoning sind ohne eigene Orchestrierungs-Logik nutzbar.
Nachteile
- Teuer, besonders bei langem KontextMit $5,00 / $30,00 pro 1 Mio. Input-/Output-Token liegt Ultra deutlich über dem günstigeren Schwestermodell Fugu; ab >272K Token verdoppeln sich die Preise sogar auf $10,00 / $45,00.
- Intransparenter Agenten-PoolSakana legt nicht offen, welche Fremdmodelle Fugu im Hintergrund ansteuert. Das erschwert Reproduzierbarkeit, Datenschutz-Bewertung und schafft eine Abhängigkeit von Drittanbieter-Modellen.
- Latenz und Variabilität durch DelegationDas extra Routen an Sub-Agenten und mehrere zugehörige Verifikationsschritte kosten sehr viel Zeit. Ultra ist explizit auf Qualität statt Geschwindigkeit ausgelegt, die interaktive Nutzung macht deswegen eher weniger Spaß.
- Bislang keine unabhängigen TestsNahezu alle Benchmark-Zahlen stammen vom Entwickler selbst und sind bislang kaum unabhängig verifiziert. Das Feedback der AI-Community war eher gemischt.
Vergleiche Fugu Ultra mit anderen LLMs
Vergleiche Fugu Ultra mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst Sakana AI Fugu Ultra über die API folgender Anbieter nutzen.