GPT-5.4
GPT-5.4 Modell-Übersicht
GPT-5.4 ist OpenAIs Nachfolger von GPT-5.2 und soll einen neuen, monatlichen, Modell-Update Zyklus bei OpenAI einleiten. GPT-5.4 erreicht insbesondere in Computer-Use Benchmarks neue Höchststände. Auch in Coding-Benchmarks scheint das generalisierte "Thinking"-Modell vorherige Codex-Modelle, wie z.B. GPT-5.3 Codex, zu überholen. Zudem unterstützt GPT-5.4 ein großes Kontextfenster mit bis zu 1 Mio. Tokens.
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
GPT-5.4 Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Transformer-Architektur |
|---|---|
| Input Kontextlänge | 922k |
| Output Kontextlänge | 128k |
| Tokenizer | Proprietärer OpenAI Tokenizer |
Besonderheiten
| Native Computer Use | Erstes allgemeines OpenAI-Modell mit nativen Fähigkeiten, einen Computer zu bedienen. |
|---|---|
| Tool Search | Intelligente Tool-Suche, analog zu Claude AI. |
| Großes Kontextfenster | Unterstützt bis zu 1 Mio. Token Kontextfenster |
Vorteile & Nachteile
Vorteile
- Neues SOTA Computer Use ModellMit 75,0% im OSWorld-Verified Benchmark übertrifft GPT-5.4 die menschliche Leistung und gilt als neues State-of-the-Art Computer Use Modell.
- Größtes Kontextfenster von OpenAI1.05M Token Kontextfenster, mehr als doppelt so groß wie GPT-5.2 (400K). Damit überholt es auch Konkurrenzmodelle wie Claude Opus 4.6, die solche Kontextfenster aktuell nur in der Beta anbieten.
- Führendes LLM in vielen BenchmarksGPT-5.4 setzt sich an die Spitze vieler aktuell relevanter Benchmarks, u.a. erreicht es im GDPval Benchmark 87,3% auf Spreadsheet-Modellierung, was auf wertschaffende Nutzung in vielen Enterprise Bereichen hindeutet.
- Deutlich weniger faktische FehlerLaut eigenen Angaben von OpenAI macht GPT-5-4 33% weniger falsche Einzelaussagen und 18% weniger fehlerhafte Antworten insgesamt, gegenüber GPT-5.2.
- Gutes Preis-/Leistungs-VerhältnisMit $2,50/$15,00 pro 1 Mio. Input-/Output-Tokens ist GPT-5.4 nur halb so teuer wie Opus 4.6 und eher vergleichbar mit Sonnet 4.6.
Nachteile
- Proprietäres ModellViele Informationen zum Training oder den Gewichten von GPT-5.4 sind unbekannt. Außerdem lässt sich GPT-5-4 nur über OpenAIs API oder ChatGPT nutzen, es ist kein lokales Deployment möglich.
- Neigung zur AufgabenerweiterungDie Kritik, die häufig an Claude Opus Modellen geäußert wurde, hallt nun auch bei GPT-5-4 auf. Das Modelle tendiert dazu, Aufgaben über den eigentlichen Prompt hinaus zu erweitern und Aufgaben vorab als erledigt zu markieren, noch bevor sie vollständig abgeschlossen wurden.
- GPT-5.4 Pro Version sehr teuerGPT-5.4 Pro ist eine Version von GPT-5.4, die vermutlich über parallele Test-Time-Compute Ausführung mehrere Antworten auf einen Prompt generiert und die beste davon auswählt. Das Pro-Modell kostet $30/$180 pro 1 Mio. Token und gehört damit zu den teuersten LLMs überhaupt.
- Aufpreis bei langem KontextBei Prompts mit über 272k Input-Tokens verdoppeln sich die Input-Kosten und die Output-Kosten steigen um 50%.
Vergleiche GPT-5.4 mit anderen LLMs
Vergleiche GPT-5.4 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst OpenAI GPT-5.4 über die API folgender Anbieter nutzen.