GPT-4o Modell-Übersicht

GPT-4o (Omni) ist OpenAIs multimodales Allround-Modell, das schnelle Inferenzzeiten bietet und für viele Anwendungsfälle genutzt werden kann. Das Update vom November 2024 verbesserte Schreibstil, Dateianalyse und Reasoning-Fähigkeiten erheblich. GPT-4o ist 2x schneller und 50% günstiger als GPT-4 Turbo und unterstützt bis zu 128K Input-Tokens als Kontext.

ChatGPT API Dokumentation Playground System Card

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

128k Token

16,38k Token

Unbekannt

2,50 $

10,00 $

200k

Unbekannt

GPT-4o Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.

GPT-4o Benchmark Übersicht

Logik & Schlussfolgerung

AIME 2025

Programmierung

LiveCodeBench

SWE-bench Verified

GPT-4o Performance im Vergleich zu anderen KI-Modellen

Benchmark	GPT-4o	o3-mini	DeepSeek-R1-0120	Muse Spark 1.1	GPT 5.6 Terra	GPT 5.6 Sol	GPT 5.6 Luna
AIME 2025Logik & Schlussfolgerung	5,8 %	86,5 %	—	—	—	—

Ergebnisse in Benchmarks

Benchmark auswählen

Darstellung der Rohdaten für den Benchmark AIME 2025. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
GPT-5.2	100 %
GPT-5.2 Pro	100 %
GPT-5.4 nano	98,33 %
Kimi K2.5 (Thinking)	96,1 %
DeepSeek-v3.2 Speciale	96 %
GLM-4.7	95,7 %
Gemini 3 Pro	95 %
Kimi K2 Thinking	94,5 %
GPT-5.1	94 %
GLM-4.6	93,9 %
DeepSeek-v3.2 Thinking	93,1 %
GPT-5.4 mini	90,83 %
Nemotron 3 Super	90,21 %
Claude Sonnet 4.5	87 %
MiniMax M2.5	86,3 %
MiniMax M2.1	83 %
Claude Haiku 4.5	80,7 %
MiniMax-M2	78 %
Kimi K2 (0905)	49,5 %
GPT-4o (2024-11-20)	5,8 %

Vergleich von LLMs im Benchmark AIME 2025. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark LiveCodeBench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
Gemini 3.1 Pro	2.887 %
DeepSeek-V4-Pro (Preview)	93,5 %
Fugu Ultra	93,2 %
Kimi K2.6	89,6 %
DeepSeek-v3.2 Speciale	88,7 %
GPT-5.6 Terra	85,93 %
Kimi K2.5 (Thinking)	85 %
GLM-4.7	84,9 %
Qwen3.5-397B-A17B	83,6 %
DeepSeek-v3.2 Thinking	83,3 %
Kimi K2 Thinking	83,1 %
MiniMax-M2	83 %
GLM-4.6	82,8 %
GPT-5.6 Sol	82,6 %
Nemotron 3 Super	81,19 %
MiniMax M2.1	81 %
Muse Spark	80 %
Gemma 4 31B	80 %
Gemini 3.1 Flash-Lite	72 %
GPT-4o (2024-11-20)	29,5 %

Vergleich von LLMs im Benchmark LiveCodeBench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark SWE-bench Verified. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
GPT-5.6 Sol	96,2 %
Claude Fable 5	95 %
Claude Mythos Preview	93,9 %
Claude Opus 4.8	88,6 %
Claude Opus 4.7	87,6 %
Claude Sonnet 5	85,2 %
Claude Opus 4.6	80,8 %
DeepSeek-V4-Pro (Preview)	80,6 %
Gemini 3.1 Pro	80,6 %
MiniMax-M3	80,5 %
Kimi K2.6	80,2 %
MiniMax M2.5	80,2 %
MiniMax M2.7	79,9 %
Claude Sonnet 4.6	79,6 %
GLM-5	77,8 %
Muse Spark	77,4 %
Kimi K2.5 (Thinking)	76,8 %
Qwen3.5-397B-A17B	76,4 %
GPT-5.6 Terra	75,2 %
GPT-4o (2024-11-20)	21,62 %

Vergleich von LLMs im Benchmark SWE-bench Verified. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

‌
‌

Technologie & Daten

Technische Spezifikationen

Architektur	Multimodaler Transformer
Input Kontextlänge	128k
Output Kontextlänge	16,38k
Tokenizer	Hybrid Reasoning Transformer

Besonderheiten

Native Multimodalität	Text, Bilder
Structured Outputs	Ja, JSON
Function Calling	Ja

Vorteile & Nachteile

Vorteile

Multimodales Modell
GPT-4o kann verschiedene Modalitäten verarbeiten. Im Gegensatz zu anderen Versionen, kann die heir vorgestellte Version vom 20.11.2024 allerdings keinen Audio-Input verarbeiten.
Hohe Inferenz-Geschwindigkeit
GPT-4o ist doppelt so schnell wie GPT-4 Turbo und erzeugt gleichzeitig deutlich bessere Output-Qualität bei geringeren Kosten.
Großes Kontextfenster mit 128k Tokens
GPT-4o kann bis zu 128.000 Tokens im Input verarbeiten und eignet sich somit auch für die Verarbeitung langer Dokumente.
Strukturierte Ausgabe von JSON
Über GPT-4o lassen sich strukturierte JSON-Daten ausgeben, was eine wichtige Funktion für Entwickler ist.

Nachteile

Veraltete Trainingsdaten
GPT-4o hat einen Knowledge Cutoff im Oktober 2023. Das bedeutet, dass alle zeitlich darauf folgenden Informationen über externe Quellen und Websuche bezogen werden müssen.
Proprietäres Modell
GPT-4o ist nur über die OpenAI API verfügbar und lässt sich nicht über andere Inferenz-Anbieter oder als lokales Modell abrufen.
Kein natives Reasoning
GPT-4o ist kein Reasoning Modell. Wer komplexe Aufgaben mit GPT-4o lösen möchte, sollte dementsprechend manuelles Chain-of-Thought Prompting verwenden.

Vergleiche GPT-4o mit anderen LLMs

Vergleiche GPT-4o mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.

Entwickler	Modell⇅	Lizenz⇅	Parameter ⇅	Input-Tokens ⇅	Output-Tokens ⇅	Input-Preis ⇅	Output-Preis ⇅	Veröffentlichung
OpenAI	GPT 5.6 Sol	Proprietär	Unbekannt	1,05 Mio.	128k	5,00 $	30,00 $	09.07.2026
OpenAI	GPT 5.6 Terra	Proprietär	Unbekannt	1,05 Mio.	128k	2,50 $	15,00 $	09.07.2026
OpenAI	GPT 5.6 Luna	Proprietär	Unbekannt	1,05 Mio.	128k	1,00 $	6,00 $	09.07.2026
Meta AI	Muse Spark 1.1	Proprietär	Unbekannt	1,05 Mio.	1,05 Mio.	1,25 $	4,25 $	09.07.2026
xAI	Grok 4.5	Proprietär	Unbekannt	500k	500k	2,00 $	6,00 $	08.07.2026
Anthropic	Claude Sonnet 5	Proprietär	Unbekannt	1 Mio.	128k	3,00 $	15,00 $	30.06.2026
Sakana AI	Fugu Ultra	Proprietär	7 Mrd.	1 Mio.	1 Mio.	5,00 $	30,00 $	21.06.2026
Z.ai	GLM 5.2	MIT	753 Mrd.	1,05 Mio.	131,07k	1,40 $	4,40 $	16.06.2026
Anthropic	Claude Fable 5	Proprietär	Unbekannt	1 Mio.	128k	10,00 $	50,00 $	09.06.2026
OpenAI	GPT-4o	Proprietär	Unbekannt	128k	16,38k	2,50 $	10,00 $	20.11.2024

‌
Alle Modelle vergleichen

Provider & APIs

Du kannst OpenAI GPT-4o über die API folgender Anbieter nutzen.

OpenAI
Zu OpenAI
Token (in)
128k
Token (out)
16,38k
Latenz
350 ms
USD / 1M Input
2,50 $
USD / 1M Output
10,00 $
Throughput
166,7 t/s

‌
‌
‌

‌
‌
‌
‌
‌
‌
‌
‌
‌
‌
‌