Claude Opus 4.6
Claude Opus 4.6 Modell-Übersicht
Claude Opus 4.6 ist ein Update von Claude Opus 4.5. Das Update verbessert insbesonderere das Instruction-Following von Agenten und Enterprise-Workflows, z.B. in Excel oder PowerPoint. Es ist das erste Opus Modell, das ein 1 Mio. Token großes Kontextfenster bietet, was insbesondere beim Coding deutliche spürbare Verbesserung mit sich bringen kann. Insbesondere im ARC-AGI 2 Benchmark und dem GDPVal-AA Elo-Score schafft Opus 4.6 deutliche Sprünge im Vergleich zu seinem Vorgänger und lässt die bisherigen Top-Modelle wie GPT-5.2 hinter sich. Das Pricing für <200k Token Kontext-Fenster bleibt identisch mit dem von Opus 4.5, allerdings wird der Preis bei >200k Token auf $10 / $37.50 pro Mio. Input / Output Token erhöht.
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Claude Opus 4.6 Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Transformer-Architektur |
|---|---|
| Input Kontextlänge | 1 Mio. |
| Output Kontextlänge | 128k |
| Tokenizer | Claude Tokenizer |
Besonderheiten
| Adaptive Thinking | Extended Thinking (low, medium, high (Standard) und max.) |
|---|---|
| Agent Teams | Koordination mehrerer KI-Agenten untereinander |
| Context Compaction | Automatische Zusammenfassung langer Kontexte |
Vorteile & Nachteile
Vorteile
- Stärkstes Agentic Coding ModellMit 65.4% im Terminal-Bench 2.0 und 80.8% auf SWE-bench Verified gilt Claude Opus 4.6 als bestes Coding-LLM. Insbesondere beim Vibe Coding mit Claude Code erzielt Opus hervorragende Ergebnisse.
- Optimiert für Agentic WorkflowsClaude Opus 4.6 ist eines der besten Modelle für den Einsatz in KI-Agenten. Benchmark Scores wie 91.9% im τ-bench (Retail) oder 84.0% auf BrowseComp untermauern für uns das bereits subjektiv empfundene Gefühl.
- Optimiert für Enterprise- und Office-WorkflowsOpus 4.6 wurde für den Einsatz in Enterprise Workflows, z.B. mit der Microsoft Office Suite, optimiert und kann lange und komplexe Aufgaben in Excel oder PowerPoint autonom abarbeiten.
- Größtes Kontextfenster für Opus-ModelleDer Sprung in der Kapazität für maximal verarbeitbare Input-Tokens kann zu deutlichen Verbesserungen beim Arbeiten in großen Codebases oder mit ausführlichen Dokumentationen führen.
Nachteile
- Sehr teuerSelbst wenn die Opus-Modelle historisch betrachtet weniger Gesamttokens für das Ausführen von Aufgaben benötigten, wird Claude Opus 4.6 bei >200k Kontextfenster sehr kostenintensiv.
- Proprietäres Modell ohne lokales DeploymentClaude Opus 4.6 ist ausschließlich über API oder Claude.ai verfügbar. Fine-tuning oder lokales Deployment ist nicht möglich.
- Limits in der NutzungTägliche und wöchentliche Limits für die Nutzung werden mit Opus-Modellen schnell erreicht. Besonders Pro-Abonnenten von Claude AI müssen häufig auf die teuren Max-Pläne upgraden.
Vergleiche Claude Opus 4.6 mit anderen LLMs
Vergleiche Claude Opus 4.6 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst Anthropic Claude Opus 4.6 über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.