Claude Mythos
Claude Mythos Modell-Übersicht
Claude Mythos Preview ist zum Zeitpunkt der Veröffentlichung das leistungsstärkstes Frontier-Modell von Anthropic und wurde am 7. April 2026 im Rahmen von Project Glasswing vorgestellt. Der zuvor geleakte interne Codename "Capybara" deutete bereits darauf hin, dass das Modell eine völlig neue Modellebene oberhalb der Opus-Reihe eröffnen könnte. Insbesondere durch das autonome Identifizieren von Software-Sicherheitslücken erregte Mythos auch in breiten Wirtschaftskreisen für Aufsehen. Anthropic plant ausdrücklich keine allgemeine Verfügbarkeit des Modells, sondern beschränkt den Zugang auf 12 ausgewählte Glasswing-Partner sowie über 40 etablierte Organisationen, die kritische Software-Infrastruktur betreiben.
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Claude Mythos Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Proprietärer Transformer |
|---|---|
| Input Kontextlänge | 1 Mio. |
| Output Kontextlänge | 128k |
| Tokenizer | Proprietärer Tokenizer |
Besonderheiten
| Autonomes Auffinden von Sicherheitslücken | Identifiziert und exploited eigenständig Zero-Day-Schwachstellen in Betriebssystemen, Browsern und Open-Source-Software. |
|---|---|
| Langzeit Inference-Scaling | Claude Mythos profitiert von Token-Budgets bis 100 Mio. Token, insbesondere bei mehrtägigen Cyber- und Coding-Agenten Aufgaben. |
| ASL-3 Safety Deployment | Wird unter Anthropics höchstem aktuellen AI Safety Level (ASL-3) mit zusätzlichen Deployment-Safeguards betrieben. |
Vorteile & Nachteile
Vorteile
- State-of-the-Art Coding ModellClaude Mythos (Preview) erreicht 93,9 % im SWE-bench Verified, 77,8 % im SWE-bench Pro und 87,3 % im SWE-bench Multilingual Benchmark. Damit übertrifft es Claude Opus 4.6 im Schnitt um über 10 Prozentpunkte pro Benchmark.
- Herausragendes mathematisches ReasoningDen USAMO 2026 Benchmark sättigt Claude Mythos mit 97,6 %. Anthropic spricht von einem Sprung von 4,3x über der bisherigen Trendlinie.
- Großer Abstand in Cybersecurity BenchmarksMit 83,1 % in CyberGym (vs. 66,6 % Opus 4.6 und 73,1 % bei Opus 4.7) und laut AISI 73 % Success-Rate in Expert-Level-CTFs, die zuvor von keinem Modell vor April 2025 gelöst wurden, gilt Claude Mythos als absolut führendes Modell für Cybersecurity Aufgaben.
- Bestes Alignment der Anthropic-HistorieTrotz des neuen Leistungsniveaus bezeichnet Anthropic Claude Mythos als das bislang am besten ausgerichtete Modell.
Nachteile
- Nicht öffentlich verfügbarAnthropic plant nicht, Claude Mythos zu veröffentlichen. Der Zugang wird auf die 12 Partner aus dem Glasswing-Projekt und ca. 40 weitere Organisationen aus kritischer Software-Infrastruktur beschränkt.
- Erhebliche Dual-Use-RisikenDie offensiven Cyber-Capabilities sind so stark, dass Anthropic die Veröffentlichung insbesondere aus Sicherheitsgründen verhindert.
Vergleiche Claude Mythos mit anderen LLMs
Vergleiche Claude Mythos mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst Anthropic Claude Mythos über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.