Claude Mythos
Veröffentlichung
April 2026
Knowledge Cutoff
Dezember 2025
Parameter
Unbekannt
Modellfamilie
Claude Mythos
Proprietär
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Max. Input
1 Mio. Token
Max. Output
128k Token
Trainingsdaten
Unbekannt
Parameter
Unbekannt
Input Preis
$25.00
Output Preis
$125.00
Vokabular
Unbekannt
Dateigröße
Unbekannt
Claude Mythos Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Proprietärer Transformer |
|---|---|
| Input Kontextlänge | 1 Mio. |
| Output Kontextlänge | 128k |
| Tokenizer | Proprietärer Tokenizer |
Besonderheiten
| Autonomes Auffinden von Sicherheitslücken | Identifiziert und exploited eigenständig Zero-Day-Schwachstellen in Betriebssystemen, Browsern und Open-Source-Software. |
|---|---|
| Langzeit Inference-Scaling | Claude Mythos profitiert von Token-Budgets bis 100 Mio. Token, insbesondere bei mehrtägigen Cyber- und Coding-Agenten Aufgaben. |
| ASL-3 Safety Deployment | Wird unter Anthropics höchstem aktuellen AI Safety Level (ASL-3) mit zusätzlichen Deployment-Safeguards betrieben. |
Vorteile & Nachteile
Vorteile
- State-of-the-Art Coding ModellClaude Mythos (Preview) erreicht 93,9 % im SWE-bench Verified, 77,8 % im SWE-bench Pro und 87,3 % im SWE-bench Multilingual Benchmark. Damit übertrifft es Claude Opus 4.6 im Schnitt um über 10 Prozentpunkte pro Benchmark.
- Herausragendes mathematisches ReasoningDen USAMO 2026 Benchmark sättigt Claude Mythos mit 97,6 %. Anthropic spricht von einem Sprung von 4,3x über der bisherigen Trendlinie.
- Großer Abstand in Cybersecurity BenchmarksMit 83,1 % in CyberGym (vs. 66,6 % Opus 4.6 und 73,1 % bei Opus 4.7) und laut AISI 73 % Success-Rate in Expert-Level-CTFs, die zuvor von keinem Modell vor April 2025 gelöst wurden, gilt Claude Mythos als absolut führendes Modell für Cybersecurity Aufgaben.
- Bestes Alignment der Anthropic-HistorieTrotz des neuen Leistungsniveaus bezeichnet Anthropic Claude Mythos als das bislang am besten ausgerichtete Modell.
Nachteile
- Nicht öffentlich verfügbarAnthropic plant nicht, Claude Mythos zu veröffentlichen. Der Zugang wird auf die 12 Partner aus dem Glasswing-Projekt und ca. 40 weitere Organisationen aus kritischer Software-Infrastruktur beschränkt.
- Erhebliche Dual-Use-RisikenDie offensiven Cyber-Capabilities sind so stark, dass Anthropic die Veröffentlichung insbesondere aus Sicherheitsgründen verhindert.
Vergleiche Claude Mythos mit anderen LLMs
Vergleiche Claude Mythos mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst Anthropic Claude Mythos über die API folgender Anbieter nutzen.