Alle AI-Trends
Direkt in dein Postfach
Erhalte exklusive AI-Tutorials, Praxistipps und KI-News direkt in dein Postfach.
*Mit deiner Anmeldung akzeptierst du unsere Datenschutzrichtlinien.
Jetzt neu bei Byte: Unser WhatsApp Channel 📱

Claude Mythos

Veröffentlichung
April 2026
Knowledge Cutoff
Dezember 2025
Parameter
Unbekannt
Modellfamilie
Claude Mythos
Proprietär

Claude Mythos Modell-Übersicht

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

Max. Input
1 Mio. Token
Max. Output
128k Token
Trainingsdaten
Unbekannt
Parameter
Unbekannt
Input Preis
$25.00
Output Preis
$125.00
Vokabular
Unbekannt
Dateigröße
Unbekannt

Claude Mythos Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.



Technologie & Daten

Technische Spezifikationen

ArchitekturProprietärer Transformer
Input Kontextlänge1 Mio.
Output Kontextlänge128k
TokenizerProprietärer Tokenizer

Besonderheiten

Autonomes Auffinden von SicherheitslückenIdentifiziert und exploited eigenständig Zero-Day-Schwachstellen in Betriebssystemen, Browsern und Open-Source-Software.
Langzeit Inference-ScalingClaude Mythos profitiert von Token-Budgets bis 100 Mio. Token, insbesondere bei mehrtägigen Cyber- und Coding-Agenten Aufgaben.
ASL-3 Safety DeploymentWird unter Anthropics höchstem aktuellen AI Safety Level (ASL-3) mit zusätzlichen Deployment-Safeguards betrieben.

Vorteile & Nachteile

Vorteile

  • State-of-the-Art Coding Modell
    Claude Mythos (Preview) erreicht 93,9 % im SWE-bench Verified, 77,8 % im SWE-bench Pro und 87,3 % im SWE-bench Multilingual Benchmark. Damit übertrifft es Claude Opus 4.6 im Schnitt um über 10 Prozentpunkte pro Benchmark.
  • Herausragendes mathematisches Reasoning
    Den USAMO 2026 Benchmark sättigt Claude Mythos mit 97,6 %. Anthropic spricht von einem Sprung von 4,3x über der bisherigen Trendlinie.
  • Großer Abstand in Cybersecurity Benchmarks
    Mit 83,1 % in CyberGym (vs. 66,6 % Opus 4.6 und 73,1 % bei Opus 4.7) und laut AISI 73 % Success-Rate in Expert-Level-CTFs, die zuvor von keinem Modell vor April 2025 gelöst wurden, gilt Claude Mythos als absolut führendes Modell für Cybersecurity Aufgaben.
  • Bestes Alignment der Anthropic-Historie
    Trotz des neuen Leistungsniveaus bezeichnet Anthropic Claude Mythos als das bislang am besten ausgerichtete Modell.

Nachteile

  • Nicht öffentlich verfügbar
    Anthropic plant nicht, Claude Mythos zu veröffentlichen. Der Zugang wird auf die 12 Partner aus dem Glasswing-Projekt und ca. 40 weitere Organisationen aus kritischer Software-Infrastruktur beschränkt.
  • Erhebliche Dual-Use-Risiken
    Die offensiven Cyber-Capabilities sind so stark, dass Anthropic die Veröffentlichung insbesondere aus Sicherheitsgründen verhindert.

Vergleiche Claude Mythos mit anderen LLMs

Vergleiche Claude Mythos mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.


Alle Modelle vergleichen

Provider & APIs

Du kannst Anthropic Claude Mythos über die API folgender Anbieter nutzen.