Qwen3 30B A3B Instruct 2507 Modell-Übersicht

Qwen3-30B-A3B-Instruct-2507 ist ein Non-Reasoning-Modell mit 30 Mrd. Parametern aus der Qwen3-Modellfamilie. Das Modell wurde auf schnelle Inferenz und Instruction Following optimiert und kann in mehreren Sprachen arbeiten. Aufgrund der reduzierten Größe eignet sich diese Version weniger für komplexe Aufgaben, sondern vielmehr für den Einsatz in Agentic-Workflows.

Playground Blog Github Hugging Face

Features

Tools

Websuche, Bildgenerierung, Computer Use und MCP-Server.

Multimodalität

Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.

Finetuning

Finetuning des Modells ist aktuell nicht möglich.

Details zum Modell

262,14k Token

16,38k Token

36.000 Mrd.

30,5 Mrd.

0,09 $

0,30 $

151,94k

56,87 GB

Qwen3 30B A3B Instruct 2507 Benchmark Scores

Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.

Qwen3 30B A3B Instruct 2507 Benchmark Übersicht

Qwen3 30B A3B Instruct 2507 Performance im Vergleich zu anderen KI-Modellen

Benchmark	Qwen3 30B A3B Instruct 2507	Qwen3	Qwen3.5	GLM-4.5	Claude Opus 4.1	Muse Spark 1.1	GPT 5.6 Terra
Aider PolyglotProgrammierung	35,6 %	—	—	—	—	—	—

Ergebnisse in Benchmarks

Benchmark auswählen

Darstellung der Rohdaten für den Benchmark Aider Polyglot. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
GPT-5	88 %
GPT-5 Pro	88 %
Gemini 2.5 Pro	82,2 %
OpenAI o3	79,6 %
Claude Sonnet 4.5	78,8 %
GPT-5 mini	71,6 %
DeepSeek-R1-0528	71,6 %
OpenAI o3-mini	60,4 %
OpenAI o4-mini	58,2 %
Gemini 2.5 Flash	56,7 %
GPT-5 nano	48,4 %
Qwen3 30B A3B Instruct 2507	35,6 %
Gemini 2.5 Flash-Lite	27,1 %

Vergleich von LLMs im Benchmark Aider Polyglot. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark AIME 2025. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
GPT-5.2	100 %
GPT-5.2 Pro	100 %
GPT-5.4 nano	98,33 %
Kimi K2.5 (Thinking)	96,1 %
DeepSeek-v3.2 Speciale	96 %
GLM-4.7	95,7 %
Gemini 3 Pro	95 %
Kimi K2 Thinking	94,5 %
GPT-5.1	94 %
GLM-4.6	93,9 %
DeepSeek-v3.2 Thinking	93,1 %
GPT-5.4 mini	90,83 %
Nemotron 3 Super	90,21 %
Claude Sonnet 4.5	87 %
MiniMax M2.5	86,3 %
MiniMax M2.1	83 %
Claude Haiku 4.5	80,7 %
MiniMax-M2	78 %
Qwen3 30B A3B Instruct 2507	61,3 %
Kimi K2 (0905)	49,5 %

Vergleich von LLMs im Benchmark AIME 2025. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark LiveCodeBench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
Gemini 3.1 Pro	2.887 %
DeepSeek-V4-Pro (Preview)	93,5 %
Fugu Ultra	93,2 %
Kimi K2.6	89,6 %
DeepSeek-v3.2 Speciale	88,7 %
GPT-5.6 Terra	85,93 %
Kimi K2.5 (Thinking)	85 %
GLM-4.7	84,9 %
Qwen3.5-397B-A17B	83,6 %
DeepSeek-v3.2 Thinking	83,3 %
Kimi K2 Thinking	83,1 %
MiniMax-M2	83 %
GLM-4.6	82,8 %
GPT-5.6 Sol	82,6 %
Nemotron 3 Super	81,19 %
MiniMax M2.1	81 %
Muse Spark	80 %
Gemma 4 31B	80 %
Gemini 3.1 Flash-Lite	72 %
Qwen3 30B A3B Instruct 2507	43,2 %

Vergleich von LLMs im Benchmark LiveCodeBench. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

Darstellung der Rohdaten für den Benchmark MMLU-Pro. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.
Modell	Score
GPT-5.6 Sol	89,1 %
MiniMax M2.1	88 %
Qwen3.5-397B-A17B	87,8 %
DeepSeek-V4-Pro (Preview)	87,5 %
Kimi K2.5 (Thinking)	87,1 %
GPT-5.6 Terra	86,66 %
Grok-4	86,6 %
Gemma 4 31B	85,2 %
DeepSeek-R1-0528	85 %
Kimi K2 Thinking	84,6 %
GLM-4.5	84,6 %
Qwen3 235B A22B Thinking 2507	84,4 %
GLM-4.7	84,3 %
Nemotron 3 Super	83,73 %
MiniMax-M2	82 %
GLM-4.5 Air	81,4 %
Qwen3 30B A3B Instruct 2507	78,4 %
Gemma 3	67,5 %

Vergleich von LLMs im Benchmark MMLU-Pro. Der niedrigste Score im Benchmark ist 0 % und der höchste Score ist 100 %.

‌
‌

Technologie & Daten

Technische Spezifikationen

Architektur	Mixture-of-Experts Transformer
Input Kontextlänge	262,14k
Output Kontextlänge	16,38k
Tokenizer	Qwen3 BPE (ChatML)

Besonderheiten

Besonderheit 1	Non-Thinking only
Besonderheit 3	Agentic Tool-Use
Versionen	235B, 32B, 30B, 14B, 8B, 4B, 1.7B, 0.6B

Vorteile & Nachteile

Vorteile

Open Weight Modelle, lokal ausführbar
Die gesamte Qwen 3 Modellfamilie wird komplett inklusive offener Gewichtungen veröffentlicht und kann beliebig nach-trainiert werden. Außerdem lassen sich die Qwen 3 Modelle über Apps wie Ollama oder LM Studio lokal und ohne Internetverbindung nutzen.
Großzügige Lizenzen
Mit Apache-2.0 gewährt Alibaba Entwicklern viel Spielraum für die kommerzielle Nutzung der Qwen 3 Modelle.
Starke Benchmark-Performances der kleinen Modelle
Insbesondere die kleinen Modelle, rund um Qwen3-30B-A3B erzielen beeindruckende Ergebnisse, die in größeren Benchmarks mit Modellen wie DeepSeekV3 und GPT-4o mithalten können.
Gutes Instruction Following
Nach ersten Einschätzungen scheinen die Qwen 3 Modelle gut im Instruction Following zu sein.

Nachteile

Keine native Multimodalität
Qwen 3 ist nativ keine multimodale Modellfamilie. Die Modelle lassen sich von Haus aus also nicht für Computer Vision o.ä. nutzen.
Eingeschränktes Kontextfenster
Je nach Inferenz-Anbieter beträgt das native Kontextfenster von Qwen3 auch in den großen Modellen max. 262k Tokens.

Vergleiche Qwen3 30B A3B Instruct 2507 mit anderen LLMs

Vergleiche Qwen3 30B A3B Instruct 2507 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.

Entwickler	Modell⇅	Lizenz⇅	Parameter ⇅	Input-Tokens ⇅	Output-Tokens ⇅	Input-Preis ⇅	Output-Preis ⇅	Veröffentlichung
OpenAI	GPT 5.6 Sol	Proprietär	Unbekannt	1,05 Mio.	128k	5,00 $	30,00 $	09.07.2026
OpenAI	GPT 5.6 Terra	Proprietär	Unbekannt	1,05 Mio.	128k	2,50 $	15,00 $	09.07.2026
OpenAI	GPT 5.6 Luna	Proprietär	Unbekannt	1,05 Mio.	128k	1,00 $	6,00 $	09.07.2026
Meta AI	Muse Spark 1.1	Proprietär	Unbekannt	1,05 Mio.	1,05 Mio.	1,25 $	4,25 $	09.07.2026
xAI	Grok 4.5	Proprietär	Unbekannt	500k	500k	2,00 $	6,00 $	08.07.2026
Anthropic	Claude Sonnet 5	Proprietär	Unbekannt	1 Mio.	128k	3,00 $	15,00 $	30.06.2026
Sakana AI	Fugu Ultra	Proprietär	7 Mrd.	1 Mio.	1 Mio.	5,00 $	30,00 $	21.06.2026
Z.ai	GLM 5.2	MIT	753 Mrd.	1,05 Mio.	131,07k	1,40 $	4,40 $	16.06.2026
Anthropic	Claude Fable 5	Proprietär	Unbekannt	1 Mio.	128k	10,00 $	50,00 $	09.06.2026
Alibaba	Qwen3 30B A3B Instruct 2507	Apache 2.0	30,5 Mrd.	262,14k	16,38k	0,09 $	0,30 $	29.07.2025

‌
Alle Modelle vergleichen

Provider & APIs

Du kannst Alibaba Qwen3 30B A3B Instruct 2507 über die API folgender Anbieter nutzen.

Das Modell ist derzeit bei keinen Anbietern verfügbar.

‌
‌
‌

Qwen3 30B A3B Instruct 2507 Modell-Übersicht

Features

Tools

Multimodalität

Finetuning

Details zum Modell

Qwen3 30B A3B Instruct 2507 Benchmark Scores

Qwen3 30B A3B Instruct 2507 Benchmark Übersicht

Wissen & Sprache

Logik & Schlussfolgerung

Programmierung

Qwen3 30B A3B Instruct 2507 Performance im Vergleich zu anderen KI-Modellen

Ergebnisse in Benchmarks

Technologie & Daten

Technische Spezifikationen

Besonderheiten

Vorteile & Nachteile

Vorteile

Nachteile

Vergleiche Qwen3 30B A3B Instruct 2507 mit anderen LLMs

Provider & APIs

Qwen3 30B A3B Instruct 2507 Benchmark Übersicht

Wissen & Sprache

Logik & Schlussfolgerung

Programmierung

Qwen3 30B A3B Instruct 2507 Performance im Vergleich zu anderen KI-Modellen

Ergebnisse in Benchmarks