Modellvergleich

Claude 4.5 Sonnet (Reasoning)
vs. Qwen3 Max (Preview)

Vergleich von 2 KI-Modellen · 10 Benchmarks · Anthropic, Alibaba

Empfehlung

Claude 4.5 Sonnet (Reasoning) 15 Metrik-Siege

Staerkste Bereiche: Durchsatz, Reasoning, Intelligenz

Bester Wert

Qwen3 Max (Preview)

100.0 Wert-Score

52.4 Reasoning / $2.40/1M

Niedrigster Preis

Qwen3 Max (Preview)

$1.20/1M Eingabepreis

Bestes Reasoning

Claude 4.5 Sonnet (Reasoning)

63.9 Reasoning-Score

Kombiniert verfuegbare Reasoning-Benchmarks

Bestes Coding

Claude 4.5 Sonnet (Reasoning)

38.6 Coding-Index

Composite Indices

Higher is better; speed and price are normalized

Standard Benchmarks

Only benchmarks with data are shown

Wichtige Unterschiede

Bester Wert

Qwen3 Max (Preview) bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.

Preisunterschied

Qwen3 Max (Preview) ist 3,1x guenstiger bei Eingabetokens als Claude 4.5 Sonnet (Reasoning).

Geschwindigkeitsunterschied

Claude 4.5 Sonnet (Reasoning) generiert etwa 1,2x so viele Tokens pro Sekunde wie Qwen3 Max (Preview).

Reasoning-Unterschied

Claude 4.5 Sonnet (Reasoning) liegt 11.6 Punkte vor Qwen3 Max (Preview) beim Reasoning.

Coding-Unterschied

Claude 4.5 Sonnet (Reasoning) liegt 13.1 Punkte vor Qwen3 Max (Preview) beim Coding.

Live compare

Response Face-Off

Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.

Claude 4.5 Sonnet (Reasoning)

Anthropic

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Qwen3 Max (Preview)

Alibaba

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Welche Antwort war nuetzlicher?

KI-Chat

Mit 80+ Modellen chatten

Kostenlos chatten

Inference-API

EU-gehostete Inferenz

API-Zugang erhalten

Vollständiger Vergleich

Metrik	Top-Wahl An Claude 4.5 Sonnet (Reasoning) Anthropic	Al Qwen3 Max (Preview) Alibaba
Preise pro 1 Mio. Tokens
Input-Kosten	$3.75/1M	$1.20/1M
Output-Kosten	$15.00/1M	$6.00/1M
Gemischt (3:1)	$6.56/1M	$2.40/1M
Spezifikationen
Anbieter	Anthropic	Alibaba
Veröffentlichung	29. Sept. 2025	5. Sept. 2025
Leistung & Geschwindigkeit
Durchsatz	54.4 tok/s	47.1 tok/s
TTFT	10398ms	1899ms
Latenz	10398ms	1899ms
Composite-Indizes
Wert-Score	44.7	100.0
Reasoning-Score	63.9	52.4
Intelligenz	43.0	26.1
Coding	38.6	25.5
Mathe	88.0	75.0
Standard-Benchmarks
GPQA	83.4%	76.4%
MMLU Pro	87.5%	83.8%
HLE	17.3%	9.3%
LiveCodeBench	71.4%	65.1%
AIME 2025	88.0%	75.0%
SciCode	44.7%	37.0%
LCR	65.7%	39.7%
IFBench	57.3%	48.0%
TAU-bench v2	78.1%	32.7%
TerminalBench Hard	35.6%	19.7%