Modellvergleich

Qwen3 VL 8B Instruct
vs. QwQ 32B

Vergleich von 2 KI-Modellen · 12 Benchmarks · Alibaba

Empfehlung

QwQ 32B 12 Metrik-Siege

Staerkste Bereiche: TTFT, Reasoning, Intelligenz

Bester Wert

Qwen3 VL 8B Instruct

100.0 Wert-Score

22.9 Reasoning / $0.31/1M

Niedrigster Preis

Qwen3 VL 8B Instruct

$0.18/1M Eingabepreis

Bestes Reasoning

QwQ 32B

45.6 Reasoning-Score

Kombiniert verfuegbare Reasoning-Benchmarks

Bestes Coding

Qwen3 VL 8B Instruct

7.3 Coding-Index

Composite Indices

Higher is better; speed and price are normalized

Standard Benchmarks

Only benchmarks with data are shown

Wichtige Unterschiede

Bester Wert

Qwen3 VL 8B Instruct bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.

Preisunterschied

Qwen3 VL 8B Instruct ist 3,7x guenstiger bei Eingabetokens als QwQ 32B.

Geschwindigkeitsunterschied

Qwen3 VL 8B Instruct generiert etwa 4,7x so viele Tokens pro Sekunde wie QwQ 32B.

Reasoning-Unterschied

QwQ 32B liegt 22.7 Punkte vor Qwen3 VL 8B Instruct beim Reasoning.

Top-Wahl-Begruendung

QwQ 32B gewinnt 12 messbare Kategorien, darunter TTFT, Reasoning, Intelligenz, Mathe.

Live compare

Response Face-Off

Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.

Qwen3 VL 8B Instruct

Alibaba

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

QwQ 32B

Alibaba

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Welche Antwort war nuetzlicher?

KI-Chat

Mit 80+ Modellen chatten

Kostenlos chatten

Inference-API

EU-gehostete Inferenz

API-Zugang erhalten

Vollständiger Vergleich

Metrik	Al Qwen3 VL 8B Instruct Alibaba	Top-Wahl Al QwQ 32B Alibaba
Preise pro 1 Mio. Tokens
Input-Kosten	$0.18/1M	$0.66/1M
Output-Kosten	$0.70/1M	$1.00/1M
Gemischt (3:1)	$0.31/1M	$0.74/1M
Spezifikationen
Anbieter	Alibaba	Alibaba
Veröffentlichung	14. Okt. 2025	5. März 2025
Leistung & Geschwindigkeit
Durchsatz	144.7 tok/s	30.9 tok/s
TTFT	924ms	431ms
Latenz	924ms	81150ms
Composite-Indizes
Wert-Score	100.0	82.8
Reasoning-Score	22.9	45.6
Intelligenz	14.3	19.7
Coding	7.3	—
Mathe	27.3	29.0
Standard-Benchmarks
GPQA	42.7%	59.3%
MMLU Pro	68.6%	76.4%
HLE	2.9%	8.2%
LiveCodeBench	33.2%	63.1%
MATH 500	—	95.7%
AIME 2025	27.3%	29.0%
AIME (Original)	—	78.0%
SciCode	17.4%	35.8%
LCR	15.3%	25.0%
IFBench	32.3%	38.8%
TAU-bench v2	29.2%	—
TerminalBench Hard	2.3%	—