Modellvergleich

Llama 3.2 Instruct 90B (Vision)
vs. Qwen3 8B (Reasoning)

Vergleich von 2 KI-Modellen · 12 Benchmarks · Meta, Alibaba

Empfehlung

Qwen3 8B (Reasoning) 12 Metrik-Siege

Staerkste Bereiche: Preis-Leistung, Eingabepreis, Ausgabepreis

Bester Wert

100.0 Wert-Score

39.9 Reasoning / $0.37/1M

Niedrigster Preis

$0.11/1M Eingabepreis

Bestes Reasoning

39.9 Reasoning-Score

Kombiniert verfuegbare Reasoning-Benchmarks

Bestes Coding

9.0 Coding-Index

Composite Indices

Higher is better; speed and price are normalized

Only benchmarks with data are shown

Bester Wert

Qwen3 8B (Reasoning) bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.

Preisunterschied

Qwen3 8B (Reasoning) ist 12,5x guenstiger bei Eingabetokens als Llama 3.2 Instruct 90B (Vision).

Geschwindigkeitsunterschied

Qwen3 8B (Reasoning) generiert etwa 1,2x so viele Tokens pro Sekunde wie Llama 3.2 Instruct 90B (Vision).

Reasoning-Unterschied

Qwen3 8B (Reasoning) liegt 14.3 Punkte vor Llama 3.2 Instruct 90B (Vision) beim Reasoning.

Top-Wahl-Begruendung

Qwen3 8B (Reasoning) gewinnt 12 messbare Kategorien, darunter Preis-Leistung, Eingabepreis, Ausgabepreis, Gemischter Preis.

Live compare

Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.

Llama 3.2 Instruct 90B (Vision)

Inference-API

Metrik	Me Llama 3.2 Instruct 90B (Vision) Meta	Top-Wahl Al Qwen3 8B (Reasoning) Alibaba
Preise pro 1 Mio. Tokens
Input-Kosten	$1.38/1M	$0.11/1M
Output-Kosten	$1.38/1M	$1.15/1M
Gemischt (3:1)	$1.38/1M	$0.37/1M
Spezifikationen
Anbieter	Meta	Alibaba
Veröffentlichung	25. Sept. 2024	28. Apr. 2025
Leistung & Geschwindigkeit
Durchsatz	48.7 tok/s	60.8 tok/s
TTFT	553ms	1430ms
Latenz	553ms	34335ms
Composite-Indizes
Wert-Score	17.2	100.0
Reasoning-Score	25.6	39.9
Intelligenz	11.9	13.2
Coding	—	9.0
Mathe	—	19.0
Standard-Benchmarks
GPQA	43.2%	58.9%
MMLU Pro	67.1%	74.3%
HLE	4.9%	4.2%
LiveCodeBench	21.4%	40.6%
MATH 500	62.9%	90.4%
AIME 2025	—	19.0%
AIME (Original)	5.0%	74.7%
SciCode	24.0%	22.6%
LCR	—	0.0%
IFBench	—	33.5%
TAU-bench v2	—	27.8%
TerminalBench Hard	—	2.3%