Modellvergleich

Grok 4.3 (low)
vs. Qwen3.6 35B A3B (Reasoning)

Vergleich von 2 KI-Modellen · 7 Benchmarks · xAI, Alibaba

Empfehlung

Qwen3.6 35B A3B (Reasoning) 9 Metrik-Siege

Staerkste Bereiche: Preis-Leistung, Eingabepreis, Ausgabepreis

Bester Wert

Qwen3.6 35B A3B (Reasoning)

100.0 Wert-Score

45.3 Reasoning / $0.56/1M

Niedrigster Preis

Qwen3.6 35B A3B (Reasoning)

$0.25/1M Eingabepreis

Bestes Reasoning

Grok 4.3 (low)

45.7 Reasoning-Score

Kombiniert verfuegbare Reasoning-Benchmarks

Bestes Coding

Qwen3.6 35B A3B (Reasoning)

41.9 Coding-Index

Composite Indices

Higher is better; speed and price are normalized

Standard Benchmarks

Only benchmarks with data are shown

Wichtige Unterschiede

Bester Wert

Qwen3.6 35B A3B (Reasoning) bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.

Preisunterschied

Qwen3.6 35B A3B (Reasoning) ist 5,0x guenstiger bei Eingabetokens als Grok 4.3 (low).

Geschwindigkeitsunterschied

Qwen3.6 35B A3B (Reasoning) generiert etwa 1,2x so viele Tokens pro Sekunde wie Grok 4.3 (low).

Reasoning-Unterschied

Grok 4.3 (low) liegt 0.4 Punkte vor Qwen3.6 35B A3B (Reasoning) beim Reasoning.

Top-Wahl-Begruendung

Qwen3.6 35B A3B (Reasoning) gewinnt 9 messbare Kategorien, darunter Preis-Leistung, Eingabepreis, Ausgabepreis, Gemischter Preis.

Live compare

Response Face-Off

Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.

Grok 4.3 (low)

xAI

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Qwen3.6 35B A3B (Reasoning)

Alibaba

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Welche Antwort war nuetzlicher?

KI-Chat

Mit 80+ Modellen chatten

Kostenlos chatten

Inference-API

EU-gehostete Inferenz

API-Zugang erhalten

Vollständiger Vergleich

Metrik	xA Grok 4.3 (low) xAI	Top-Wahl Al Qwen3.6 35B A3B (Reasoning) Alibaba
Preise pro 1 Mio. Tokens
Input-Kosten	$1.25/1M	$0.25/1M
Output-Kosten	$2.50/1M	$1.49/1M
Gemischt (3:1)	$1.56/1M	$0.56/1M
Spezifikationen
Anbieter	xAI	Alibaba
Veröffentlichung	30. Apr. 2026	16. Apr. 2026
Leistung & Geschwindigkeit
Durchsatz	145.6 tok/s	167.7 tok/s
TTFT	4986ms	1333ms
Latenz	4986ms	33506ms
Composite-Indizes
Wert-Score	36.0	100.0
Reasoning-Score	45.7	45.3
Intelligenz	35.4	31.6
Coding	—	41.9
Standard-Benchmarks
GPQA	84.3%	84.1%
HLE	17.3%	20.2%
SciCode	41.9%	35.8%
LCR	64.0%	63.7%
IFBench	81.0%	64.4%
TAU-bench v2	88.9%	95.3%
TerminalBench Hard	26.5%	34.8%

Wichtigste Erkenntnisse

Qwen3.6 35B A3B (Reasoning) bietet das beste Preis-Leistungs-Verhaeltnis mit $0.25/1M, ideal fuer volumenstarke Anwendungen und kostenbewusste Projekte.

Grok 4.3 (low) hat das staerkste Reasoning-Profil mit 45.7 Reasoning-Score, basierend auf den verfuegbaren Reasoning-Benchmarks.

Qwen3.6 35B A3B (Reasoning) erreicht einen 41.9 Coding-Index, und ist damit eine Top-Wahl fuer Softwareentwicklung und Code-Generierung.

Alle Modelle unterstuetzen Kontextfenster von ∞+ Tokens, geeignet fuer lange Dokumente und ausgedehnte Gespraeche.