Modellvergleich

M3
vs. Grok 4.20 0309 v2 (Reasoning)

Vergleich von 2 KI-Modellen · 7 Benchmarks · MiniMax, xAI

Empfehlung

M3 13 Metrik-Siege

Staerkste Bereiche: Preis-Leistung, Eingabepreis, Ausgabepreis

Bester Wert

M3

100.0 Wert-Score

61.6 Reasoning / $0.52/1M

Niedrigster Preis

M3

$0.30/1M Eingabepreis

Bestes Reasoning

M3

61.6 Reasoning-Score

Kombiniert verfuegbare Reasoning-Benchmarks

Bestes Coding

M3

43.4 Coding-Index

Composite Indices

Higher is better; speed and price are normalized

Standard Benchmarks

Only benchmarks with data are shown

Wichtige Unterschiede

Bester Wert

M3 bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.

Preisunterschied

M3 ist 6,7x guenstiger bei Eingabetokens als Grok 4.20 0309 v2 (Reasoning).

Geschwindigkeitsunterschied

Grok 4.20 0309 v2 (Reasoning) generiert etwa 4,9x so viele Tokens pro Sekunde wie M3.

Reasoning-Unterschied

M3 liegt 4.0 Punkte vor Grok 4.20 0309 v2 (Reasoning) beim Reasoning.

Coding-Unterschied

M3 liegt 2.9 Punkte vor Grok 4.20 0309 v2 (Reasoning) beim Coding.

Live compare

Response Face-Off

Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.

M3

MiniMax

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Grok 4.20 0309 v2 (Reasoning)

xAI

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Welche Antwort war nuetzlicher?

KI-Chat

Mit 80+ Modellen chatten

Kostenlos chatten

Inference-API

EU-gehostete Inferenz

API-Zugang erhalten

Vollständiger Vergleich

Metrik	Top-Wahl Mi M3 MiniMax	xA Grok 4.20 0309 v2 (Reasoning) xAI
Preise pro 1 Mio. Tokens
Input-Kosten	$0.30/1M	$2.00/1M
Output-Kosten	$1.20/1M	$6.00/1M
Gemischt (3:1)	$0.52/1M	$3.00/1M
Spezifikationen
Anbieter	MiniMax	xAI
Veröffentlichung	1. Juni 2026	7. Apr. 2026
Leistung & Geschwindigkeit
Durchsatz	44.3 tok/s	217.4 tok/s
TTFT	2355ms	16734ms
Latenz	47452ms	16734ms
Composite-Indizes
Wert-Score	100.0	16.4
Reasoning-Score	61.6	57.5
Intelligenz	54.7	49.3
Coding	43.4	40.5
Standard-Benchmarks
GPQA	92.9%	91.1%
HLE	37.1%	32.2%
SciCode	45.4%	45.6%
LCR	74.0%	58.0%
IFBench	82.9%	81.2%
TAU-bench v2	88.9%	93.0%
TerminalBench Hard	42.4%	37.9%