Modellvergleich

GPT-5.2 (xhigh)
vs. Grok 4.20 0309 (Reasoning)

Vergleich von 2 KI-Modellen · 10 Benchmarks · OpenAI, xAI

Empfehlung

GPT-5.2 (xhigh) 9 Metrik-Siege

Staerkste Bereiche: Eingabepreis, Reasoning, Intelligenz

Bester Wert

Grok 4.20 0309 (Reasoning)

100.0 Wert-Score

55.7 Reasoning / $3.00/1M

Niedrigster Preis

GPT-5.2 (xhigh)

$1.75/1M Eingabepreis

Bestes Reasoning

GPT-5.2 (xhigh)

75.0 Reasoning-Score

Kombiniert verfuegbare Reasoning-Benchmarks

Bestes Coding

GPT-5.2 (xhigh)

48.7 Coding-Index

Composite Indices

Higher is better; speed and price are normalized

Standard Benchmarks

Only benchmarks with data are shown

Wichtige Unterschiede

Bester Wert

Grok 4.20 0309 (Reasoning) bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.

Preisunterschied

GPT-5.2 (xhigh) ist 1,1x guenstiger bei Eingabetokens als Grok 4.20 0309 (Reasoning).

Geschwindigkeitsunterschied

Grok 4.20 0309 (Reasoning) generiert etwa 2,5x so viele Tokens pro Sekunde wie GPT-5.2 (xhigh).

Reasoning-Unterschied

GPT-5.2 (xhigh) liegt 19.3 Punkte vor Grok 4.20 0309 (Reasoning) beim Reasoning.

Coding-Unterschied

GPT-5.2 (xhigh) liegt 6.5 Punkte vor Grok 4.20 0309 (Reasoning) beim Coding.

Live compare

Response Face-Off

Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.

GPT-5.2 (xhigh)

OpenAI

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Grok 4.20 0309 (Reasoning)

xAI

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Welche Antwort war nuetzlicher?

KI-Chat

Mit 80+ Modellen chatten

Kostenlos chatten

Inference-API

EU-gehostete Inferenz

API-Zugang erhalten

Vollständiger Vergleich

Metrik	Top-Wahl Op GPT-5.2 (xhigh) OpenAI	xA Grok 4.20 0309 (Reasoning) xAI
Preise pro 1 Mio. Tokens
Input-Kosten	$1.75/1M	$2.00/1M
Output-Kosten	$14.00/1M	$6.00/1M
Gemischt (3:1)	$4.81/1M	$3.00/1M
Spezifikationen
Anbieter	OpenAI	xAI
Veröffentlichung	11. Dez. 2025	10. März 2026
Leistung & Geschwindigkeit
Durchsatz	86.3 tok/s	217.5 tok/s
TTFT	123885ms	17414ms
Latenz	123885ms	17414ms
Composite-Indizes
Wert-Score	84.0	100.0
Reasoning-Score	75.0	55.7
Intelligenz	51.3	48.5
Coding	48.7	42.2
Mathe	99.0	—
Standard-Benchmarks
GPQA	90.3%	88.5%
MMLU Pro	87.4%	—
HLE	35.4%	30.0%
LiveCodeBench	88.9%	—
AIME 2025	99.0%	—
SciCode	52.1%	44.7%
LCR	72.7%	59.0%
IFBench	75.4%	82.9%
TAU-bench v2	84.8%	96.5%
TerminalBench Hard	47.0%	40.9%