Modellvergleich

Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)
vs. Grok 4.3 (low)

Vergleich von 2 KI-Modellen · 7 Benchmarks · Anthropic, xAI

Empfehlung

Grok 4.3 (low) 9 Metrik-Siege

Staerkste Bereiche: Preis-Leistung, Eingabepreis, Ausgabepreis

Bester Wert

Grok 4.3 (low)

100.0 Wert-Score

48.5 Reasoning / $1.56/1M

Niedrigster Preis

Grok 4.3 (low)

$1.25/1M Eingabepreis

Bestes Reasoning

Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

56.4 Reasoning-Score

Kombiniert verfuegbare Reasoning-Benchmarks

Bestes Coding

Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

50.9 Coding-Index

Composite Indices

Higher is better; speed and price are normalized

Standard Benchmarks

Only benchmarks with data are shown

Wichtige Unterschiede

Bester Wert

Grok 4.3 (low) bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.

Preisunterschied

Grok 4.3 (low) ist 2,4x guenstiger bei Eingabetokens als Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort).

Geschwindigkeitsunterschied

Grok 4.3 (low) generiert etwa 2,3x so viele Tokens pro Sekunde wie Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort).

Reasoning-Unterschied

Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort) liegt 7.9 Punkte vor Grok 4.3 (low) beim Reasoning.

Coding-Unterschied

Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort) liegt 19.3 Punkte vor Grok 4.3 (low) beim Coding.

Live compare

Response Face-Off

Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.

Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

Anthropic

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Grok 4.3 (low)

xAI

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Welche Antwort war nuetzlicher?

KI-Chat

Mit 80+ Modellen chatten

Kostenlos chatten

Inference-API

EU-gehostete Inferenz

API-Zugang erhalten

Vollständiger Vergleich

Metrik	An Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort) Anthropic	Top-Wahl xA Grok 4.3 (low) xAI
Preise pro 1 Mio. Tokens
Input-Kosten	$3.00/1M	$1.25/1M
Output-Kosten	$15.00/1M	$2.50/1M
Gemischt (3:1)	$6.00/1M	$1.56/1M
Spezifikationen
Anbieter	Anthropic	xAI
Veröffentlichung	17. Feb. 2026	30. Apr. 2026
Leistung & Geschwindigkeit
Durchsatz	62.0 tok/s	143.1 tok/s
TTFT	83562ms	6061ms
Latenz	83562ms	6061ms
Composite-Indizes
Wert-Score	30.3	100.0
Reasoning-Score	56.4	48.5
Intelligenz	51.7	43.9
Coding	50.9	31.6
Standard-Benchmarks
GPQA	87.5%	84.3%
HLE	30.0%	17.3%
SciCode	46.8%	41.9%
LCR	70.7%	64.0%
IFBench	56.6%	81.0%
TAU-bench v2	75.7%	88.9%
TerminalBench Hard	53.0%	26.5%

Wichtigste Erkenntnisse

Grok 4.3 (low) bietet das beste Preis-Leistungs-Verhaeltnis mit $1.25/1M, ideal fuer volumenstarke Anwendungen und kostenbewusste Projekte.

Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort) hat das staerkste Reasoning-Profil mit 56.4 Reasoning-Score, basierend auf den verfuegbaren Reasoning-Benchmarks.

Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort) erreicht einen 50.9 Coding-Index, und ist damit eine Top-Wahl fuer Softwareentwicklung und Code-Generierung.

Alle Modelle unterstuetzen Kontextfenster von ∞+ Tokens, geeignet fuer lange Dokumente und ausgedehnte Gespraeche.