Modellvergleich

Devstral Medium
vs. Medium 3.5

Vergleich von 2 KI-Modellen · 12 Benchmarks · Mistral

Empfehlung

Medium 3.5 12 Metrik-Siege

Staerkste Bereiche: Durchsatz, TTFT, Reasoning

Bester Wert

Devstral Medium

100.0 Wert-Score

22.6 Reasoning / $0.80/1M

Niedrigster Preis

Devstral Medium

$0.40/1M Eingabepreis

Bestes Reasoning

Medium 3.5

42.3 Reasoning-Score

Kombiniert verfuegbare Reasoning-Benchmarks

Bestes Coding

Medium 3.5

35.4 Coding-Index

Composite Indices

Higher is better; speed and price are normalized

Standard Benchmarks

Only benchmarks with data are shown

Wichtige Unterschiede

Bester Wert

Devstral Medium bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.

Preisunterschied

Devstral Medium ist 3,8x guenstiger bei Eingabetokens als Medium 3.5.

Geschwindigkeitsunterschied

Medium 3.5 generiert etwa 2,2x so viele Tokens pro Sekunde wie Devstral Medium.

Reasoning-Unterschied

Medium 3.5 liegt 19.6 Punkte vor Devstral Medium beim Reasoning.

Coding-Unterschied

Medium 3.5 liegt 19.5 Punkte vor Devstral Medium beim Coding.

Live compare

Response Face-Off

Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.

Devstral Medium

Mistral

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Medium 3.5

Mistral

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Welche Antwort war nuetzlicher?

KI-Chat

Mit 80+ Modellen chatten

Kostenlos chatten

Inference-API

EU-gehostete Inferenz

API-Zugang erhalten

Vollständiger Vergleich

Metrik	Mi Devstral Medium Mistral	Top-Wahl Mi Medium 3.5 Mistral
Preise pro 1 Mio. Tokens
Input-Kosten	$0.40/1M	$1.50/1M
Output-Kosten	$2.00/1M	$7.50/1M
Gemischt (3:1)	$0.80/1M	$3.00/1M
Spezifikationen
Anbieter	Mistral	Mistral
Veröffentlichung	10. Juli 2025	29. Apr. 2026
Leistung & Geschwindigkeit
Durchsatz	53.0 tok/s	118.5 tok/s
TTFT	598ms	562ms
Latenz	598ms	17446ms
Composite-Indizes
Wert-Score	100.0	49.8
Reasoning-Score	22.6	42.3
Intelligenz	18.7	39.2
Coding	15.9	35.4
Mathe	4.7	—
Standard-Benchmarks
GPQA	49.2%	74.8%
MMLU Pro	70.8%	—
HLE	3.8%	12.8%
LiveCodeBench	33.7%	—
MATH 500	70.7%	—
AIME 2025	4.7%	—
AIME (Original)	6.7%	—
SciCode	29.4%	39.6%
LCR	28.7%	61.0%
IFBench	29.9%	68.8%
TAU-bench v2	19.9%	94.2%
TerminalBench Hard	9.1%	33.3%