Modellvergleich
Magistral Medium 1.2
vs. Small (Feb '24)
Vergleich von 2 KI-Modellen · 12 Benchmarks · Mistral
Empfehlung
Staerkste Bereiche: Preis-Leistung, Reasoning, Intelligenz
Bester Wert
Magistral Medium 1.2
100.0 Wert-Score
54.9 Reasoning / $2.75/1M
Niedrigster Preis
Small (Feb '24)
$1.00/1M Eingabepreis
Bestes Reasoning
Magistral Medium 1.2
54.9 Reasoning-Score
Kombiniert verfuegbare Reasoning-Benchmarks
Bestes Coding
Magistral Medium 1.2
21.7 Coding-Index
Composite Indices
Higher is better; speed and price are normalized
Standard Benchmarks
Only benchmarks with data are shown
Wichtige Unterschiede
Bester Wert
Magistral Medium 1.2 bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.
Preisunterschied
Small (Feb '24) ist 2,0x guenstiger bei Eingabetokens als Magistral Medium 1.2.
Geschwindigkeitsunterschied
Small (Feb '24) generiert etwa 4,0x so viele Tokens pro Sekunde wie Magistral Medium 1.2.
Reasoning-Unterschied
Magistral Medium 1.2 liegt 34.8 Punkte vor Small (Feb '24) beim Reasoning.
Top-Wahl-Begruendung
Magistral Medium 1.2 gewinnt 8 messbare Kategorien, darunter Preis-Leistung, Reasoning, Intelligenz, GPQA.
Response Face-Off
Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.
Magistral Medium 1.2
Mistral
TTFT
—
Zeit
—
tok/s
—
Tokens
—
Kosten
—
Small (Feb '24)
Mistral
TTFT
—
Zeit
—
tok/s
—
Tokens
—
Kosten
—
Welche Antwort war nuetzlicher?
Vollständiger Vergleich
| Metrik | Top-Wahl Mi Magistral Medium 1.2 | Mi Small (Feb '24) |
|---|---|---|
| Preise pro 1 Mio. Tokens | ||
| Input-Kosten | $2.00/1M | $1.00/1M |
| Output-Kosten | $5.00/1M | $3.00/1M |
| Gemischt (3:1) | $2.75/1M | $1.50/1M |
| Spezifikationen | ||
| Anbieter | Mistral | Mistral |
| Veröffentlichung | 18. Sept. 2025 | 26. Feb. 2024 |
| Leistung & Geschwindigkeit | ||
| Durchsatz | 39.9 tok/s | 159.4 tok/s |
| TTFT | 516ms | 488ms |
| Latenz | 50587ms | 488ms |
| Composite-Indizes | ||
| Wert-Score | 100.0 | 67.1 |
| Reasoning-Score | 54.9 | 20.1 |
| Intelligenz | 27.1 | 9.0 |
| Coding | 21.7 | — |
| Mathe | 82.0 | — |
| Standard-Benchmarks | ||
| GPQA | 73.9% | 30.2% |
| MMLU Pro | 81.5% | 41.9% |
| HLE | 9.6% | 4.4% |
| LiveCodeBench | 75.0% | 11.1% |
| MATH 500 | — | 56.2% |
| AIME 2025 | 82.0% | — |
| AIME (Original) | — | 0.7% |
| SciCode | 39.2% | 13.4% |
| LCR | 51.3% | — |
| IFBench | 43.0% | — |
| TAU-bench v2 | 52.0% | — |
| TerminalBench Hard | 12.9% | — |
Wichtigste Erkenntnisse
Small (Feb '24) bietet das beste Preis-Leistungs-Verhaeltnis mit $1.00/1M, ideal fuer volumenstarke Anwendungen und kostenbewusste Projekte.
Magistral Medium 1.2 hat das staerkste Reasoning-Profil mit 54.9 Reasoning-Score, basierend auf den verfuegbaren Reasoning-Benchmarks.
Magistral Medium 1.2 erreicht einen 21.7 Coding-Index, und ist damit eine Top-Wahl fuer Softwareentwicklung und Code-Generierung.
Alle Modelle unterstuetzen Kontextfenster von ∞+ Tokens, geeignet fuer lange Dokumente und ausgedehnte Gespraeche.
Wann welches Modell sinnvoll ist
Magistral Medium 1.2
- Komplexe Reasoning-Aufgaben
- Forschung und Analyse
- Code-Generierung
- Softwareentwicklung
Small (Feb '24)
- Kostensensitive Anwendungen
- Hohe Verarbeitungslast