Modellvergleich

Kimi K2 Thinking
vs. Step 3.5 Flash 2603

Vergleich von 2 KI-Modellen · 10 Benchmarks · MoonshotAI, StepFun

Empfehlung

Kimi K2 Thinking 9 Metrik-Siege

Staerkste Bereiche: TTFT, Reasoning, Intelligenz

Bester Wert

Step 3.5 Flash 2603

100.0 Wert-Score

47.9 Reasoning / $0.15/1M

Niedrigster Preis

Step 3.5 Flash 2603

$0.10/1M Eingabepreis

Bestes Reasoning

Kimi K2 Thinking

67.3 Reasoning-Score

Kombiniert verfuegbare Reasoning-Benchmarks

Bestes Coding

Kimi K2 Thinking

34.8 Coding-Index

Composite Indices

Higher is better; speed and price are normalized

Standard Benchmarks

Only benchmarks with data are shown

Wichtige Unterschiede

Bester Wert

Step 3.5 Flash 2603 bietet den besten Qualitaets-Preis-Mix mit 100.0 von 100 Wertpunkten.

Preisunterschied

Step 3.5 Flash 2603 ist 6,0x guenstiger bei Eingabetokens als Kimi K2 Thinking.

Geschwindigkeitsunterschied

Step 3.5 Flash 2603 generiert etwa 1,6x so viele Tokens pro Sekunde wie Kimi K2 Thinking.

Reasoning-Unterschied

Kimi K2 Thinking liegt 19.4 Punkte vor Step 3.5 Flash 2603 beim Reasoning.

Coding-Unterschied

Kimi K2 Thinking liegt 0.2 Punkte vor Step 3.5 Flash 2603 beim Coding.

Live compare

Response Face-Off

Sende einen Prompt an die ausgewaehlten Modelle und vergleiche Antwortqualitaet mit Live-Metriken zu Tempo und Kosten.

Kimi K2 Thinking

MoonshotAI

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Step 3.5 Flash 2603

StepFun

Bereit

TTFT

—

Zeit

—

tok/s

—

Tokens

—

Kosten

—

Bereit

Welche Antwort war nuetzlicher?

KI-Chat

Mit 80+ Modellen chatten

Kostenlos chatten

Inference-API

EU-gehostete Inferenz

API-Zugang erhalten

Vollständiger Vergleich

Metrik	Top-Wahl Mo Kimi K2 Thinking MoonshotAI	St Step 3.5 Flash 2603 StepFun
Preise pro 1 Mio. Tokens
Input-Kosten	$0.60/1M	$0.10/1M
Output-Kosten	$2.50/1M	$0.30/1M
Gemischt (3:1)	$1.07/1M	$0.15/1M
Spezifikationen
Anbieter	MoonshotAI	StepFun
Veröffentlichung	6. Nov. 2025	2. Apr. 2026
Leistung & Geschwindigkeit
Durchsatz	128.9 tok/s	206.6 tok/s
TTFT	962ms	1021ms
Latenz	16475ms	10700ms
Composite-Indizes
Wert-Score	19.6	100.0
Reasoning-Score	67.3	47.9
Intelligenz	40.9	38.5
Coding	34.8	34.6
Mathe	94.7	—
Standard-Benchmarks
GPQA	83.8%	82.6%
MMLU Pro	84.8%	—
HLE	22.3%	22.6%
LiveCodeBench	85.3%	—
AIME 2025	94.7%	—
SciCode	42.4%	38.5%
LCR	66.3%	54.3%
IFBench	68.1%	66.5%
TAU-bench v2	93.0%	87.4%
TerminalBench Hard	31.1%	32.6%