KI-Modell-Ranking (LLM-Leaderboard)

Neueste KI-Modelle

Language models ranked by Artificial Analysis Index

Modell
Name des KI-Modells und Anbieterorganisation
Intelligence
Artificial Analysis Intelligence Index - composite reasoning and capability score across the benchmark suite
Wert
Qualität, Geschwindigkeit und gemischter Token-Preis als relativer Wert-Score
Geschwindigkeit
Inference-Durchsatz in Tokens pro Sekunde - wie schnell das Modell Antworten generiert
Context
Maximum context window size - how much text, code, or conversation the model can process at once
Price
Kosten pro 1 Million Tokens — Input (Text, den Sie senden) / Output (Text, den das Modell erzeugt)
Veröffentlichung
Zeitpunkt der Veröffentlichung - neuere Modelle können mehr Fähigkeiten bieten
Vergleichen
MiniMax KI-Anbieter-Logo - M3
#1 M3
von MiniMax
54.7 k. A. k. A. 1.0M k. A. / k. A. 1. Juni 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.7 Plus
#2 Qwen3.7 Plus
von Alibaba
53.3 38 54 tok/s 1.0M $0.40 / $1.16 1. Juni 2026
Details
StepFun KI-Anbieter-Logo - Step 3.7 Flash
#3 Step 3.7 Flash
von StepFun
42.6 58 386 tok/s 256K $0.20 / $1.15 29. Mai 2026
Details
Anthropic KI-Anbieter-Logo - Claude Opus 4.8 (Adaptive Reasoning, Max Effort)
#4 Claude Opus 4.8 (Adaptive Reasoning, Max Effort)
von Anthropic
61.4 10 53 tok/s 1.0M $6.25 / $25.00 28. Mai 2026
Details
OpenBMB KI-Anbieter-Logo - MiniCPM5-1B (Non-reasoning)
#5 MiniCPM5-1B (Non-reasoning)
von OpenBMB
17.9 k. A. k. A. k. A. k. A. / k. A. 25. Mai 2026
Details
KI-Chat

Mit 80+ Modellen chatten

Inference-API

EU-gehostete Inferenz

Cohere KI-Anbieter-Logo - Command A+
#6 Command A+
von Cohere
37.2 k. A. 212 tok/s 256K k. A. / k. A. 20. Mai 2026
Details
Google KI-Anbieter-Logo - Gemini 3.5 Flash (medium)
#7 Gemini 3.5 Flash (medium)
von Google
54.8 27 206 tok/s 1.0M $1.50 / $9.00 19. Mai 2026
Details
Google KI-Anbieter-Logo - Gemini 3.5 Flash (minimal)
#8 Gemini 3.5 Flash (minimal)
von Google
43.3 21 188 tok/s 1.0M $1.50 / $9.00 19. Mai 2026
Details
Google KI-Anbieter-Logo - Gemini 3.5 Flash (high)
#9 Gemini 3.5 Flash (high)
von Google
55.3 27 195 tok/s 1.0M $1.50 / $9.00 19. Mai 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.7 Max
#10 Qwen3.7 Max
von Alibaba
56.6 26 186 tok/s 1.0M $2.50 / $7.50 19. Mai 2026
Details
China Mobile KI-Anbieter-Logo - JT-35B-Flash
#11 JT-35B-Flash
von China Mobile
36.1 k. A. k. A. k. A. k. A. / k. A. 14. Mai 2026
Details
OpenBMB KI-Anbieter-Logo - MiniCPM-V 4.6 1.3B
#12 MiniCPM-V 4.6 1.3B
von OpenBMB
12.7 k. A. k. A. k. A. k. A. / k. A. 11. Mai 2026
Details
InclusionAI KI-Anbieter-Logo - Ring-2.6-1T
#13 Ring-2.6-1T
von InclusionAI
38.5 37 122 tok/s 262K $0.30 / $2.50 8. Mai 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.5 Instant (May 2026)
#14 GPT-5.5 Instant (May 2026)
von OpenAI
41.8 7 k. A. k. A. $5.00 / $30.00 5. Mai 2026
Details
xAI KI-Anbieter-Logo - Grok 4.3 (medium)
#15 Grok 4.3 (medium)
von xAI
48.8 35 126 tok/s k. A. $1.25 / $2.50 30. Apr. 2026
Details
xAI KI-Anbieter-Logo - Grok 4.3 (high)
#16 Grok 4.3 (high)
von xAI
53.2 38 125 tok/s k. A. $1.25 / $2.50 30. Apr. 2026
Details
xAI KI-Anbieter-Logo - Grok 4.3 (low)
#17 Grok 4.3 (low)
von xAI
43.9 32 127 tok/s k. A. $1.25 / $2.50 30. Apr. 2026
Details
xAI KI-Anbieter-Logo - Grok 4.3 (Non-reasoning)
#18 Grok 4.3 (Non-reasoning)
von xAI
31.0 20 109 tok/s k. A. $1.25 / $2.50 30. Apr. 2026
Details
Mistral KI-Anbieter-Logo - Medium 3.5
#19 Medium 3.5
von Mistral
39.2 20 138 tok/s k. A. $1.50 / $7.50 29. Apr. 2026
Details
NVIDIA KI-Anbieter-Logo - Nemotron 3 Nano Omni 30B A3B Reasoning
#20 Nemotron 3 Nano Omni 30B A3B Reasoning
von NVIDIA
21.4 53 277 tok/s k. A. $0.07 / $0.30 29. Apr. 2026
Details
IBM KI-Anbieter-Logo - Granite 4.1 30B
#21 Granite 4.1 30B
von IBM
14.7 k. A. k. A. k. A. k. A. / k. A. 29. Apr. 2026
Details
IBM KI-Anbieter-Logo - Granite 4.1 3B
#22 Granite 4.1 3B
von IBM
8.5 k. A. k. A. k. A. k. A. / k. A. 29. Apr. 2026
Details
IBM KI-Anbieter-Logo - Granite 4.1 8B
#23 Granite 4.1 8B
von IBM
12.4 45 134 tok/s k. A. $0.05 / $0.10 29. Apr. 2026
Details
DeepSeek KI-Anbieter-Logo - V4 Pro (Reasoning, Max Effort)
#24 V4 Pro (Reasoning, Max Effort)
von DeepSeek
51.5 38 46 tok/s 1.0M $0.43 / $0.87 24. Apr. 2026
Details
DeepSeek KI-Anbieter-Logo - V4 Flash (Reasoning, High Effort)
#25 V4 Flash (Reasoning, High Effort)
von DeepSeek
46.0 60 k. A. 1.0M $0.14 / $0.28 24. Apr. 2026
Details
DeepSeek KI-Anbieter-Logo - V4 Pro (Non-reasoning)
#26 V4 Pro (Non-reasoning)
von DeepSeek
39.3 29 43 tok/s 1.0M $0.43 / $0.87 24. Apr. 2026
Details
DeepSeek KI-Anbieter-Logo - V4 Flash (Reasoning, Max Effort)
#27 V4 Flash (Reasoning, Max Effort)
von DeepSeek
46.5 96 120 tok/s 1.0M $0.14 / $0.28 24. Apr. 2026
Details
DeepSeek KI-Anbieter-Logo - V4 Pro (Reasoning, High Effort)
#28 V4 Pro (Reasoning, High Effort)
von DeepSeek
49.8 37 44 tok/s 1.0M $0.43 / $0.87 24. Apr. 2026
Details
DeepSeek KI-Anbieter-Logo - V4 Flash (Non-reasoning)
#29 V4 Flash (Non-reasoning)
von DeepSeek
36.5 69 109 tok/s 1.0M $0.14 / $0.28 24. Apr. 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.5 (low)
#30 GPT-5.5 (low)
von OpenAI
50.8 8 51 tok/s 1.1M $5.00 / $30.00 23. Apr. 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.5 (high)
#31 GPT-5.5 (high)
von OpenAI
58.9 10 59 tok/s 1.1M $5.00 / $30.00 23. Apr. 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.5 (xhigh)
#32 GPT-5.5 (xhigh)
von OpenAI
60.2 10 67 tok/s 1.1M $5.00 / $30.00 23. Apr. 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.5 (medium)
#33 GPT-5.5 (medium)
von OpenAI
56.7 9 54 tok/s 1.1M $5.00 / $30.00 23. Apr. 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.5 (Non-reasoning)
#34 GPT-5.5 (Non-reasoning)
von OpenAI
40.9 7 49 tok/s 1.1M $5.00 / $30.00 23. Apr. 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.5 Pro (xhigh)
#35 GPT-5.5 Pro (xhigh)
von OpenAI
k. A. k. A. 1.1M k. A. / k. A. 23. Apr. 2026
Details
Tencent KI-Anbieter-Logo - Hy3-preview (Reasoning)
#36 Hy3-preview (Reasoning)
von Tencent
41.9 65 96 tok/s 262K $0.12 / $0.43 23. Apr. 2026
Details
Tencent KI-Anbieter-Logo - Hy3-preview (Non-reasoning)
#37 Hy3-preview (Non-reasoning)
von Tencent
33.7 46 84 tok/s 262K $0.12 / $0.43 23. Apr. 2026
Details
InclusionAI KI-Anbieter-Logo - Ling-2.6-1T
#38 Ling-2.6-1T
von InclusionAI
33.6 20 k. A. 262K $0.30 / $2.50 23. Apr. 2026
Details
Xiaomi KI-Anbieter-Logo - MiMo-V2.5-Pro
#39 MiMo-V2.5-Pro
von Xiaomi
53.8 40 43 tok/s 1.0M $0.43 / $0.87 22. Apr. 2026
Details
Xiaomi KI-Anbieter-Logo - MiMo-V2.5
#40 MiMo-V2.5
von Xiaomi
49.0 66 77 tok/s 1.0M $0.14 / $0.28 22. Apr. 2026
Details
Xiaomi KI-Anbieter-Logo - MiMo-V2.5-Pro (Non-reasoning)
#41 MiMo-V2.5-Pro (Non-reasoning)
von Xiaomi
35.6 17 44 tok/s 1.0M $0.90 / $2.70 22. Apr. 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.6 27B (Non-reasoning)
#42 Qwen3.6 27B (Non-reasoning)
von Alibaba
37.1 17 53 tok/s 262K $0.60 / $3.60 22. Apr. 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.6 27B (Reasoning)
#43 Qwen3.6 27B (Reasoning)
von Alibaba
45.8 21 55 tok/s 262K $0.60 / $3.60 22. Apr. 2026
Details
InclusionAI KI-Anbieter-Logo - Ling 2.6 Flash
#44 Ling 2.6 Flash
von InclusionAI
26.2 37 k. A. 262K $0.10 / $0.30 21. Apr. 2026
Details
MoonshotAI KI-Anbieter-Logo - Kimi K2.6
#45 Kimi K2.6
von MoonshotAI
53.9 22 42 tok/s 262K $0.95 / $4.00 20. Apr. 2026
Details
MoonshotAI KI-Anbieter-Logo - Kimi K2.6 (Non-reasoning)
#46 Kimi K2.6 (Non-reasoning)
von MoonshotAI
42.9 18 39 tok/s 262K $0.95 / $4.00 20. Apr. 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.6 Max Preview
#47 Qwen3.6 Max Preview
von Alibaba
51.8 16 41 tok/s 262K $1.30 / $7.80 20. Apr. 2026
Details
Anthropic KI-Anbieter-Logo - Claude Opus 4.7 (Adaptive Reasoning, Max Effort)
#48 Claude Opus 4.7 (Adaptive Reasoning, Max Effort)
von Anthropic
57.3 9 47 tok/s 1.0M $6.25 / $25.00 16. Apr. 2026
Details
Anthropic KI-Anbieter-Logo - Claude Opus 4.7 (Non-reasoning, High Effort)
#49 Claude Opus 4.7 (Non-reasoning, High Effort)
von Anthropic
51.8 8 42 tok/s k. A. $6.25 / $25.00 16. Apr. 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.6 35B A3B (Reasoning)
#50 Qwen3.6 35B A3B (Reasoning)
von Alibaba
43.5 53 160 tok/s 262K $0.25 / $1.49 16. Apr. 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.6 35B A3B (Non-reasoning)
#51 Qwen3.6 35B A3B (Non-reasoning)
von Alibaba
31.5 31 159 tok/s 262K $0.38 / $2.25 16. Apr. 2026
Details
China Mobile KI-Anbieter-Logo - JT-MINI
#52 JT-MINI
von China Mobile
25.4 k. A. k. A. k. A. k. A. / k. A. 15. Apr. 2026
Details
LG AI Research KI-Anbieter-Logo - EXAONE 4.5 33B (Non-reasoning)
#53 EXAONE 4.5 33B (Non-reasoning)
von LG AI Research
k. A. k. A. k. A. k. A. / k. A. 9. Apr. 2026
Details
LG AI Research KI-Anbieter-Logo - EXAONE 4.5 33B
#54 EXAONE 4.5 33B
von LG AI Research
30.2 k. A. k. A. k. A. k. A. / k. A. 9. Apr. 2026
Details
Meta KI-Anbieter-Logo - Muse Spark
#55 Muse Spark
von Meta
52.2 k. A. k. A. k. A. k. A. / k. A. 8. Apr. 2026
Details
Z AI KI-Anbieter-Logo - GLM-5.1 (Reasoning)
#56 GLM-5.1 (Reasoning)
von Z AI
51.4 19 47 tok/s 203K $1.40 / $4.40 7. Apr. 2026
Details
Z AI KI-Anbieter-Logo - GLM-5.1 (Non-reasoning)
#57 GLM-5.1 (Non-reasoning)
von Z AI
43.8 16 46 tok/s 203K $1.40 / $4.40 7. Apr. 2026
Details
xAI KI-Anbieter-Logo - Grok 4.20 0309 v2 (Reasoning)
#58 Grok 4.20 0309 v2 (Reasoning)
von xAI
49.3 26 169 tok/s k. A. $2.00 / $6.00 7. Apr. 2026
Details
xAI KI-Anbieter-Logo - Grok 4.20 0309 v2 (Non-reasoning)
#59 Grok 4.20 0309 v2 (Non-reasoning)
von xAI
29.0 15 161 tok/s k. A. $2.00 / $6.00 7. Apr. 2026
Details
Upstage KI-Anbieter-Logo - Solar Pro 3
#60 Solar Pro 3
von Upstage
25.9 k. A. k. A. 128K k. A. / k. A. 6. Apr. 2026
Details
Google KI-Anbieter-Logo - Gemma 4 E4B (Non-reasoning)
#61 Gemma 4 E4B (Non-reasoning)
von Google
14.8 k. A. k. A. k. A. k. A. / k. A. 3. Apr. 2026
Details
Google KI-Anbieter-Logo - Gemma 4 E4B (Reasoning)
#62 Gemma 4 E4B (Reasoning)
von Google
18.8 k. A. k. A. k. A. k. A. / k. A. 3. Apr. 2026
Details
Google KI-Anbieter-Logo - Gemma 4 26B A4B (Reasoning)
#63 Gemma 4 26B A4B (Reasoning)
von Google
31.2 38 k. A. 262K $0.13 / $0.40 2. Apr. 2026
Details
Google KI-Anbieter-Logo - Gemma 4 26B A4B (Non-reasoning)
#64 Gemma 4 26B A4B (Non-reasoning)
von Google
27.1 33 65 tok/s 262K $0.13 / $0.40 2. Apr. 2026
Details
Google KI-Anbieter-Logo - Gemma 4 31B (Non-reasoning)
#65 Gemma 4 31B (Non-reasoning)
von Google
32.3 39 28 tok/s 262K $0.14 / $0.40 2. Apr. 2026
Details
Google KI-Anbieter-Logo - Gemma 4 31B (Reasoning)
#66 Gemma 4 31B (Reasoning)
von Google
39.2 k. A. 35 tok/s 262K k. A. / k. A. 2. Apr. 2026
Details
Google KI-Anbieter-Logo - Gemma 4 E2B (Reasoning)
#67 Gemma 4 E2B (Reasoning)
von Google
15.2 k. A. k. A. k. A. k. A. / k. A. 2. Apr. 2026
Details
Google KI-Anbieter-Logo - Gemma 4 E2B (Non-reasoning)
#68 Gemma 4 E2B (Non-reasoning)
von Google
12.1 k. A. k. A. k. A. k. A. / k. A. 2. Apr. 2026
Details
StepFun KI-Anbieter-Logo - Step 3.5 Flash 2603
#69 Step 3.5 Flash 2603
von StepFun
38.5 90 231 tok/s 262K $0.10 / $0.30 2. Apr. 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.6 Plus
#70 Qwen3.6 Plus
von Alibaba
50.0 26 53 tok/s 1.0M $0.50 / $3.00 2. Apr. 2026
Details
Arcee AI KI-Anbieter-Logo - Trinity Large Thinking
#71 Trinity Large Thinking
von Arcee AI
31.9 46 162 tok/s 262K $0.23 / $0.88 1. Apr. 2026
Details
Z AI KI-Anbieter-Logo - GLM 5V Turbo (Reasoning)
#72 GLM 5V Turbo (Reasoning)
von Z AI
42.9 k. A. k. A. 203K k. A. / k. A. 1. Apr. 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.5 Omni Flash
#73 Qwen3.5 Omni Flash
von Alibaba
25.9 45 224 tok/s k. A. $0.10 / $0.80 30. März 2026
Details
Alibaba KI-Anbieter-Logo - Qwen3.5 Omni Plus
#74 Qwen3.5 Omni Plus
von Alibaba
38.6 17 53 tok/s k. A. $0.40 / $4.80 30. März 2026
Details
Xiaomi KI-Anbieter-Logo - MiMo-V2-Omni-0327
#75 MiMo-V2-Omni-0327
von Xiaomi
44.9 31 86 tok/s k. A. $0.40 / $2.00 27. März 2026
Details
KwaiKAT KI-Anbieter-Logo - KAT Coder Pro V2
#76 KAT Coder Pro V2
von KwaiKAT
43.8 52 118 tok/s 256K $0.30 / $1.20 27. März 2026
Details
NVIDIA KI-Anbieter-Logo - Nemotron Cascade 2 30B A3B
#77 Nemotron Cascade 2 30B A3B
von NVIDIA
28.4 k. A. k. A. k. A. k. A. / k. A. 19. März 2026
Details
Xiaomi KI-Anbieter-Logo - MiMo-V2-Omni
#78 MiMo-V2-Omni
von Xiaomi
43.4 k. A. 81 tok/s k. A. k. A. / k. A. 19. März 2026
Details
MiniMax KI-Anbieter-Logo - M2.7
#79 M2.7
von MiniMax
49.6 37 75 tok/s 205K $0.30 / $1.20 18. März 2026
Details
Xiaomi KI-Anbieter-Logo - MiMo-V2-Pro
#80 MiMo-V2-Pro
von Xiaomi
49.2 22 43 tok/s k. A. $1.00 / $3.00 18. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 nano (xhigh)
#81 GPT-5.4 nano (xhigh)
von OpenAI
44.0 58 164 tok/s 400K $0.20 / $1.25 17. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 nano (Non-Reasoning)
#82 GPT-5.4 nano (Non-Reasoning)
von OpenAI
24.4 32 159 tok/s 400K $0.20 / $1.25 17. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 mini (xhigh)
#83 GPT-5.4 mini (xhigh)
von OpenAI
48.9 34 151 tok/s 400K $0.75 / $4.50 17. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 mini (Non-Reasoning)
#84 GPT-5.4 mini (Non-Reasoning)
von OpenAI
23.3 16 150 tok/s 400K $0.75 / $4.50 17. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 nano (medium)
#85 GPT-5.4 nano (medium)
von OpenAI
38.1 51 157 tok/s 400K $0.20 / $1.25 17. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 mini (medium)
#86 GPT-5.4 mini (medium)
von OpenAI
37.7 26 161 tok/s 400K $0.75 / $4.50 17. März 2026
Details
Mistral KI-Anbieter-Logo - Small 4 (Reasoning)
#87 Small 4 (Reasoning)
von Mistral
27.8 49 172 tok/s k. A. $0.15 / $0.60 16. März 2026
Details
Mistral KI-Anbieter-Logo - Small 4 (Non-reasoning)
#88 Small 4 (Non-reasoning)
von Mistral
18.6 33 158 tok/s k. A. $0.15 / $0.60 16. März 2026
Details
NVIDIA KI-Anbieter-Logo - Nemotron 3 Nano 4B
#89 Nemotron 3 Nano 4B
von NVIDIA
14.7 k. A. k. A. k. A. k. A. / k. A. 16. März 2026
Details
Z AI KI-Anbieter-Logo - GLM-5-Turbo
#90 GLM-5-Turbo
von Z AI
46.8 k. A. k. A. 203K k. A. / k. A. 15. März 2026
Details
NVIDIA KI-Anbieter-Logo - Nemotron 3 Super 120B A12B (Reasoning)
#91 Nemotron 3 Super 120B A12B (Reasoning)
von NVIDIA
36.0 51 150 tok/s 1.0M $0.30 / $0.75 11. März 2026
Details
xAI KI-Anbieter-Logo - Grok 4.20 0309 (Reasoning)
#92 Grok 4.20 0309 (Reasoning)
von xAI
48.5 25 166 tok/s k. A. $2.00 / $6.00 10. März 2026
Details
xAI KI-Anbieter-Logo - Grok 4.20 0309 (Non-reasoning)
#93 Grok 4.20 0309 (Non-reasoning)
von xAI
29.7 15 159 tok/s k. A. $2.00 / $6.00 10. März 2026
Details
Sarvam KI-Anbieter-Logo - 105B (high)
#94 105B (high)
von Sarvam
18.2 49 101 tok/s k. A. $0.04 / $0.17 6. März 2026
Details
Sarvam KI-Anbieter-Logo - 30B (high)
#95 30B (high)
von Sarvam
12.3 51 148 tok/s k. A. $0.03 / $0.11 6. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 (Non-reasoning)
#96 GPT-5.4 (Non-reasoning)
von OpenAI
35.4 8 59 tok/s 1.1M $2.50 / $15.00 5. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 (low)
#97 GPT-5.4 (low)
von OpenAI
47.9 11 64 tok/s 1.1M $2.50 / $15.00 5. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 (xhigh)
#98 GPT-5.4 (xhigh)
von OpenAI
56.8 13 75 tok/s 1.1M $2.50 / $15.00 5. März 2026
Details
OpenAI KI-Anbieter-Logo - GPT-5.4 Pro (xhigh)
#99 GPT-5.4 Pro (xhigh)
von OpenAI
k. A. k. A. 1.1M $30.00 / $180.00 5. März 2026
Details
Google KI-Anbieter-Logo - Gemini 3.1 Flash-Lite
#100 Gemini 3.1 Flash-Lite
von Google
33.5 40 274 tok/s 1.0M $0.25 / $1.50 3. März 2026
Details

Zeige 100 von 529 Modelle

Das KI-Modell-Leaderboard verstehen

Dieses umfassende KI-Modell-Leaderboard hilft Ihnen, zu vergleichen und auszuwählen die besten Large Language Models (LLMs) für Ihre Anforderungen. Wir erfassen standardisierte KI-Benchmarks, Token-Preise, Inference-Geschwindigkeit und Modellfähigkeiten bei allen großen KI-Anbietern wie OpenAI, Anthropic, Google, Meta, und DeepSeek.

Kern-KI-Benchmarks erklärt

MMLU-Pro Testet breites Wissen über 14 akademische Fachbereiche
GPQA Denken & Problemlösung auf Promotionsniveau
AIME 2025 Mathematisches Denken auf Spitzenniveau
Coding Index LiveCodeBench + SciCode kombiniert
Math Index AIME + MATH-500 kombiniert

Wichtige Kennzahlen

Token-Preisgestaltung Input- vs. Output-Kosten pro 1 Mio. Tokens
Inference-Geschwindigkeit Tokens/Sekunde für Antwortzeit
Veröffentlichungsdatum Neueste Techniken & Wissensstand
Benchmark-Scores Fähigkeitsvergleich von 0-100 %

So wählen Sie das richtige KI-Modell für Ihren Use Case

Für Forschung & Analyse

Priorisieren Sie Modelle mit hohen MMLU-Pro- (70 %+) und GPQA-Werten (60 %+), wenn es um komplexe Denkaufgaben, wissenschaftliche Recherche und technische Dokumentation geht

Für Kostenoptimierung

Sortieren Sie nach Input-/Output-Preisen - kleinere Modelle liefern bei einfachen Aufgaben oft 80 % der Flaggschiff-Leistung zu 10 % der Kosten

Für Mathe & MINT

Filtern Sie nach Math-Index oder AIME-2025-Scores (50 %+) für quantitative Analysen, Engineering-Berechnungen und wissenschaftliche Anwendungen

Alle Benchmark-Scores und Preisdaten werden täglich von Artificial Analysis aktualisiert, um die neuesten Modellversionen und Fähigkeiten abzubilden. Nutzen Sie die Sortierfilter oben, um KI-Modelle nach Intelligenz, Kosten, Coding-Fähigkeit, Mathe-Leistung, Geschwindigkeit oder Veröffentlichungsdatum zu finden.

Häufig gestellte Fragen

Was ist MMLU-Pro und warum gilt es als Standard-Benchmark für KI-Intelligenz?

MMLU-Pro (Massive Multitask Language Understanding - Professional) ist der umfassendste KI-Benchmark und testet Modelle in 14 akademischen Fachbereichen, darunter Mathematik, Naturwissenschaften, Geschichte, Recht und Ethik. Die Werte reichen von 46 % (Grundkompetenz) bis 87 % (nahe Expertenniveau). Modelle über 75 % zeigen starke allgemeine Intelligenz für professionelle Anwendungen, während Werte unter 60 % auf Einschränkungen bei komplexen Denkaufgaben hindeuten.

Was misst GPQA und welche Modelle erzielen die höchsten Werte?

GPQA (Graduate-level Google-Proof Q&A) prüft Denken auf Promotionsniveau mit Fragen, die bewusst "Google-proof" sind - sie erfordern tiefes Verständnis statt bloßer Faktenrecherche. Spitzenmodelle wie GPT-5.1 (87,3 %), GPT-5 mini (82,8 %) und o3 (82,7 %) sind bei GPQA besonders stark und eignen sich für Forschung, technische Analysen und komplexe Problemlösung. Modelle unter 50 % GPQA haben oft Schwierigkeiten bei anspruchsvollem Denken und liefern eher oberflächliche Antworten.

Was ist AIME 2025 und wie bewertet es die mathematischen Fähigkeiten von KI?

AIME 2025 (American Invitational Mathematics Examination) ist ein Benchmark auf Wettbewerbsniveau, der fortgeschrittene Problemlösung, Algebra, Geometrie und Zahlentheorie testet. Werte über 80 % (wie GPT-5 Codex mit 98,7 % oder GPT-5.1 mit 94 %) zeigen außergewöhnliches mathematisches Denken für Engineering, Scientific Computing und quantitative Analysen. Modelle unter 50 % können bei mehrstufigen mathematischen Aufgaben Probleme haben oder benötigen eine explizite Aufschlüsselung.

Wie wird die Preisgestaltung von KI-Modellen berechnet und was gilt als kosteneffizient?

Die Preise von KI-Modellen werden pro 1 Million Tokens berechnet (etwa 750.000 Wörter). Input-Preise betreffen den Text, den Sie senden, Output-Preise die generierten Antworten. Günstige Modelle wie Llama 3.3 70B kosten $0.54/$0.71 pro Million Tokens, Mid-Tier-Modelle wie GPT-5 nano $0.05/$0.40, Premium-Modelle wie GPT-5 $1.25/$10. Bei typischen Anwendungen mit einem Input-/Output-Verhältnis von 3:1 können Budget-Modelle 10- bis 20-mal günstiger sein und dennoch 70-80 % der Leistung liefern.

Welche KI-Modelle eignen sich am besten für Coding und Programmierung?

Sortieren Sie nach Coding Index um die besten Programmiermodelle zu sehen. Unser Coding Index kombiniert LiveCodeBench, SciCode und Coding-Benchmarks. Zu den Top-Performern gehören GPT-5.1 (57,5), GPT-5 mini (51,4) und GPT-5 Codex (53,5). Diese Modelle sind stark bei Codegenerierung, Debugging, Refactoring und der Erklärung komplexer Algorithmen. Für kostenbewusste Entwickler bieten Modelle mit 40+ Punkten im Coding Index ein sehr gutes Preis-Leistungs-Verhältnis für Routineaufgaben.

Wie oft werden KI-Modell-Benchmarks und Rankings aktualisiert?

Unser Leaderboard wird täglich mit der Artificial Analysis API synchronisiert, damit Benchmark-Scores (MMLU-Pro, GPQA, AIME 2025), Preise und Inference-Geschwindigkeit die neuesten Modellversionen widerspiegeln. Neue Modell-Releases erscheinen sofort unter der Sortierung "Neueste". Benchmark-Scores können sich ändern, wenn Anbieter aktualisierte Versionen veröffentlichen - zum Beispiel erreichte GPT-5.1 (veröffentlicht im November 2025) 69,7 Intelligenzpunkte gegenüber 68,5 bei GPT-5 aus August 2025.

Welche Inference-Geschwindigkeit (Tokens/Sekunde) brauche ich für meine Anwendung?

Die Inference-Geschwindigkeit bestimmt, wie schnell Modelle Antworten erzeugen. Für Echtzeit-Chatbots und interaktive Anwendungen sind 100+ Tokens/Sekunde sinnvoll (z. B. gpt-oss-120B mit 340 tok/s). Für Hintergrundverarbeitung und Batch-Jobs reichen 50-100 tok/s. Premium-Reasoning-Modelle wie GPT-5 (103 tok/s) balancieren Geschwindigkeit und Fähigkeiten. Wichtig: Höhere Geschwindigkeit bedeutet nicht automatisch bessere Qualität - langsamere Modelle liefern oft durchdachtere, detailliertere Antworten.

Kann ich diese KI-Modelle kostenlos testen, bevor ich mich entscheide?

Ja! Probieren Sie unsere kostenlose KI-Chatoberfläche aus, um verschiedene Modelle sofort ohne Account zu testen. Viele Anbieter haben ebenfalls kostenlose Stufen: OpenAI (ChatGPT mit Tageslimits), Anthropic (Claude mit Nutzungslimits), Google (Gemini Free Tier) und Open-Source-Modelle wie Llama 3.3. Vergleichen Sie die Leistung für Ihren konkreten Use Case, bevor Sie auf bezahlte Pläne wechseln.