KI-Modell-Ranking (LLM-Leaderboard)

Beste KI-Mathe-Modelle

Language models ranked by Artificial Analysis Index

Modell
Name des KI-Modells und Anbieterorganisation
Intelligence
Artificial Analysis Intelligence Index - composite reasoning and capability score across the benchmark suite
Wert
Qualität, Geschwindigkeit und gemischter Token-Preis als relativer Wert-Score
Geschwindigkeit
Inference-Durchsatz in Tokens pro Sekunde - wie schnell das Modell Antworten generiert
Context
Maximum context window size - how much text, code, or conversation the model can process at once
Price
Kosten pro 1 Million Tokens — Input (Text, den Sie senden) / Output (Text, den das Modell erzeugt)
Veröffentlichung
Zeitpunkt der Veröffentlichung - neuere Modelle können mehr Fähigkeiten bieten
Vergleichen
OpenAI KI-Anbieter-Logo - GPT-5.2 (xhigh)
#1 GPT-5.2 (xhigh)
von OpenAI
51.3 13 71 tok/s 400K $1.75 / $14.00 11. Dez. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5 Codex (high)
#2 GPT-5 Codex (high)
von OpenAI
44.6 22 171 tok/s 400K $1.25 / $10.00 23. Sept. 2025
Details
Google KI-Anbieter-Logo - Gemini 3 Flash Preview (Reasoning)
#3 Gemini 3 Flash Preview (Reasoning)
von Google
46.4 40 174 tok/s 1.0M $0.50 / $3.00 17. Dez. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5.2 (medium)
#4 GPT-5.2 (medium)
von OpenAI
46.6 12 k. A. 400K $1.75 / $14.00 11. Dez. 2025
Details
DeepSeek KI-Anbieter-Logo - V3.2 Speciale
#5 V3.2 Speciale
von DeepSeek
29.4 k. A. k. A. k. A. k. A. / k. A. 1. Dez. 2025
Details
KI-Chat

Mit 80+ Modellen chatten

Inference-API

EU-gehostete Inferenz

Xiaomi KI-Anbieter-Logo - MiMo-V2-Flash (Reasoning)
#6 MiMo-V2-Flash (Reasoning)
von Xiaomi
39.2 91 130 tok/s 262K $0.10 / $0.30 16. Dez. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5.1 Codex (high)
#7 GPT-5.1 Codex (high)
von OpenAI
43.1 21 182 tok/s 400K $1.25 / $10.00 13. Nov. 2025
Details
Google KI-Anbieter-Logo - Gemini 3 Pro Preview (high)
#8 Gemini 3 Pro Preview (high)
von Google
48.4 12 k. A. k. A. $2.00 / $12.00 18. Nov. 2025
Details
Z AI KI-Anbieter-Logo - GLM-4.7 (Reasoning)
#9 GLM-4.7 (Reasoning)
von Z AI
42.1 24 77 tok/s 203K $0.60 / $2.20 22. Dez. 2025
Details
KwaiKAT KI-Anbieter-Logo - KAT-Coder-Pro V1
#10 KAT-Coder-Pro V1
von KwaiKAT
36.0 41 113 tok/s k. A. $0.30 / $1.20 11. Nov. 2025
Details
MoonshotAI KI-Anbieter-Logo - Kimi K2 Thinking
#11 Kimi K2 Thinking
von MoonshotAI
40.9 36 131 tok/s 262K $0.60 / $2.50 6. Nov. 2025
Details
Amazon KI-Anbieter-Logo - Nova 2.0 Lite (high)
#12 Nova 2.0 Lite (high)
von Amazon
34.5 34 158 tok/s k. A. $0.30 / $2.50 29. Okt. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5 (high)
#13 GPT-5 (high)
von OpenAI
44.6 19 111 tok/s 400K $1.25 / $10.00 7. Aug. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5.1 (high)
#14 GPT-5.1 (high)
von OpenAI
47.7 23 121 tok/s 400K $1.25 / $10.00 13. Nov. 2025
Details
OpenAI KI-Anbieter-Logo - gpt-oss-120b (high)
#15 gpt-oss-120b (high)
von OpenAI
33.3 59 359 tok/s 131K $0.15 / $0.60 5. Aug. 2025
Details
xAI KI-Anbieter-Logo - Grok 4
#16 Grok 4
von xAI
41.5 7 k. A. k. A. $5.50 / $27.50 10. Juli 2025
Details
DeepSeek KI-Anbieter-Logo - V3.2 (Reasoning)
#17 V3.2 (Reasoning)
von DeepSeek
41.7 39 k. A. 131K $0.30 / $0.45 1. Dez. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5 (medium)
#18 GPT-5 (medium)
von OpenAI
42.0 15 93 tok/s 400K $1.25 / $10.00 7. Aug. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5.1 Codex mini (high)
#19 GPT-5.1 Codex mini (high)
von OpenAI
38.6 42 214 tok/s 400K $0.25 / $2.00 13. Nov. 2025
Details
Anthropic KI-Anbieter-Logo - Claude Opus 4.5 (Reasoning)
#20 Claude Opus 4.5 (Reasoning)
von Anthropic
49.7 8 54 tok/s 200K $6.25 / $25.00 24. Nov. 2025
Details
NVIDIA KI-Anbieter-Logo - Nemotron 3 Nano 30B A3B (Reasoning)
#21 Nemotron 3 Nano 30B A3B (Reasoning)
von NVIDIA
24.3 71 134 tok/s 256K $0.06 / $0.22 15. Dez. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 235B A22B 2507 (Reasoning)
#22 Qwen3 235B A22B 2507 (Reasoning)
von Alibaba
29.5 17 57 tok/s 262K $0.40 / $2.15 25. Juli 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5 mini (high)
#23 GPT-5 mini (high)
von OpenAI
41.2 31 87 tok/s 400K $0.25 / $2.00 7. Aug. 2025
Details
OpenAI KI-Anbieter-Logo - o4-mini (high)
#24 o4-mini (high)
von OpenAI
33.1 22 154 tok/s 200K $1.10 / $4.40 16. Apr. 2025
Details
LG AI Research KI-Anbieter-Logo - K-EXAONE (Reasoning)
#25 K-EXAONE (Reasoning)
von LG AI Research
32.1 k. A. k. A. k. A. k. A. / k. A. 31. Dez. 2025
Details
Amazon KI-Anbieter-Logo - Nova 2.0 Omni (medium)
#26 Nova 2.0 Omni (medium)
von Amazon
28.0 16 k. A. k. A. $0.30 / $2.50 26. Nov. 2025
Details
DeepSeek KI-Anbieter-Logo - V3.1 Terminus (Reasoning)
#27 V3.1 Terminus (Reasoning)
von DeepSeek
33.9 13 k. A. 164K $1.64 / $2.75 22. Sept. 2025
Details
DeepSeek KI-Anbieter-Logo - V3.1 (Reasoning)
#28 V3.1 (Reasoning)
von DeepSeek
27.7 16 k. A. 164K $0.59 / $1.69 21. Aug. 2025
Details
xAI KI-Anbieter-Logo - Grok 4 Fast (Reasoning)
#29 Grok 4 Fast (Reasoning)
von xAI
35.1 36 k. A. k. A. $0.20 / $0.50 19. Sept. 2025
Details
OpenAI KI-Anbieter-Logo - gpt-oss-20B (high)
#30 gpt-oss-20B (high)
von OpenAI
24.5 75 266 tok/s 131K $0.05 / $0.20 5. Aug. 2025
Details
xAI KI-Anbieter-Logo - Grok 4.1 Fast (Reasoning)
#31 Grok 4.1 Fast (Reasoning)
von xAI
38.6 k. A. k. A. k. A. k. A. / k. A. 19. Nov. 2025
Details
InclusionAI KI-Anbieter-Logo - Ring-1T
#32 Ring-1T
von InclusionAI
22.8 k. A. k. A. k. A. k. A. / k. A. 13. Okt. 2025
Details
Amazon KI-Anbieter-Logo - Nova 2.0 Pro Preview (medium)
#33 Nova 2.0 Pro Preview (medium)
von Amazon
35.7 17 125 tok/s k. A. $1.25 / $10.00 27. Nov. 2025
Details
Amazon KI-Anbieter-Logo - Nova 2.0 Lite (medium)
#34 Nova 2.0 Lite (medium)
von Amazon
29.7 29 151 tok/s k. A. $0.30 / $2.50 29. Okt. 2025
Details
OpenAI KI-Anbieter-Logo - o3
#35 o3
von OpenAI
38.4 17 112 tok/s 200K $2.00 / $8.00 16. Apr. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 VL 235B A22B (Reasoning)
#36 Qwen3 VL 235B A22B (Reasoning)
von Alibaba
27.6 10 33 tok/s k. A. $0.84 / $6.17 23. Sept. 2025
Details
Prime Intellect KI-Anbieter-Logo - INTELLECT-3
#37 INTELLECT-3
von Prime Intellect
22.2 k. A. k. A. 131K k. A. / k. A. 27. Nov. 2025
Details
ServiceNow KI-Anbieter-Logo - Apriel-v1.6-15B-Thinker
#38 Apriel-v1.6-15B-Thinker
von ServiceNow
27.6 k. A. k. A. k. A. k. A. / k. A. 25. Nov. 2025
Details
Anthropic KI-Anbieter-Logo - Claude 4.5 Sonnet (Reasoning)
#39 Claude 4.5 Sonnet (Reasoning)
von Anthropic
43.0 9 54 tok/s k. A. $3.75 / $15.00 29. Sept. 2025
Details
Google KI-Anbieter-Logo - Gemini 2.5 Pro
#40 Gemini 2.5 Pro
von Google
34.6 17 125 tok/s 1.0M $1.25 / $10.00 5. Juni 2025
Details
DeepSeek KI-Anbieter-Logo - V3.2 Exp (Reasoning)
#41 V3.2 Exp (Reasoning)
von DeepSeek
32.9 32 k. A. 164K $0.28 / $0.41 29. Sept. 2025
Details
ServiceNow KI-Anbieter-Logo - Apriel-v1.5-15B-Thinker
#42 Apriel-v1.5-15B-Thinker
von ServiceNow
28.3 k. A. k. A. k. A. k. A. / k. A. 30. Sept. 2025
Details
Google KI-Anbieter-Logo - Gemini 3 Pro Preview (low)
#43 Gemini 3 Pro Preview (low)
von Google
41.3 11 k. A. k. A. $2.00 / $12.00 18. Nov. 2025
Details
Z AI KI-Anbieter-Logo - GLM-4.6 (Reasoning)
#44 GLM-4.6 (Reasoning)
von Z AI
32.5 18 44 tok/s 203K $0.55 / $2.20 30. Sept. 2025
Details
Z AI KI-Anbieter-Logo - GLM-4.6V (Reasoning)
#45 GLM-4.6V (Reasoning)
von Z AI
23.4 19 41 tok/s 131K $0.30 / $0.90 8. Dez. 2025
Details
Baidu KI-Anbieter-Logo - ERNIE 5.0 Thinking Preview
#46 ERNIE 5.0 Thinking Preview
von Baidu
29.1 k. A. k. A. k. A. k. A. / k. A. 13. Nov. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5 mini (medium)
#47 GPT-5 mini (medium)
von OpenAI
38.9 29 86 tok/s 400K $0.25 / $2.00 7. Aug. 2025
Details
xAI KI-Anbieter-Logo - Grok 3 mini Reasoning (high)
#48 Grok 3 mini Reasoning (high)
von xAI
32.1 29 53 tok/s k. A. $0.30 / $0.50 19. Feb. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 VL 32B (Reasoning)
#49 Qwen3 VL 32B (Reasoning)
von Alibaba
24.7 11 98 tok/s k. A. $0.70 / $8.40 21. Okt. 2025
Details
ByteDance Seed KI-Anbieter-Logo - Seed-OSS-36B-Instruct
#50 Seed-OSS-36B-Instruct
von ByteDance Seed
25.2 25 40 tok/s k. A. $0.21 / $0.57 20. Aug. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 Next 80B A3B (Reasoning)
#51 Qwen3 Next 80B A3B (Reasoning)
von Alibaba
26.7 18 139 tok/s k. A. $0.50 / $6.00 11. Sept. 2025
Details
Anthropic KI-Anbieter-Logo - Claude 4.5 Haiku (Reasoning)
#52 Claude 4.5 Haiku (Reasoning)
von Anthropic
37.1 23 132 tok/s k. A. $1.25 / $5.00 15. Okt. 2025
Details
InclusionAI KI-Anbieter-Logo - Ring-flash-2.0
#53 Ring-flash-2.0
von InclusionAI
14.0 15 k. A. k. A. $0.14 / $0.57 19. Sept. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5 nano (high)
#54 GPT-5 nano (high)
von OpenAI
26.8 65 147 tok/s 400K $0.05 / $0.40 7. Aug. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5 (low)
#55 GPT-5 (low)
von OpenAI
39.2 13 84 tok/s 400K $1.25 / $10.00 7. Aug. 2025
Details
MiniMax KI-Anbieter-Logo - M2.1
#56 M2.1
von MiniMax
39.4 49 191 tok/s 205K $0.30 / $1.20 23. Dez. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 4B 2507 (Reasoning)
#57 Qwen3 4B 2507 (Reasoning)
von Alibaba
18.2 k. A. k. A. k. A. k. A. / k. A. 6. Aug. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 VL 30B A3B (Reasoning)
#58 Qwen3 VL 30B A3B (Reasoning)
von Alibaba
19.7 31 126 tok/s k. A. $0.20 / $0.75 3. Okt. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 Max Thinking (Preview)
#59 Qwen3 Max Thinking (Preview)
von Alibaba
32.5 11 51 tok/s 262K $1.20 / $6.00 3. Nov. 2025
Details
Mistral KI-Anbieter-Logo - Magistral Medium 1.2
#60 Magistral Medium 1.2
von Mistral
27.1 9 40 tok/s k. A. $2.00 / $5.00 18. Sept. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 235B A22B (Reasoning)
#61 Qwen3 235B A22B (Reasoning)
von Alibaba
19.8 7 59 tok/s 131K $0.70 / $8.40 28. Apr. 2025
Details
Z AI KI-Anbieter-Logo - GLM-4.5-Air
#62 GLM-4.5-Air
von Z AI
23.2 21 71 tok/s 131K $0.17 / $0.98 28. Juli 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 Max
#63 Qwen3 Max
von Alibaba
31.4 10 49 tok/s 262K $1.66 / $7.22 23. Sept. 2025
Details
Mistral KI-Anbieter-Logo - Magistral Small 1.2
#64 Magistral Small 1.2
von Mistral
18.2 17 110 tok/s k. A. $0.50 / $1.50 17. Sept. 2025
Details
Motif Technologies KI-Anbieter-Logo - Motif-2-12.7B-Reasoning
#65 Motif-2-12.7B-Reasoning
von Motif Technologies
19.1 k. A. k. A. k. A. k. A. / k. A. 4. Dez. 2025
Details
Anthropic KI-Anbieter-Logo - Claude 4.1 Opus (Reasoning)
#66 Claude 4.1 Opus (Reasoning)
von Anthropic
42.0 4 34 tok/s k. A. $18.75 / $75.00 5. Aug. 2025
Details
TII UAE KI-Anbieter-Logo - Falcon-H1R-7B
#67 Falcon-H1R-7B
von TII UAE
15.8 k. A. k. A. k. A. k. A. / k. A. 4. Jan. 2026
Details
LG AI Research KI-Anbieter-Logo - EXAONE 4.0 32B (Reasoning)
#68 EXAONE 4.0 32B (Reasoning)
von LG AI Research
16.7 k. A. k. A. k. A. k. A. / k. A. 15. Juli 2025
Details
ByteDance Seed KI-Anbieter-Logo - Doubao Seed Code
#69 Doubao Seed Code
von ByteDance Seed
33.5 k. A. k. A. k. A. k. A. / k. A. 11. Nov. 2025
Details
Korea Telecom KI-Anbieter-Logo - Mi:dm K 2.5 Pro Preview
#70 Mi:dm K 2.5 Pro Preview
von Korea Telecom
k. A. k. A. k. A. k. A. / k. A. 11. Dez. 2025
Details
MBZUAI Institute of Foundation Models KI-Anbieter-Logo - K2-V2 (high)
#71 K2-V2 (high)
von MBZUAI Institute of Foundation Models
20.6 k. A. k. A. k. A. k. A. / k. A. 5. Dez. 2025
Details
OpenAI KI-Anbieter-Logo - GPT-5 nano (medium)
#72 GPT-5 nano (medium)
von OpenAI
25.9 63 161 tok/s 400K $0.05 / $0.40 7. Aug. 2025
Details
Google KI-Anbieter-Logo - Gemini 2.5 Flash Preview (Sep '25) (Reasoning)
#73 Gemini 2.5 Flash Preview (Sep '25) (Reasoning)
von Google
31.1 k. A. k. A. k. A. k. A. / k. A. 25. Sept. 2025
Details
MiniMax KI-Anbieter-Logo - M2
#74 M2
von MiniMax
36.1 36 101 tok/s 205K $0.30 / $1.20 26. Okt. 2025
Details
Allen Institute for AI KI-Anbieter-Logo - Olmo 3.1 32B Think
#75 Olmo 3.1 32B Think
von Allen Institute for AI
13.9 k. A. k. A. k. A. k. A. / k. A. 12. Dez. 2025
Details
NVIDIA KI-Anbieter-Logo - Llama Nemotron Super 49B v1.5 (Reasoning)
#76 Llama Nemotron Super 49B v1.5 (Reasoning)
von NVIDIA
18.7 24 45 tok/s k. A. $0.10 / $0.40 25. Juli 2025
Details
Korea Telecom KI-Anbieter-Logo - Mi:dm K 2.5 Pro
#77 Mi:dm K 2.5 Pro
von Korea Telecom
23.1 k. A. k. A. k. A. k. A. / k. A. 11. Dez. 2025
Details
DeepSeek KI-Anbieter-Logo - R1 0528 (May '25)
#78 R1 0528 (May '25)
von DeepSeek
27.1 10 k. A. 164K $1.35 / $4.20 28. Mai 2025
Details
NVIDIA KI-Anbieter-Logo - Nemotron Nano 12B v2 VL (Reasoning)
#79 Nemotron Nano 12B v2 VL (Reasoning)
von NVIDIA
14.9 15 k. A. k. A. $0.20 / $0.60 28. Okt. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 Max (Preview)
#80 Qwen3 Max (Preview)
von Alibaba
26.1 9 47 tok/s 262K $1.20 / $6.00 5. Sept. 2025
Details
Anthropic KI-Anbieter-Logo - Claude 4 Sonnet (Reasoning)
#81 Claude 4 Sonnet (Reasoning)
von Anthropic
38.7 8 46 tok/s k. A. $3.75 / $15.00 22. Mai 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 Omni 30B A3B (Reasoning)
#82 Qwen3 Omni 30B A3B (Reasoning)
von Alibaba
15.6 15 86 tok/s k. A. $0.25 / $0.97 22. Sept. 2025
Details
Allen Institute for AI KI-Anbieter-Logo - Olmo 3 32B Think
#83 Olmo 3 32B Think
von Allen Institute for AI
12.1 k. A. k. A. k. A. k. A. / k. A. 20. Nov. 2025
Details
Z AI KI-Anbieter-Logo - GLM-4.5 (Reasoning)
#84 GLM-4.5 (Reasoning)
von Z AI
26.4 14 53 tok/s 131K $0.60 / $2.20 28. Juli 2025
Details
Google KI-Anbieter-Logo - Gemini 2.5 Flash (Reasoning)
#85 Gemini 2.5 Flash (Reasoning)
von Google
27.0 26 221 tok/s 1.0M $0.30 / $2.50 20. Mai 2025
Details
Anthropic KI-Anbieter-Logo - Claude 4 Opus (Reasoning)
#86 Claude 4 Opus (Reasoning)
von Anthropic
39.0 4 37 tok/s k. A. $18.75 / $75.00 22. Mai 2025
Details
Z AI KI-Anbieter-Logo - GLM-4.5V (Reasoning)
#87 GLM-4.5V (Reasoning)
von Z AI
15.1 9 29 tok/s 66K $0.60 / $1.80 11. Aug. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 32B (Reasoning)
#88 Qwen3 32B (Reasoning)
von Alibaba
16.5 23 99 tok/s 131K $0.20 / $0.52 28. Apr. 2025
Details
Deep Cogito KI-Anbieter-Logo - Cogito v2.1 (Reasoning)
#89 Cogito v2.1 (Reasoning)
von Deep Cogito
12 62 tok/s k. A. $1.25 / $1.25 18. Nov. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 VL 30B A3B Instruct
#90 Qwen3 VL 30B A3B Instruct
von Alibaba
16.0 26 125 tok/s 262K $0.20 / $0.60 3. Okt. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 30B A3B (Reasoning)
#91 Qwen3 30B A3B (Reasoning)
von Alibaba
15.3 20 69 tok/s 131K $0.09 / $0.45 28. Apr. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 235B A22B 2507 Instruct
#92 Qwen3 235B A22B 2507 Instruct
von Alibaba
25.0 23 44 tok/s 262K $0.20 / $0.82 21. Juli 2025
Details
InclusionAI KI-Anbieter-Logo - Ling-1T
#93 Ling-1T
von InclusionAI
19.0 k. A. k. A. k. A. k. A. / k. A. 8. Okt. 2025
Details
Allen Institute for AI KI-Anbieter-Logo - Olmo 3 7B Think
#94 Olmo 3 7B Think
von Allen Institute for AI
9.4 k. A. k. A. k. A. k. A. / k. A. 20. Nov. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 VL 235B A22B Instruct
#95 Qwen3 VL 235B A22B Instruct
von Alibaba
20.8 13 49 tok/s 262K $0.30 / $1.90 23. Sept. 2025
Details
NVIDIA KI-Anbieter-Logo - Nemotron Nano 9B V2 (Reasoning)
#96 Nemotron Nano 9B V2 (Reasoning)
von NVIDIA
14.8 48 118 tok/s 128K $0.04 / $0.16 18. Aug. 2025
Details
Nous Research KI-Anbieter-Logo - Hermes 4 - Llama-3.1 405B (Reasoning)
#97 Hermes 4 - Llama-3.1 405B (Reasoning)
von Nous Research
18.6 8 40 tok/s k. A. $1.00 / $3.00 27. Aug. 2025
Details
Nous Research KI-Anbieter-Logo - Hermes 4 - Llama-3.1 70B (Reasoning)
#98 Hermes 4 - Llama-3.1 70B (Reasoning)
von Nous Research
16.0 23 88 tok/s k. A. $0.13 / $0.40 27. Aug. 2025
Details
Google KI-Anbieter-Logo - Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)
#99 Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)
von Google
21.6 28 k. A. k. A. $0.10 / $0.40 8. Sept. 2025
Details
Alibaba KI-Anbieter-Logo - Qwen3 VL 32B Instruct
#100 Qwen3 VL 32B Instruct
von Alibaba
17.2 9 76 tok/s 262K $0.70 / $2.80 21. Okt. 2025
Details

Zeige 100 von 528 Modelle

Das KI-Modell-Leaderboard verstehen

Dieses umfassende KI-Modell-Leaderboard hilft Ihnen, zu vergleichen und auszuwählen die besten Large Language Models (LLMs) für Ihre Anforderungen. Wir erfassen standardisierte KI-Benchmarks, Token-Preise, Inference-Geschwindigkeit und Modellfähigkeiten bei allen großen KI-Anbietern wie OpenAI, Anthropic, Google, Meta, und DeepSeek.

Kern-KI-Benchmarks erklärt

MMLU-Pro Testet breites Wissen über 14 akademische Fachbereiche
GPQA Denken & Problemlösung auf Promotionsniveau
AIME 2025 Mathematisches Denken auf Spitzenniveau
Coding Index LiveCodeBench + SciCode kombiniert
Math Index AIME + MATH-500 kombiniert

Wichtige Kennzahlen

Token-Preisgestaltung Input- vs. Output-Kosten pro 1 Mio. Tokens
Inference-Geschwindigkeit Tokens/Sekunde für Antwortzeit
Veröffentlichungsdatum Neueste Techniken & Wissensstand
Benchmark-Scores Fähigkeitsvergleich von 0-100 %

So wählen Sie das richtige KI-Modell für Ihren Use Case

Für Forschung & Analyse

Priorisieren Sie Modelle mit hohen MMLU-Pro- (70 %+) und GPQA-Werten (60 %+), wenn es um komplexe Denkaufgaben, wissenschaftliche Recherche und technische Dokumentation geht

Für Kostenoptimierung

Sortieren Sie nach Input-/Output-Preisen - kleinere Modelle liefern bei einfachen Aufgaben oft 80 % der Flaggschiff-Leistung zu 10 % der Kosten

Für Mathe & MINT

Filtern Sie nach Math-Index oder AIME-2025-Scores (50 %+) für quantitative Analysen, Engineering-Berechnungen und wissenschaftliche Anwendungen

Alle Benchmark-Scores und Preisdaten werden täglich von Artificial Analysis aktualisiert, um die neuesten Modellversionen und Fähigkeiten abzubilden. Nutzen Sie die Sortierfilter oben, um KI-Modelle nach Intelligenz, Kosten, Coding-Fähigkeit, Mathe-Leistung, Geschwindigkeit oder Veröffentlichungsdatum zu finden.

Häufig gestellte Fragen

Was ist MMLU-Pro und warum gilt es als Standard-Benchmark für KI-Intelligenz?

MMLU-Pro (Massive Multitask Language Understanding - Professional) ist der umfassendste KI-Benchmark und testet Modelle in 14 akademischen Fachbereichen, darunter Mathematik, Naturwissenschaften, Geschichte, Recht und Ethik. Die Werte reichen von 46 % (Grundkompetenz) bis 87 % (nahe Expertenniveau). Modelle über 75 % zeigen starke allgemeine Intelligenz für professionelle Anwendungen, während Werte unter 60 % auf Einschränkungen bei komplexen Denkaufgaben hindeuten.

Was misst GPQA und welche Modelle erzielen die höchsten Werte?

GPQA (Graduate-level Google-Proof Q&A) prüft Denken auf Promotionsniveau mit Fragen, die bewusst "Google-proof" sind - sie erfordern tiefes Verständnis statt bloßer Faktenrecherche. Spitzenmodelle wie GPT-5.1 (87,3 %), GPT-5 mini (82,8 %) und o3 (82,7 %) sind bei GPQA besonders stark und eignen sich für Forschung, technische Analysen und komplexe Problemlösung. Modelle unter 50 % GPQA haben oft Schwierigkeiten bei anspruchsvollem Denken und liefern eher oberflächliche Antworten.

Was ist AIME 2025 und wie bewertet es die mathematischen Fähigkeiten von KI?

AIME 2025 (American Invitational Mathematics Examination) ist ein Benchmark auf Wettbewerbsniveau, der fortgeschrittene Problemlösung, Algebra, Geometrie und Zahlentheorie testet. Werte über 80 % (wie GPT-5 Codex mit 98,7 % oder GPT-5.1 mit 94 %) zeigen außergewöhnliches mathematisches Denken für Engineering, Scientific Computing und quantitative Analysen. Modelle unter 50 % können bei mehrstufigen mathematischen Aufgaben Probleme haben oder benötigen eine explizite Aufschlüsselung.

Wie wird die Preisgestaltung von KI-Modellen berechnet und was gilt als kosteneffizient?

Die Preise von KI-Modellen werden pro 1 Million Tokens berechnet (etwa 750.000 Wörter). Input-Preise betreffen den Text, den Sie senden, Output-Preise die generierten Antworten. Günstige Modelle wie Llama 3.3 70B kosten $0.54/$0.71 pro Million Tokens, Mid-Tier-Modelle wie GPT-5 nano $0.05/$0.40, Premium-Modelle wie GPT-5 $1.25/$10. Bei typischen Anwendungen mit einem Input-/Output-Verhältnis von 3:1 können Budget-Modelle 10- bis 20-mal günstiger sein und dennoch 70-80 % der Leistung liefern.

Welche KI-Modelle eignen sich am besten für Coding und Programmierung?

Sortieren Sie nach Coding Index um die besten Programmiermodelle zu sehen. Unser Coding Index kombiniert LiveCodeBench, SciCode und Coding-Benchmarks. Zu den Top-Performern gehören GPT-5.1 (57,5), GPT-5 mini (51,4) und GPT-5 Codex (53,5). Diese Modelle sind stark bei Codegenerierung, Debugging, Refactoring und der Erklärung komplexer Algorithmen. Für kostenbewusste Entwickler bieten Modelle mit 40+ Punkten im Coding Index ein sehr gutes Preis-Leistungs-Verhältnis für Routineaufgaben.

Wie oft werden KI-Modell-Benchmarks und Rankings aktualisiert?

Unser Leaderboard wird täglich mit der Artificial Analysis API synchronisiert, damit Benchmark-Scores (MMLU-Pro, GPQA, AIME 2025), Preise und Inference-Geschwindigkeit die neuesten Modellversionen widerspiegeln. Neue Modell-Releases erscheinen sofort unter der Sortierung "Neueste". Benchmark-Scores können sich ändern, wenn Anbieter aktualisierte Versionen veröffentlichen - zum Beispiel erreichte GPT-5.1 (veröffentlicht im November 2025) 69,7 Intelligenzpunkte gegenüber 68,5 bei GPT-5 aus August 2025.

Welche Inference-Geschwindigkeit (Tokens/Sekunde) brauche ich für meine Anwendung?

Die Inference-Geschwindigkeit bestimmt, wie schnell Modelle Antworten erzeugen. Für Echtzeit-Chatbots und interaktive Anwendungen sind 100+ Tokens/Sekunde sinnvoll (z. B. gpt-oss-120B mit 340 tok/s). Für Hintergrundverarbeitung und Batch-Jobs reichen 50-100 tok/s. Premium-Reasoning-Modelle wie GPT-5 (103 tok/s) balancieren Geschwindigkeit und Fähigkeiten. Wichtig: Höhere Geschwindigkeit bedeutet nicht automatisch bessere Qualität - langsamere Modelle liefern oft durchdachtere, detailliertere Antworten.

Kann ich diese KI-Modelle kostenlos testen, bevor ich mich entscheide?

Ja! Probieren Sie unsere kostenlose KI-Chatoberfläche aus, um verschiedene Modelle sofort ohne Account zu testen. Viele Anbieter haben ebenfalls kostenlose Stufen: OpenAI (ChatGPT mit Tageslimits), Anthropic (Claude mit Nutzungslimits), Google (Gemini Free Tier) und Open-Source-Modelle wie Llama 3.3. Vergleichen Sie die Leistung für Ihren konkreten Use Case, bevor Sie auf bezahlte Pläne wechseln.