KI-Modell-Ranking (LLM-Leaderboard)
Günstigste KI-Modelle
Language models ranked by Artificial Analysis Index
Beste Empfehlungen
Mit diesen Modellen starten
Schnelle Empfehlungen aus aktuellen Benchmark-, Geschwindigkeits- und Preisdaten.
Insgesamt am besten
Claude Opus 4.8 (Adaptive Reasoning, Max Effort)
von Anthropic
61.4 Höchster Intelligenz-Score
Bester Wert
Qwen3.5 4B (Reasoning)
von Alibaba
100 Wert-Score · $0.06 gemischt
Beste für Coding
GPT-5.5 (xhigh)
von OpenAI
59.1 Höchster Coding-Index
Schnellste brauchbare Option
Step 3.7 Flash
von StepFun
398 tok/s Schnellstes Modell mit solider Intelligenz
| Modell Name des KI-Modells und Anbieterorganisation | Intelligence Artificial Analysis Intelligence Index - composite reasoning and capability score across the benchmark suite | Wert Qualität, Geschwindigkeit und gemischter Token-Preis als relativer Wert-Score | Geschwindigkeit Inference-Durchsatz in Tokens pro Sekunde - wie schnell das Modell Antworten generiert | Context Maximum context window size - how much text, code, or conversation the model can process at once | Price Kosten pro 1 Million Tokens — Input (Text, den Sie senden) / Output (Text, den das Modell erzeugt) | Veröffentlichung Zeitpunkt der Veröffentlichung - neuere Modelle können mehr Fähigkeiten bieten | Vergleichen |
|---|---|---|---|---|---|---|---|
| #1 Qwen3.5 0.8B (Reasoning) von Alibaba | 10.5 | 40 | k. A. | k. A. | $0.01 / $0.05 | 2. März 2026 | |
| #2 Qwen3.5 0.8B (Non-reasoning) von Alibaba | 9.9 | 45 | 89 tok/s | k. A. | $0.01 / $0.05 | 2. März 2026 | |
| #3 Qwen3.5 2B (Reasoning) von Alibaba | 16.3 | 44 | k. A. | k. A. | $0.02 / $0.10 | 2. März 2026 | |
| #4 Qwen3.5 2B (Non-reasoning) von Alibaba | 14.7 | 66 | 324 tok/s | k. A. | $0.02 / $0.10 | 2. März 2026 | |
| #5 Gemma 3n E4B Instruct von Google | 6.4 | 22 | 51 tok/s | k. A. | $0.02 / $0.04 | 26. Juni 2025 | |
| | |||||||
| #6 30B (high) von Sarvam | 12.3 | 51 | 161 tok/s | k. A. | $0.03 / $0.11 | 6. März 2026 | |
| #7 LFM2 24B A2B von Liquid AI | 10.5 | 38 | 114 tok/s | k. A. | $0.03 / $0.12 | 25. Feb. 2026 | |
| #8 Qwen3.5 4B (Reasoning) von Alibaba | 27.1 | 100 | 197 tok/s | k. A. | $0.03 / $0.15 | 2. März 2026 | |
| #9 Qwen3.5 4B (Non-reasoning) von Alibaba | 22.6 | 83 | 209 tok/s | k. A. | $0.03 / $0.15 | 2. März 2026 | |
| #10 Granite 3.3 8B (Non-reasoning) von IBM | 7.0 | 22 | 442 tok/s | k. A. | $0.03 / $0.25 | 16. Apr. 2025 | |
| #11 Nova Micro von Amazon | 10.3 | 38 | 316 tok/s | k. A. | $0.04 / $0.14 | 3. Dez. 2024 | |
| #12 Nemotron Nano 9B V2 (Reasoning) von NVIDIA | 14.8 | 47 | 117 tok/s | 128K | $0.04 / $0.16 | 18. Aug. 2025 | |
| #13 Gemma 3 4B Instruct von Google | 6.3 | 15 | k. A. | 131K | $0.04 / $0.08 | 12. März 2025 | |
| #14 105B (high) von Sarvam | 18.2 | 46 | 94 tok/s | k. A. | $0.04 / $0.17 | 6. März 2026 | |
| #15 Llama 3 Instruct 8B von Meta | 6.4 | 16 | 89 tok/s | k. A. | $0.04 / $0.14 | 18. Apr. 2024 | |
| #16 gpt-oss-20B (high) von OpenAI | 24.5 | 75 | 268 tok/s | 131K | $0.05 / $0.20 | 5. Aug. 2025 | |
| #17 Nemotron Nano 9B V2 (Non-reasoning) von NVIDIA | 13.2 | 41 | 135 tok/s | 128K | $0.05 / $0.20 | 18. Aug. 2025 | |
| #18 Nemotron 3 Nano 30B A3B (Non-reasoning) von NVIDIA | 13.2 | 29 | 89 tok/s | 256K | $0.05 / $0.20 | 15. Dez. 2025 | |
| #19 Granite 4.1 8B von IBM | 12.4 | 45 | 133 tok/s | k. A. | $0.05 / $0.10 | 29. Apr. 2026 | |
| #20 GPT-5 nano (minimal) von OpenAI | 13.8 | 34 | 154 tok/s | 400K | $0.05 / $0.40 | 7. Aug. 2025 | |
| #21 GPT-5 nano (medium) von OpenAI | 25.9 | 63 | 167 tok/s | 400K | $0.05 / $0.40 | 7. Aug. 2025 | |
| #22 GPT-5 nano (high) von OpenAI | 26.8 | 65 | 155 tok/s | 400K | $0.05 / $0.40 | 7. Aug. 2025 | |
| #23 Llama 3.2 Instruct 1B von Meta | 6.3 | 19 | 93 tok/s | k. A. | $0.05 / $0.05 | 25. Sept. 2024 | |
| #24 Llama 2 Chat 7B von Meta | 9.7 | 22 | 101 tok/s | k. A. | $0.05 / $0.25 | 18. Juli 2023 | |
| #25 Qwen2.5 Turbo von Alibaba | 12.0 | 22 | 67 tok/s | k. A. | $0.05 / $0.20 | 18. Nov. 2024 | |
| #26 Nemotron 3 Nano 30B A3B (Reasoning) von NVIDIA | 24.3 | 71 | 134 tok/s | 256K | $0.06 / $0.22 | 15. Dez. 2025 | |
| #27 gpt-oss-20B (low) von OpenAI | 20.8 | 61 | 273 tok/s | 131K | $0.06 / $0.20 | 5. Aug. 2025 | |
| #28 Granite 4.0 H Small von IBM | 10.8 | 30 | 418 tok/s | k. A. | $0.06 / $0.25 | 22. Sept. 2025 | |
| #29 Nova Lite von Amazon | 12.7 | 35 | 189 tok/s | k. A. | $0.06 / $0.24 | 3. Dez. 2024 | |
| #30 GLM-4.7-Flash (Non-reasoning) von Z AI | 22.1 | 48 | 118 tok/s | 203K | $0.07 / $0.40 | 19. Jan. 2026 | |
| #31 GLM-4.7-Flash (Reasoning) von Z AI | 30.1 | 52 | 93 tok/s | 203K | $0.07 / $0.40 | 19. Jan. 2026 | |
| #32 Nemotron 3 Nano Omni 30B A3B Reasoning von NVIDIA | 21.4 | 53 | 285 tok/s | k. A. | $0.07 / $0.30 | 29. Apr. 2026 | |
| #33 Small 3 von Mistral | 12.7 | 36 | 154 tok/s | k. A. | $0.07 / $0.19 | 30. Jan. 2025 | |
| #34 Qwen3 30B A3B (Non-reasoning) von Alibaba | 12.5 | 19 | 70 tok/s | 131K | $0.08 / $0.29 | 28. Apr. 2025 | |
| #35 Small 3.2 von Mistral | 15.1 | 38 | 127 tok/s | k. A. | $0.09 / $0.25 | 20. Juni 2025 | |
| #36 Gemma 3 12B Instruct von Google | 8.8 | 13 | k. A. | 131K | $0.09 / $0.29 | 12. März 2025 | |
| #37 Qwen3 30B A3B (Reasoning) von Alibaba | 15.3 | 20 | 69 tok/s | 131K | $0.09 / $0.45 | 28. Apr. 2025 | |
| #38 Ministral 3 3B von Mistral | 11.2 | 32 | 203 tok/s | k. A. | $0.10 / $0.10 | 2. Dez. 2025 | |
| #39 Llama Nemotron Super 49B v1.5 (Non-reasoning) von NVIDIA | 14.6 | 19 | 44 tok/s | k. A. | $0.10 / $0.40 | 25. Juli 2025 | |
| #40 Llama Nemotron Super 49B v1.5 (Reasoning) von NVIDIA | 18.7 | 24 | 44 tok/s | k. A. | $0.10 / $0.40 | 25. Juli 2025 | |
| #41 Step 3.5 Flash 2603 von StepFun | 38.5 | 90 | 238 tok/s | 262K | $0.10 / $0.30 | 2. Apr. 2026 | |
| #42 Olmo 3 7B Instruct von Allen Institute for AI | 8.1 | 12 | k. A. | k. A. | $0.10 / $0.20 | 20. Nov. 2025 | |
| #43 MiMo-V2-Flash (Feb 2026) von Xiaomi | 41.5 | 97 | 126 tok/s | 262K | $0.10 / $0.30 | 16. Dez. 2025 | |
| #44 MiMo-V2-Flash (Non-reasoning) von Xiaomi | 30.3 | 71 | 126 tok/s | 262K | $0.10 / $0.30 | 16. Dez. 2025 | |
| #45 Apertus 8B Instruct von Swiss AI Initiative | 5.9 | 9 | k. A. | k. A. | $0.10 / $0.20 | 2. Sept. 2025 | |
| #46 Qwen3.5 9B (Reasoning) von Alibaba | 32.4 | 52 | 72 tok/s | 262K | $0.10 / $0.15 | 2. März 2026 | |
| #47 Qwen3.5 Omni Flash von Alibaba | 25.9 | 45 | 226 tok/s | k. A. | $0.10 / $0.80 | 30. März 2026 | |
| #48 Ling 2.6 Flash von InclusionAI | 26.2 | 37 | k. A. | 262K | $0.10 / $0.30 | 21. Apr. 2026 | |
| #49 GPT-4.1 nano von OpenAI | 13.0 | 25 | 112 tok/s | 1.0M | $0.10 / $0.40 | 14. Apr. 2025 | |
| #50 Llama 3.1 Instruct 8B von Meta | 11.8 | 34 | 203 tok/s | k. A. | $0.10 / $0.10 | 23. Juli 2024 | |
| #51 Gemini 2.5 Flash-Lite (Reasoning) von Google | 17.6 | 38 | 307 tok/s | 1.0M | $0.10 / $0.40 | 17. Juni 2025 | |
| #52 Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning) von Google | 21.6 | 28 | k. A. | k. A. | $0.10 / $0.40 | 8. Sept. 2025 | |
| #53 Gemini 2.5 Flash-Lite Preview (Sep '25) (Non-reasoning) von Google | 19.4 | 25 | k. A. | 1.0M | $0.10 / $0.40 | 25. Sept. 2025 | |
| #54 Gemini 2.5 Flash-Lite (Non-reasoning) von Google | 12.7 | 27 | 231 tok/s | 1.0M | $0.10 / $0.40 | 17. Juni 2025 | |
| #55 Devstral Small (Jul '25) von Mistral | 15.2 | 21 | 37 tok/s | k. A. | $0.10 / $0.30 | 10. Juli 2025 | |
| #56 Step 3.5 Flash von StepFun | 37.8 | 88 | 220 tok/s | 262K | $0.10 / $0.30 | 2. Feb. 2026 | |
| #57 MiMo-V2-Flash (Reasoning) von Xiaomi | 39.2 | 91 | 130 tok/s | 262K | $0.10 / $0.30 | 16. Dez. 2025 | |
| #58 Small 3.1 von Mistral | 14.5 | 35 | 156 tok/s | k. A. | $0.10 / $0.23 | 17. März 2025 | |
| #59 Gemma 3 27B Instruct von Google | 10.3 | 15 | k. A. | 131K | $0.11 / $0.25 | 12. März 2025 | |
| #60 Qwen3 4B (Non-reasoning) von Alibaba | 12.5 | 16 | k. A. | k. A. | $0.11 / $0.42 | 28. Apr. 2025 | |
| #61 Qwen3 0.6B (Non-reasoning) von Alibaba | 5.7 | 7 | k. A. | k. A. | $0.11 / $0.42 | 28. Apr. 2025 | |
| #62 Qwen3 4B (Reasoning) von Alibaba | 14.2 | 12 | k. A. | k. A. | $0.11 / $1.26 | 28. Apr. 2025 | |
| #63 Qwen3 1.7B (Non-reasoning) von Alibaba | 6.8 | 9 | k. A. | k. A. | $0.11 / $0.42 | 28. Apr. 2025 | |
| #64 Qwen3 0.6B (Reasoning) von Alibaba | 6.5 | 6 | k. A. | k. A. | $0.11 / $1.26 | 28. Apr. 2025 | |
| #65 Qwen3 8B (Reasoning) von Alibaba | 13.2 | 12 | 66 tok/s | 131K | $0.11 / $1.15 | 28. Apr. 2025 | |
| #66 Qwen3 1.7B (Reasoning) von Alibaba | 8.0 | 7 | k. A. | k. A. | $0.11 / $1.26 | 28. Apr. 2025 | |
| #67 Hy3-preview (Reasoning) von Tencent | 41.9 | 66 | 98 tok/s | 262K | $0.12 / $0.43 | 23. Apr. 2026 | |
| #68 Hy3-preview (Non-reasoning) von Tencent | 33.7 | 46 | 85 tok/s | 262K | $0.12 / $0.43 | 23. Apr. 2026 | |
| #69 Phi-4 von Microsoft | 10.4 | 12 | 40 tok/s | 16K | $0.13 / $0.50 | 12. Dez. 2024 | |
| #70 Gemma 4 26B A4B (Reasoning) von Google | 31.2 | 38 | k. A. | 262K | $0.13 / $0.40 | 2. Apr. 2026 | |
| #71 Gemma 4 26B A4B (Non-reasoning) von Google | 27.1 | 33 | 62 tok/s | 262K | $0.13 / $0.40 | 2. Apr. 2026 | |
| #72 Hermes 4 - Llama-3.1 70B (Non-reasoning) von Nous Research | 12.6 | 17 | 84 tok/s | k. A. | $0.13 / $0.40 | 27. Aug. 2025 | |
| #73 Hermes 4 - Llama-3.1 70B (Reasoning) von Nous Research | 16.0 | 23 | 88 tok/s | k. A. | $0.13 / $0.40 | 27. Aug. 2025 | |
| #74 Gemma 4 31B (Non-reasoning) von Google | 32.3 | 39 | 28 tok/s | 262K | $0.14 / $0.40 | 2. Apr. 2026 | |
| #75 V4 Flash (Reasoning, High Effort) von DeepSeek | 46.0 | 60 | k. A. | 1.0M | $0.14 / $0.28 | 24. Apr. 2026 | |
| #76 V4 Flash (Reasoning, Max Effort) von DeepSeek | 46.5 | 96 | 120 tok/s | 1.0M | $0.14 / $0.28 | 24. Apr. 2026 | |
| #77 V4 Flash (Non-reasoning) von DeepSeek | 36.5 | 72 | 114 tok/s | 1.0M | $0.14 / $0.28 | 24. Apr. 2026 | |
| #78 MiMo-V2.5 von Xiaomi | 49.0 | 69 | 82 tok/s | 1.0M | $0.14 / $0.28 | 22. Apr. 2026 | |
| #79 Ring-flash-2.0 von InclusionAI | 14.0 | 15 | k. A. | k. A. | $0.14 / $0.57 | 19. Sept. 2025 | |
| #80 Ling-flash-2.0 von InclusionAI | 15.7 | 17 | 72 tok/s | k. A. | $0.14 / $0.57 | 17. Sept. 2025 | |
| #81 gpt-oss-120b (low) von OpenAI | 24.5 | 43 | 367 tok/s | 131K | $0.15 / $0.60 | 5. Aug. 2025 | |
| #82 gpt-oss-120b (high) von OpenAI | 33.3 | 59 | 367 tok/s | 131K | $0.15 / $0.60 | 5. Aug. 2025 | |
| #83 Small 4 (Reasoning) von Mistral | 27.8 | 49 | 168 tok/s | k. A. | $0.15 / $0.60 | 16. März 2026 | |
| #84 Ministral 3 8B von Mistral | 14.8 | 28 | 102 tok/s | k. A. | $0.15 / $0.15 | 2. Dez. 2025 | |
| #85 Small 4 (Non-reasoning) von Mistral | 18.6 | 33 | 156 tok/s | k. A. | $0.15 / $0.60 | 16. März 2026 | |
| #86 GPT-4o mini von OpenAI | 12.6 | 13 | 70 tok/s | 128K | $0.15 / $0.60 | 18. Juli 2024 | |
| #87 Llama 3.2 Instruct 3B von Meta | 9.7 | 14 | 52 tok/s | k. A. | $0.15 / $0.15 | 25. Sept. 2024 | |
| #88 Gemini 2.0 Flash (Feb '25) von Google | 18.5 | 20 | k. A. | k. A. | $0.15 / $0.60 | 5. Feb. 2025 | |
| #89 Solar Mini von Upstage | 11.9 | 17 | 77 tok/s | k. A. | $0.15 / $0.15 | 25. Jan. 2024 | |
| #90 Qwen3 32B (Non-reasoning) von Alibaba | 14.5 | 20 | 98 tok/s | 131K | $0.15 / $0.59 | 28. Apr. 2025 | |
| #91 Qwen3 30B A3B 2507 Instruct von Alibaba | 15.0 | 25 | 108 tok/s | k. A. | $0.15 / $0.40 | 29. Juli 2025 | |
| #92 Llama 4 Scout von Meta | 13.5 | 19 | 106 tok/s | 10.0M | $0.17 / $0.66 | 5. Apr. 2025 | |
| #93 GLM-4.5-Air von Z AI | 23.2 | 21 | 69 tok/s | 131K | $0.17 / $0.98 | 28. Juli 2025 | |
| #94 Qwen3 8B (Non-reasoning) von Alibaba | 10.6 | 13 | 64 tok/s | 131K | $0.18 / $0.20 | 28. Apr. 2025 | |
| #95 Qwen3 VL 8B (Reasoning) von Alibaba | 16.7 | 19 | 138 tok/s | k. A. | $0.18 / $2.10 | 14. Okt. 2025 | |
| #96 Qwen3 VL 8B Instruct von Alibaba | 14.3 | 23 | 148 tok/s | 256K | $0.18 / $0.70 | 14. Okt. 2025 | |
| #97 Qwen3 Coder 30B A3B Instruct von Alibaba | 20.0 | 20 | 82 tok/s | 160K | $0.19 / $0.84 | 31. Juli 2025 | |
| #98 Qwen3 32B (Reasoning) von Alibaba | 16.5 | 22 | 98 tok/s | 131K | $0.20 / $0.52 | 28. Apr. 2025 | |
| #99 GPT-5.4 nano (xhigh) von OpenAI | 44.0 | 58 | 165 tok/s | 400K | $0.20 / $1.25 | 17. März 2026 | |
| #100 GPT-5.4 nano (Non-Reasoning) von OpenAI | 24.4 | 32 | 158 tok/s | 400K | $0.20 / $1.25 | 17. März 2026 | |
Zeige 100 von 354 Modelle
Das KI-Modell-Leaderboard verstehen
Dieses umfassende KI-Modell-Leaderboard hilft Ihnen, zu vergleichen und auszuwählen die besten Large Language Models (LLMs) für Ihre Anforderungen. Wir erfassen standardisierte KI-Benchmarks, Token-Preise, Inference-Geschwindigkeit und Modellfähigkeiten bei allen großen KI-Anbietern wie OpenAI, Anthropic, Google, Meta, und DeepSeek.
Kern-KI-Benchmarks erklärt
Wichtige Kennzahlen
So wählen Sie das richtige KI-Modell für Ihren Use Case
Für Forschung & Analyse
Priorisieren Sie Modelle mit hohen MMLU-Pro- (70 %+) und GPQA-Werten (60 %+), wenn es um komplexe Denkaufgaben, wissenschaftliche Recherche und technische Dokumentation geht
Für Kostenoptimierung
Sortieren Sie nach Input-/Output-Preisen - kleinere Modelle liefern bei einfachen Aufgaben oft 80 % der Flaggschiff-Leistung zu 10 % der Kosten
Für Mathe & MINT
Filtern Sie nach Math-Index oder AIME-2025-Scores (50 %+) für quantitative Analysen, Engineering-Berechnungen und wissenschaftliche Anwendungen
Alle Benchmark-Scores und Preisdaten werden täglich von Artificial Analysis aktualisiert, um die neuesten Modellversionen und Fähigkeiten abzubilden. Nutzen Sie die Sortierfilter oben, um KI-Modelle nach Intelligenz, Kosten, Coding-Fähigkeit, Mathe-Leistung, Geschwindigkeit oder Veröffentlichungsdatum zu finden.
Häufig gestellte Fragen
Was ist MMLU-Pro und warum gilt es als Standard-Benchmark für KI-Intelligenz?
MMLU-Pro (Massive Multitask Language Understanding - Professional) ist der umfassendste KI-Benchmark und testet Modelle in 14 akademischen Fachbereichen, darunter Mathematik, Naturwissenschaften, Geschichte, Recht und Ethik. Die Werte reichen von 46 % (Grundkompetenz) bis 87 % (nahe Expertenniveau). Modelle über 75 % zeigen starke allgemeine Intelligenz für professionelle Anwendungen, während Werte unter 60 % auf Einschränkungen bei komplexen Denkaufgaben hindeuten.
Was misst GPQA und welche Modelle erzielen die höchsten Werte?
GPQA (Graduate-level Google-Proof Q&A) prüft Denken auf Promotionsniveau mit Fragen, die bewusst "Google-proof" sind - sie erfordern tiefes Verständnis statt bloßer Faktenrecherche. Spitzenmodelle wie GPT-5.1 (87,3 %), GPT-5 mini (82,8 %) und o3 (82,7 %) sind bei GPQA besonders stark und eignen sich für Forschung, technische Analysen und komplexe Problemlösung. Modelle unter 50 % GPQA haben oft Schwierigkeiten bei anspruchsvollem Denken und liefern eher oberflächliche Antworten.
Was ist AIME 2025 und wie bewertet es die mathematischen Fähigkeiten von KI?
AIME 2025 (American Invitational Mathematics Examination) ist ein Benchmark auf Wettbewerbsniveau, der fortgeschrittene Problemlösung, Algebra, Geometrie und Zahlentheorie testet. Werte über 80 % (wie GPT-5 Codex mit 98,7 % oder GPT-5.1 mit 94 %) zeigen außergewöhnliches mathematisches Denken für Engineering, Scientific Computing und quantitative Analysen. Modelle unter 50 % können bei mehrstufigen mathematischen Aufgaben Probleme haben oder benötigen eine explizite Aufschlüsselung.
Wie wird die Preisgestaltung von KI-Modellen berechnet und was gilt als kosteneffizient?
Die Preise von KI-Modellen werden pro 1 Million Tokens berechnet (etwa 750.000 Wörter). Input-Preise betreffen den Text, den Sie senden, Output-Preise die generierten Antworten. Günstige Modelle wie Llama 3.3 70B kosten $0.54/$0.71 pro Million Tokens, Mid-Tier-Modelle wie GPT-5 nano $0.05/$0.40, Premium-Modelle wie GPT-5 $1.25/$10. Bei typischen Anwendungen mit einem Input-/Output-Verhältnis von 3:1 können Budget-Modelle 10- bis 20-mal günstiger sein und dennoch 70-80 % der Leistung liefern.
Welche KI-Modelle eignen sich am besten für Coding und Programmierung?
Sortieren Sie nach Coding Index um die besten Programmiermodelle zu sehen. Unser Coding Index kombiniert LiveCodeBench, SciCode und Coding-Benchmarks. Zu den Top-Performern gehören GPT-5.1 (57,5), GPT-5 mini (51,4) und GPT-5 Codex (53,5). Diese Modelle sind stark bei Codegenerierung, Debugging, Refactoring und der Erklärung komplexer Algorithmen. Für kostenbewusste Entwickler bieten Modelle mit 40+ Punkten im Coding Index ein sehr gutes Preis-Leistungs-Verhältnis für Routineaufgaben.
Wie oft werden KI-Modell-Benchmarks und Rankings aktualisiert?
Unser Leaderboard wird täglich mit der Artificial Analysis API synchronisiert, damit Benchmark-Scores (MMLU-Pro, GPQA, AIME 2025), Preise und Inference-Geschwindigkeit die neuesten Modellversionen widerspiegeln. Neue Modell-Releases erscheinen sofort unter der Sortierung "Neueste". Benchmark-Scores können sich ändern, wenn Anbieter aktualisierte Versionen veröffentlichen - zum Beispiel erreichte GPT-5.1 (veröffentlicht im November 2025) 69,7 Intelligenzpunkte gegenüber 68,5 bei GPT-5 aus August 2025.
Welche Inference-Geschwindigkeit (Tokens/Sekunde) brauche ich für meine Anwendung?
Die Inference-Geschwindigkeit bestimmt, wie schnell Modelle Antworten erzeugen. Für Echtzeit-Chatbots und interaktive Anwendungen sind 100+ Tokens/Sekunde sinnvoll (z. B. gpt-oss-120B mit 340 tok/s). Für Hintergrundverarbeitung und Batch-Jobs reichen 50-100 tok/s. Premium-Reasoning-Modelle wie GPT-5 (103 tok/s) balancieren Geschwindigkeit und Fähigkeiten. Wichtig: Höhere Geschwindigkeit bedeutet nicht automatisch bessere Qualität - langsamere Modelle liefern oft durchdachtere, detailliertere Antworten.
Kann ich diese KI-Modelle kostenlos testen, bevor ich mich entscheide?
Ja! Probieren Sie unsere kostenlose KI-Chatoberfläche aus, um verschiedene Modelle sofort ohne Account zu testen. Viele Anbieter haben ebenfalls kostenlose Stufen: OpenAI (ChatGPT mit Tageslimits), Anthropic (Claude mit Nutzungslimits), Google (Gemini Free Tier) und Open-Source-Modelle wie Llama 3.3. Vergleichen Sie die Leistung für Ihren konkreten Use Case, bevor Sie auf bezahlte Pläne wechseln.