KI-Modell-Ranking (LLM-Leaderboard)

Schnellste KI-Modelle

Sprachmodelle nach Inference-Geschwindigkeit und Durchsatz

Modell Name des KI-Modells und Anbieterorganisation	Preis/1 Mio. Kosten pro 1 Million Tokens — Input (Text, den Sie senden) / Output (Text, den das Modell erzeugt)	MMLU-Pro Massive Multitask Language Understanding (Professional) - testet breites Wissen in 14 Fachbereichen, inklusive MINT, Geistes- und Sozialwissenschaften	Geschwindigkeit Inference-Durchsatz in Tokens pro Sekunde - wie schnell das Modell Antworten generiert	GPQA Graduate-level Google-Proof Q&A Benchmark - testet Denken auf Promotionsniveau und fortgeschrittene Intelligenz	AIME 2025 American Invitational Mathematics Examination 2025 - testet fortgeschrittene mathematische Problemlösungsfähigkeit	Veröffentlichung Zeitpunkt der Veröffentlichung - neuere Modelle können mehr Fähigkeiten bieten	Vergleichen
#1 Mercury 2 von Inception	$0.25 / $0.75	-	958 tok/s	77.0%	-	20. Feb. 2026	Jetzt chatten
#2 Granite 3.3 8B (Non-reasoning) von IBM	$0.03 / $0.25	46.8%	477 tok/s	33.8%	6.7%	16. Apr. 2025	Jetzt chatten
#3 Granite 4.0 H Small von IBM	$0.06 / $0.25	62.4%	471 tok/s	41.6%	13.7%	22. Sept. 2025	Jetzt chatten
#4 Qwen3.5 0.8B (Non-reasoning) von Alibaba	$0.01 / $0.05	-	319 tok/s	23.6%	-	2. März 2026	Jetzt chatten
#5 Gemini 2.5 Flash-Lite (Non-reasoning) von Google	$0.10 / $0.40	72.4%	304 tok/s	47.4%	35.3%	17. Juni 2025	Jetzt chatten
#6 Ministral 3 3B von Mistral	$0.10 / $0.10	52.4%	302 tok/s	35.8%	22.0%	2. Dez. 2025	Jetzt chatten
#7 Nova Micro von Amazon	$0.04 / $0.14	53.1%	298 tok/s	35.8%	6.0%	3. Dez. 2024	Jetzt chatten
#8 Gemini 2.5 Flash-Lite (Reasoning) von Google	$0.10 / $0.40	75.9%	288 tok/s	62.5%	53.3%	17. Juni 2025	Jetzt chatten
#9 Qwen3.5 2B (Non-reasoning) von Alibaba	$0.02 / $0.10	-	286 tok/s	43.8%	-	2. März 2026	Jetzt chatten
#10 Step 3.5 Flash von StepFun	$0.10 / $0.30	-	260 tok/s	83.1%	-	2. Feb. 2026	Jetzt chatten
#11 gpt-oss-20B (high) von OpenAI	$0.06 / $0.20	74.8%	251 tok/s	68.8%	89.3%	5. Aug. 2025	Jetzt chatten
#12 gpt-oss-120B (low) von OpenAI	$0.15 / $0.60	77.5%	244 tok/s	67.2%	66.7%	5. Aug. 2025	Jetzt chatten
#13 Qwen3.5 4B (Non-reasoning) von Alibaba	$0.03 / $0.15	-	240 tok/s	71.2%	-	2. März 2026	Jetzt chatten
#14 Qwen3.5 4B (Reasoning) von Alibaba	$0.03 / $0.15	-	235 tok/s	77.1%	-	2. März 2026	Jetzt chatten
#15 gpt-oss-120B (high) von OpenAI	$0.15 / $0.60	80.8%	233 tok/s	78.2%	93.4%	5. Aug. 2025	Jetzt chatten
#16 Grok 4 Fast (Non-reasoning) von xAI	$0.20 / $0.50	73.0%	216 tok/s	60.6%	41.3%	19. Sept. 2025	Jetzt chatten
#17 gpt-oss-20B (low) von OpenAI	$0.06 / $0.20	71.8%	215 tok/s	61.1%	62.3%	5. Aug. 2025	Jetzt chatten
#18 Nova 2.0 Omni (Non-reasoning) von Amazon	$0.30 / $2.50	71.9%	212 tok/s	55.5%	37.0%	26. Nov. 2025	Jetzt chatten
#19 Devstral Small (Jul '25) von Mistral	$0.10 / $0.30	62.2%	211 tok/s	41.4%	29.3%	10. Juli 2025	Jetzt chatten
#20 Nova 2.0 Lite (low) von Amazon	$0.30 / $2.50	78.8%	204 tok/s	69.8%	46.7%	29. Okt. 2025	Jetzt chatten
#21 Gemini 3 Flash Preview (Non-reasoning) von Google	$0.50 / $3.00	88.2%	202 tok/s	81.2%	55.7%	17. Dez. 2025	Jetzt chatten
#22 Gemini 3.1 Flash-Lite Preview von Google	$0.25 / $1.50	-	202 tok/s	82.2%	-	3. März 2026	Jetzt chatten
#23 Gemini 3 Flash Preview (Reasoning) von Google	$0.50 / $3.00	89.0%	201 tok/s	89.8%	97.0%	17. Dez. 2025	Jetzt chatten
#24 Nova 2.0 Lite (medium) von Amazon	$0.30 / $2.50	81.3%	201 tok/s	76.8%	88.7%	29. Okt. 2025	Jetzt chatten
#25 Gemini 2.5 Flash (Reasoning) von Google	$0.30 / $2.50	83.2%	199 tok/s	79.0%	73.3%	20. Mai 2025	Jetzt chatten
#26 Mistral 7B Instruct von Mistral	$0.25 / $0.25	24.5%	199 tok/s	17.7%	-	27. Sept. 2023	Jetzt chatten
#27 Nova Lite von Amazon	$0.06 / $0.24	59.0%	197 tok/s	43.3%	7.0%	3. Dez. 2024	Jetzt chatten
#28 GPT-5 Codex (high) von OpenAI	$1.25 / $10.00	86.5%	197 tok/s	83.7%	98.7%	23. Sept. 2025	Jetzt chatten
#29 Grok 4.20 0309 (Reasoning) von xAI	$2.00 / $6.00	-	197 tok/s	88.5%	-	10. März 2026	Jetzt chatten
#30 Ministral 3 8B von Mistral	$0.15 / $0.15	64.2%	196 tok/s	47.1%	31.7%	2. Dez. 2025	Jetzt chatten
#31 Grok 3 mini Reasoning (high) von xAI	$0.30 / $0.50	82.8%	196 tok/s	79.1%	84.7%	19. Feb. 2025	Jetzt chatten
#32 GPT-5.1 Codex (high) von OpenAI	$1.25 / $10.00	86.0%	196 tok/s	86.0%	95.7%	13. Nov. 2025	Jetzt chatten
#33 Gemini 2.5 Flash (Non-reasoning) von Google	$0.30 / $2.50	80.9%	194 tok/s	68.3%	60.3%	20. Mai 2025	Jetzt chatten
#34 Qwen3 0.6B (Reasoning) von Alibaba	$0.11 / $1.26	34.7%	192 tok/s	23.9%	18.0%	28. Apr. 2025	Jetzt chatten
#35 Grok 4.20 0309 v2 (Reasoning) von xAI	$2.00 / $6.00	-	192 tok/s	91.1%	-	7. Apr. 2026	Jetzt chatten
#36 Nova 2.0 Lite (Non-reasoning) von Amazon	$0.30 / $2.50	74.3%	192 tok/s	60.3%	33.7%	29. Okt. 2025	Jetzt chatten
#37 Grok 4 Fast (Reasoning) von xAI	$0.20 / $0.50	85.0%	191 tok/s	84.7%	89.7%	19. Sept. 2025	Jetzt chatten
#38 GPT-4.1 nano von OpenAI	$0.10 / $0.40	65.7%	190 tok/s	51.2%	24.0%	14. Apr. 2025	Jetzt chatten
#39 Qwen3 0.6B (Non-reasoning) von Alibaba	$0.11 / $0.42	23.1%	190 tok/s	23.1%	10.3%	28. Apr. 2025	Jetzt chatten
#40 GPT-5.1 Codex mini (high) von OpenAI	$0.25 / $2.00	82.0%	189 tok/s	81.3%	91.7%	13. Nov. 2025	Jetzt chatten
#41 Nova 2.0 Lite (high) von Amazon	$0.30 / $2.50	81.8%	189 tok/s	81.1%	94.3%	29. Okt. 2025	Jetzt chatten
#42 Grok 4.20 0309 v2 (Non-reasoning) von xAI	$2.00 / $6.00	-	187 tok/s	77.6%	-	k. A.	Jetzt chatten
#43 Llama 3.1 Instruct 8B von Meta	$0.10 / $0.10	47.6%	186 tok/s	25.9%	4.3%	23. Juli 2024	Jetzt chatten
#44 Jamba 1.6 Mini von AI21 Labs	$0.20 / $0.40	36.7%	186 tok/s	30.0%	-	6. März 2025	Jetzt chatten
#45 Magistral Small 1.2 von Mistral	$0.50 / $1.50	76.8%	183 tok/s	66.3%	80.3%	17. Sept. 2025	Jetzt chatten
#46 Qwen3.5 9B (Non-reasoning) von Alibaba	$0.04 / $0.20	-	180 tok/s	78.6%	-	2. März 2026	Jetzt chatten
#47 GPT-5.4 nano (xhigh) von OpenAI	$0.20 / $1.25	-	178 tok/s	81.7%	-	17. März 2026	Jetzt chatten
#48 GPT-5.4 nano (medium) von OpenAI	$0.20 / $1.25	-	177 tok/s	76.1%	-	17. März 2026	Jetzt chatten
#49 Qwen3 Next 80B A3B (Reasoning) von Alibaba	$0.50 / $6.00	82.4%	177 tok/s	75.9%	84.3%	11. Sept. 2025	Jetzt chatten
#50 GPT-5.4 nano (Non-Reasoning) von OpenAI	$0.20 / $1.25	-	176 tok/s	55.8%	-	17. März 2026	Jetzt chatten
#51 Qwen3 Next 80B A3B Instruct von Alibaba	$0.50 / $2.00	81.9%	175 tok/s	73.8%	66.3%	11. Sept. 2025	Jetzt chatten
#52 GPT-5.4 mini (medium) von OpenAI	$0.75 / $4.50	-	174 tok/s	82.3%	-	17. März 2026	Jetzt chatten
#53 Grok 4.20 0309 (Non-reasoning) von xAI	$2.00 / $6.00	-	174 tok/s	78.5%	-	10. März 2026	Jetzt chatten
#54 Mistral Small 4 (Reasoning) von Mistral	$0.15 / $0.60	-	173 tok/s	76.9%	-	16. März 2026	Jetzt chatten
#55 GPT-5.4 mini (xhigh) von OpenAI	$0.75 / $4.50	-	170 tok/s	87.5%	-	17. März 2026	Jetzt chatten
#56 Qwen3.5 Omni Flash von Alibaba	$0.10 / $0.80	-	167 tok/s	74.2%	-	30. März 2026	Jetzt chatten
#57 Grok Code Fast 1 von xAI	$0.20 / $1.50	79.3%	166 tok/s	72.7%	43.3%	28. Aug. 2025	Jetzt chatten
#58 NVIDIA Nemotron Nano 9B V2 (Non-reasoning) von NVIDIA	$0.05 / $0.20	73.9%	165 tok/s	55.7%	62.3%	18. Aug. 2025	Jetzt chatten
#59 GPT-5 (ChatGPT) von OpenAI	$1.25 / $10.00	82.0%	165 tok/s	68.6%	48.3%	7. Aug. 2025	Jetzt chatten
#60 Qwen3 Coder Next von Alibaba	$0.35 / $1.20	-	164 tok/s	73.7%	-	3. Feb. 2026	Jetzt chatten
#61 Mistral Small (Feb '24) von Mistral	$1.00 / $3.00	41.9%	161 tok/s	30.2%	-	26. Feb. 2024	Jetzt chatten
#62 GPT-5.4 mini (Non-Reasoning) von OpenAI	$0.75 / $4.50	-	161 tok/s	60.6%	-	17. März 2026	Jetzt chatten
#63 Mistral Small (Sep '24) von Mistral	$0.20 / $0.60	52.9%	160 tok/s	38.1%	-	17. Sept. 2024	Jetzt chatten
#64 Mistral Small 3 von Mistral	$0.10 / $0.30	65.2%	160 tok/s	46.2%	4.3%	30. Jan. 2025	Jetzt chatten
#65 Mistral Small 3.1 von Mistral	$0.10 / $0.30	65.9%	160 tok/s	45.4%	3.7%	17. März 2025	Jetzt chatten
#66 NVIDIA Nemotron 3 Super 120B A12B (Reasoning) von NVIDIA	$0.30 / $0.75	-	157 tok/s	80.0%	-	11. März 2026	Jetzt chatten
#67 Mistral Small 4 (Non-reasoning) von Mistral	$0.15 / $0.60	-	156 tok/s	57.1%	-	16. März 2026	Jetzt chatten
#68 Llama 3.2 Instruct 1B von Meta	$0.10 / $0.10	20.0%	155 tok/s	19.6%	-	25. Sept. 2024	Jetzt chatten
#69 GPT-5 nano (medium) von OpenAI	$0.05 / $0.40	77.2%	154 tok/s	67.0%	78.3%	7. Aug. 2025	Jetzt chatten
#70 o3-mini von OpenAI	$1.10 / $4.40	79.1%	154 tok/s	74.8%	-	31. Jan. 2025	Jetzt chatten
#71 Qwen3 30B A3B 2507 (Reasoning) von Alibaba	$0.20 / $2.40	80.5%	154 tok/s	70.7%	56.3%	30. Juli 2025	Jetzt chatten
#72 Qwen3.5 122B A10B (Non-reasoning) von Alibaba	$0.40 / $3.20	-	152 tok/s	82.7%	-	24. Feb. 2026	Jetzt chatten
#73 o3-mini (high) von OpenAI	$1.10 / $4.40	80.2%	151 tok/s	77.3%	-	31. Jan. 2025	Jetzt chatten
#74 Nova 2.0 Pro Preview (Non-reasoning) von Amazon	$1.25 / $10.00	77.2%	148 tok/s	63.6%	30.7%	27. Nov. 2025	Jetzt chatten
#75 GPT-5 nano (high) von OpenAI	$0.05 / $0.40	78.0%	147 tok/s	67.6%	83.7%	7. Aug. 2025	Jetzt chatten
#76 Claude 4.5 Haiku (Reasoning) von Anthropic	$1.00 / $5.00	76.0%	146 tok/s	67.2%	83.7%	15. Okt. 2025	Jetzt chatten
#77 Qwen3 VL 8B Instruct von Alibaba	$0.18 / $0.70	68.6%	145 tok/s	42.7%	27.3%	14. Okt. 2025	Jetzt chatten
#78 Qwen3.5 122B A10B (Reasoning) von Alibaba	$0.40 / $3.20	-	144 tok/s	85.7%	-	24. Feb. 2026	Jetzt chatten
#79 GPT-5 nano (minimal) von OpenAI	$0.05 / $0.40	55.6%	144 tok/s	42.8%	27.3%	7. Aug. 2025	Jetzt chatten
#80 Mistral Small 3.2 von Mistral	$0.10 / $0.30	68.1%	144 tok/s	50.5%	27.0%	20. Juni 2025	Jetzt chatten
#81 NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning) von NVIDIA	$0.20 / $0.60	64.9%	144 tok/s	43.9%	26.7%	28. Okt. 2025	Jetzt chatten
#82 Qwen3.5 35B A3B (Reasoning) von Alibaba	$0.25 / $2.00	-	144 tok/s	84.5%	-	24. Feb. 2026	Jetzt chatten
#83 Llama 4 Scout von Meta	$0.17 / $0.66	75.2%	143 tok/s	58.7%	14.0%	5. Apr. 2025	Jetzt chatten
#84 Devstral Medium von Mistral	$0.40 / $2.00	70.8%	142 tok/s	49.2%	4.7%	10. Juli 2025	Jetzt chatten
#85 Qwen3.5 35B A3B (Non-reasoning) von Alibaba	$0.25 / $2.00	-	142 tok/s	81.9%	-	24. Feb. 2026	Jetzt chatten
#86 Gemini 3 Pro Preview (high) von Google	$2.00 / $12.00	89.8%	141 tok/s	90.8%	95.7%	18. Nov. 2025	Jetzt chatten
#87 o4-mini (high) von OpenAI	$1.10 / $4.40	83.2%	141 tok/s	78.4%	90.7%	16. Apr. 2025	Jetzt chatten
#88 Nova 2.0 Pro Preview (low) von Amazon	$1.25 / $10.00	82.2%	141 tok/s	75.1%	63.3%	27. Nov. 2025	Jetzt chatten
#89 Nova 2.0 Pro Preview (medium) von Amazon	$1.25 / $10.00	83.0%	141 tok/s	78.5%	89.0%	27. Nov. 2025	Jetzt chatten
#90 Sarvam 105B (high) von Sarvam	k. A. / k. A.	-	140 tok/s	73.8%	-	6. März 2026	Jetzt chatten
#91 Qwen3 1.7B (Non-reasoning) von Alibaba	$0.11 / $0.42	41.1%	140 tok/s	28.3%	7.3%	28. Apr. 2025	Jetzt chatten
#92 Qwen3 1.7B (Reasoning) von Alibaba	$0.11 / $1.26	57.0%	138 tok/s	35.6%	38.7%	28. Apr. 2025	Jetzt chatten
#93 Qwen3 VL 8B (Reasoning) von Alibaba	$0.18 / $2.10	74.9%	138 tok/s	57.9%	30.7%	14. Okt. 2025	Jetzt chatten
#94 NVIDIA Nemotron Nano 12B v2 VL (Reasoning) von NVIDIA	$0.20 / $0.60	75.9%	137 tok/s	57.2%	75.0%	28. Okt. 2025	Jetzt chatten
#95 Grok 4.1 Fast (Non-reasoning) von xAI	$0.20 / $0.50	74.3%	134 tok/s	63.7%	34.3%	19. Nov. 2025	Jetzt chatten
#96 Gemini 3.1 Pro Preview von Google	$2.00 / $12.00	-	132 tok/s	94.1%	-	19. Feb. 2026	Jetzt chatten
#97 Grok 4.1 Fast (Reasoning) von xAI	$0.20 / $0.50	85.4%	131 tok/s	85.3%	89.3%	19. Nov. 2025	Jetzt chatten
#98 Claude 3 Haiku von Anthropic	$0.25 / $1.25	-	129 tok/s	37.4%	-	4. März 2024	Jetzt chatten
#99 Ministral 3 14B von Mistral	$0.20 / $0.20	69.3%	128 tok/s	57.2%	30.0%	2. Dez. 2025	Jetzt chatten
#100 Qwen3 VL 30B A3B Instruct von Alibaba	$0.20 / $0.80	76.4%	128 tok/s	69.5%	72.3%	3. Okt. 2025	Jetzt chatten

Zeige 100 von 474 Modelle

Made in Europe

Chat with 100+ AI Models in one App.

Use Claude, ChatGPT, Gemini alongside with EU-Hosted Models like Deepseek, GLM-5, Kimi K2.5 and many more.

Start for free View pricing

Das KI-Modell-Leaderboard verstehen

Dieses umfassende KI-Modell-Leaderboard hilft Ihnen, zu vergleichen und auszuwählen die besten Large Language Models (LLMs) für Ihre Anforderungen. Wir erfassen standardisierte KI-Benchmarks, Token-Preise, Inference-Geschwindigkeit und Modellfähigkeiten bei allen großen KI-Anbietern wie OpenAI, Anthropic, Google, Meta, und DeepSeek.

Kern-KI-Benchmarks erklärt

MMLU-Pro Testet breites Wissen über 14 akademische Fachbereiche

GPQA Denken & Problemlösung auf Promotionsniveau

AIME 2025 Mathematisches Denken auf Spitzenniveau

Coding Index LiveCodeBench + SciCode kombiniert

Math Index AIME + MATH-500 kombiniert

Wichtige Kennzahlen

Token-Preisgestaltung Input- vs. Output-Kosten pro 1 Mio. Tokens

Inference-Geschwindigkeit Tokens/Sekunde für Antwortzeit

Veröffentlichungsdatum Neueste Techniken & Wissensstand

Benchmark-Scores Fähigkeitsvergleich von 0-100 %

So wählen Sie das richtige KI-Modell für Ihren Use Case

Für Forschung & Analyse

Priorisieren Sie Modelle mit hohen MMLU-Pro- (70 %+) und GPQA-Werten (60 %+), wenn es um komplexe Denkaufgaben, wissenschaftliche Recherche und technische Dokumentation geht

Für Kostenoptimierung

Sortieren Sie nach Input-/Output-Preisen - kleinere Modelle liefern bei einfachen Aufgaben oft 80 % der Flaggschiff-Leistung zu 10 % der Kosten

Für Mathe & MINT

Filtern Sie nach Math-Index oder AIME-2025-Scores (50 %+) für quantitative Analysen, Engineering-Berechnungen und wissenschaftliche Anwendungen

Alle Benchmark-Scores und Preisdaten werden täglich von Artificial Analysis aktualisiert, um die neuesten Modellversionen und Fähigkeiten abzubilden. Nutzen Sie die Sortierfilter oben, um KI-Modelle nach Intelligenz, Kosten, Coding-Fähigkeit, Mathe-Leistung, Geschwindigkeit oder Veröffentlichungsdatum zu finden.

Häufig gestellte Fragen

Was ist MMLU-Pro und warum gilt es als Standard-Benchmark für KI-Intelligenz?

MMLU-Pro (Massive Multitask Language Understanding - Professional) ist der umfassendste KI-Benchmark und testet Modelle in 14 akademischen Fachbereichen, darunter Mathematik, Naturwissenschaften, Geschichte, Recht und Ethik. Die Werte reichen von 46 % (Grundkompetenz) bis 87 % (nahe Expertenniveau). Modelle über 75 % zeigen starke allgemeine Intelligenz für professionelle Anwendungen, während Werte unter 60 % auf Einschränkungen bei komplexen Denkaufgaben hindeuten.

Was misst GPQA und welche Modelle erzielen die höchsten Werte?

GPQA (Graduate-level Google-Proof Q&A) prüft Denken auf Promotionsniveau mit Fragen, die bewusst "Google-proof" sind - sie erfordern tiefes Verständnis statt bloßer Faktenrecherche. Spitzenmodelle wie GPT-5.1 (87,3 %), GPT-5 mini (82,8 %) und o3 (82,7 %) sind bei GPQA besonders stark und eignen sich für Forschung, technische Analysen und komplexe Problemlösung. Modelle unter 50 % GPQA haben oft Schwierigkeiten bei anspruchsvollem Denken und liefern eher oberflächliche Antworten.

Was ist AIME 2025 und wie bewertet es die mathematischen Fähigkeiten von KI?

AIME 2025 (American Invitational Mathematics Examination) ist ein Benchmark auf Wettbewerbsniveau, der fortgeschrittene Problemlösung, Algebra, Geometrie und Zahlentheorie testet. Werte über 80 % (wie GPT-5 Codex mit 98,7 % oder GPT-5.1 mit 94 %) zeigen außergewöhnliches mathematisches Denken für Engineering, Scientific Computing und quantitative Analysen. Modelle unter 50 % können bei mehrstufigen mathematischen Aufgaben Probleme haben oder benötigen eine explizite Aufschlüsselung.

Wie wird die Preisgestaltung von KI-Modellen berechnet und was gilt als kosteneffizient?

Die Preise von KI-Modellen werden pro 1 Million Tokens berechnet (etwa 750.000 Wörter). Input-Preise betreffen den Text, den Sie senden, Output-Preise die generierten Antworten. Günstige Modelle wie Llama 3.3 70B kosten $0.54/$0.71 pro Million Tokens, Mid-Tier-Modelle wie GPT-5 nano $0.05/$0.40, Premium-Modelle wie GPT-5 $1.25/$10. Bei typischen Anwendungen mit einem Input-/Output-Verhältnis von 3:1 können Budget-Modelle 10- bis 20-mal günstiger sein und dennoch 70-80 % der Leistung liefern.

Welche KI-Modelle eignen sich am besten für Coding und Programmierung?

Sortieren Sie nach Coding Index um die besten Programmiermodelle zu sehen. Unser Coding Index kombiniert LiveCodeBench, SciCode und Coding-Benchmarks. Zu den Top-Performern gehören GPT-5.1 (57,5), GPT-5 mini (51,4) und GPT-5 Codex (53,5). Diese Modelle sind stark bei Codegenerierung, Debugging, Refactoring und der Erklärung komplexer Algorithmen. Für kostenbewusste Entwickler bieten Modelle mit 40+ Punkten im Coding Index ein sehr gutes Preis-Leistungs-Verhältnis für Routineaufgaben.

Wie oft werden KI-Modell-Benchmarks und Rankings aktualisiert?

Unser Leaderboard wird täglich mit der Artificial Analysis API synchronisiert, damit Benchmark-Scores (MMLU-Pro, GPQA, AIME 2025), Preise und Inference-Geschwindigkeit die neuesten Modellversionen widerspiegeln. Neue Modell-Releases erscheinen sofort unter der Sortierung "Neueste". Benchmark-Scores können sich ändern, wenn Anbieter aktualisierte Versionen veröffentlichen - zum Beispiel erreichte GPT-5.1 (veröffentlicht im November 2025) 69,7 Intelligenzpunkte gegenüber 68,5 bei GPT-5 aus August 2025.

Welche Inference-Geschwindigkeit (Tokens/Sekunde) brauche ich für meine Anwendung?

Die Inference-Geschwindigkeit bestimmt, wie schnell Modelle Antworten erzeugen. Für Echtzeit-Chatbots und interaktive Anwendungen sind 100+ Tokens/Sekunde sinnvoll (z. B. gpt-oss-120B mit 340 tok/s). Für Hintergrundverarbeitung und Batch-Jobs reichen 50-100 tok/s. Premium-Reasoning-Modelle wie GPT-5 (103 tok/s) balancieren Geschwindigkeit und Fähigkeiten. Wichtig: Höhere Geschwindigkeit bedeutet nicht automatisch bessere Qualität - langsamere Modelle liefern oft durchdachtere, detailliertere Antworten.

Kann ich diese KI-Modelle kostenlos testen, bevor ich mich entscheide?

Ja! Probieren Sie unsere kostenlose KI-Chatoberfläche aus, um verschiedene Modelle sofort ohne Account zu testen. Viele Anbieter haben ebenfalls kostenlose Stufen: OpenAI (ChatGPT mit Tageslimits), Anthropic (Claude mit Nutzungslimits), Google (Gemini Free Tier) und Open-Source-Modelle wie Llama 3.3. Vergleichen Sie die Leistung für Ihren konkreten Use Case, bevor Sie auf bezahlte Pläne wechseln.