KI-Modell-Ranking (LLM-Leaderboard)

Günstigste KI-Modelle

Language models ranked by Artificial Analysis Index

Beste Empfehlungen

Mit diesen Modellen starten

Schnelle Empfehlungen aus aktuellen Benchmark-, Geschwindigkeits- und Preisdaten.

Insgesamt am besten

Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

von Anthropic

Bester Wert

V4 Flash (Reasoning, Max Effort)

von DeepSeek

Beste für Coding

GPT-5.6 Sol (xhigh)

von OpenAI

Schnellste brauchbare Option

Gemini 3.6 Flash (high)

von Google

Modell Name des KI-Modells und Anbieterorganisation	Intelligenz Artificial Analysis Intelligence Index - composite reasoning and capability score across the benchmark suite	Value Score Qualität, Geschwindigkeit und gemischter Token-Preis als relativer Wert-Score	Speed Inference-Durchsatz in Tokens pro Sekunde - wie schnell das Modell Antworten generiert	Context Maximum context window size - how much text, code, or conversation the model can process at once	Price Kosten pro 1 Million Tokens — Input (Text, den Sie senden) / Output (Text, den das Modell erzeugt)	Vergleichen
#1 Gemma 4 E4B (Reasoning) von Google · 3. Apr. 2026	12.5	63	113 tok/s	262K	$0.02/$0.10	Details
#2 Gemma 4 E4B (Non-reasoning) von Google · 3. Apr. 2026	8.9	46	114 tok/s	262K	$0.02/$0.10	Details
#3 Gemma 3n E4B Instruct von Google · 26. Juni 2025	1.2	5	56 tok/s	262K	$0.02/$0.04	Details
#4 30B (high) von Sarvam · 6. März 2026	6.6	21	k. A.	k. A.	$0.03/$0.11	Details
#5 Qwen3.5 4B (Reasoning) von Alibaba · 2. März 2026	20.1	56	27 tok/s	262K	$0.03/$0.15	Details
Mit führenden KI-Modellen chatten Nutze Claude, ChatGPT und Gemini zusammen mit EU-gehosteten Modellen wie Deepseek, Qwen und Kimi. Kostenlos chatten EU-gehostete Inferenz Server in Deutschland und Finnland. Entwickelt fuer strenge GDPR- und ISO-27001-Compliance-Anforderungen. API-Zugang erhalten
#6 Qwen3.5 4B (Non-reasoning) von Alibaba · 2. März 2026	16.0	44	12 tok/s	262K	$0.03/$0.15	Details
#7 Granite 3.3 8B (Non-reasoning) von IBM · 16. Apr. 2025	1.8	7	407 tok/s	131K	$0.03/$0.25	Details
#8 Nova Micro von Amazon · 3. Dez. 2024	4.7	21	280 tok/s	k. A.	$0.04/$0.14	Details
#9 Nemotron Nano 9B V2 (Reasoning) von NVIDIA · 18. Aug. 2025	8.8	25	83 tok/s	k. A.	$0.04/$0.16	Details
#10 HyperNova 60B 2605 von Multiverse Computing · 26. Mai 2026	17.8	79	381 tok/s	k. A.	$0.04/$0.14	Details
#11 105B (high) von Sarvam · 6. März 2026	11.9	30	k. A.	k. A.	$0.04/$0.17	Details
#12 Llama 3 Instruct 8B von Meta · 18. Apr. 2024	1.2	3	81 tok/s	k. A.	$0.04/$0.14	Details
#13 Nemotron 3 Nano 30B A3B (Reasoning) von NVIDIA · 15. Dez. 2025	14.2	54	161 tok/s	512K	$0.05/$0.20	Details
#14 Nemotron 3 Nano 30B A3B (Non-reasoning) von NVIDIA · 15. Dez. 2025	7.4	28	124 tok/s	512K	$0.05/$0.20	Details
#15 Nemotron Nano 9B V2 (Non-reasoning) von NVIDIA · 18. Aug. 2025	7.4	24	107 tok/s	k. A.	$0.05/$0.20	Details
#16 Granite 4.1 8B von IBM · 29. Apr. 2026	6.7	30	127 tok/s	131K	$0.05/$0.10	Details
#17 GPT-5 nano (minimal) von OpenAI · 7. Aug. 2025	8.0	24	183 tok/s	1.1M	$0.05/$0.40	Details
#18 GPT-5 nano (medium) von OpenAI · 7. Aug. 2025	19.0	58	174 tok/s	1.1M	$0.05/$0.40	Details
#19 GPT-5 nano (high) von OpenAI · 7. Aug. 2025	19.9	61	178 tok/s	1.1M	$0.05/$0.40	Details
#20 Llama 2 Chat 7B von Meta · 18. Juli 2023	4.3	12	95 tok/s	k. A.	$0.05/$0.25	Details
#21 Qwen2.5 Turbo von Alibaba · 18. Nov. 2024	6.3	21	111 tok/s	262K	$0.05/$0.20	Details
#22 gpt-oss-20b (high) von OpenAI · 5. Aug. 2025	14.9	55	253 tok/s	1.1M	$0.06/$0.20	Details
#23 Granite 4.0 H Small von IBM · 22. Sept. 2025	5.2	18	470 tok/s	131K	$0.06/$0.25	Details
#24 Nova Lite von Amazon · 3. Dez. 2024	6.9	24	168 tok/s	k. A.	$0.06/$0.24	Details
#25 gpt-oss-20b (low) von OpenAI · 5. Aug. 2025	14.3	50	250 tok/s	1.1M	$0.07/$0.20	Details
#26 GLM-4.7-Flash (Reasoning) von Z AI · 19. Jan. 2026	22.9	48	91 tok/s	k. A.	$0.07/$0.40	Details
#27 GLM-4.7-Flash (Non-reasoning) von Z AI · 19. Jan. 2026	15.5	45	129 tok/s	k. A.	$0.07/$0.40	Details
#28 Nemotron 3 Nano Omni 30B A3B Reasoning von NVIDIA · 29. Apr. 2026	14.9	46	319 tok/s	512K	$0.07/$0.30	Details
#29 Llama 3.1 Instruct 8B von Meta · 23. Juli 2024	7.6	31	161 tok/s	k. A.	$0.07/$0.09	Details
#30 Gemma 4 12B (Reasoning) von Google · 3. Juni 2026	22.0	64	129 tok/s	262K	$0.10/$0.30	Details
#31 Gemma 4 12B (Non-reasoning) von Google · 3. Juni 2026	13.2	37	119 tok/s	262K	$0.10/$0.30	Details
#32 Ministral 3 3B von Mistral · 2. Dez. 2025	6.8	24	159 tok/s	k. A.	$0.10/$0.10	Details
#33 Step 3.5 Flash 2603 von StepFun · 2. Apr. 2026	26.0	76	301 tok/s	256K	$0.10/$0.30	Details
#34 Olmo 3 7B Instruct von Allen Institute for AI · 20. Nov. 2025	2.8	5	k. A.	k. A.	$0.10/$0.20	Details
#35 Apertus 8B Instruct von Swiss AI Initiative · 2. Sept. 2025	1.0	2	k. A.	k. A.	$0.10/$0.20	Details
#36 Qwen3.5 Omni Flash von Alibaba · 30. März 2026	19.0	41	260 tok/s	1.0M	$0.10/$0.80	Details
#37 Qwen3.5 9B (Reasoning) von Alibaba · 2. März 2026	21.4	43	50 tok/s	262K	$0.10/$0.15	Details
#38 Ling 2.6 Flash von InclusionAI · 21. Apr. 2026	14.1	41	152 tok/s	262K	$0.10/$0.30	Details
#39 GPT-4.1 nano von OpenAI · 14. Apr. 2025	9.6	26	189 tok/s	1.1M	$0.10/$0.40	Details
#40 Gemini 2.5 Flash-Lite Preview (Sep '25) (Non-reasoning) von Google · 25. Sept. 2025	13.1	21	k. A.	1.0M	$0.10/$0.40	Details
#41 Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning) von Google · 8. Sept. 2025	15.1	24	k. A.	1.0M	$0.10/$0.40	Details
#42 Gemini 2.5 Flash-Lite (Non-reasoning) von Google · 17. Juni 2025	6.9	19	247 tok/s	1.0M	$0.10/$0.40	Details
#43 Gemini 2.5 Flash-Lite (Reasoning) von Google · 17. Juni 2025	11.4	31	304 tok/s	1.0M	$0.10/$0.40	Details
#44 Small 3 von Mistral · 30. Jan. 2025	6.9	20	158 tok/s	262K	$0.10/$0.30	Details
#45 Small 3.1 von Mistral · 17. März 2025	14.7	43	156 tok/s	262K	$0.10/$0.30	Details
#46 Small 3.2 von Mistral · 20. Juni 2025	10.6	31	155 tok/s	262K	$0.10/$0.30	Details
#47 Step 3.5 Flash von StepFun · 2. Feb. 2026	25.5	74	285 tok/s	256K	$0.10/$0.30	Details
#48 MiMo-V2-Flash (Reasoning) von Xiaomi · 16. Dez. 2025	31.2	55	k. A.	1.0M	$0.10/$0.30	Details
#49 Hy3-preview (Non-reasoning) von Tencent · 23. Apr. 2026	26.1	66	156 tok/s	k. A.	$0.12/$0.43	Details
#50 Hy3-preview (Reasoning) von Tencent · 23. Apr. 2026	33.6	85	150 tok/s	k. A.	$0.12/$0.43	Details
#51 Phi-4 von Microsoft · 12. Dez. 2024	4.9	7	43 tok/s	k. A.	$0.13/$0.50	Details
#52 Gemma 4 26B A4B (Non-reasoning) von Google · 2. Apr. 2026	20.1	31	43 tok/s	262K	$0.13/$0.40	Details
#53 Gemma 4 26B A4B (Reasoning) von Google · 2. Apr. 2026	25.7	39	k. A.	262K	$0.13/$0.40	Details
#54 Hermes 4 - Llama-3.1 70B (Non-reasoning) von Nous Research · 27. Aug. 2025	6.9	13	92 tok/s	k. A.	$0.13/$0.40	Details
#55 Hermes 4 - Llama-3.1 70B (Reasoning) von Nous Research · 27. Aug. 2025	10.0	19	92 tok/s	k. A.	$0.13/$0.40	Details
#56 Gemma 4 31B (Non-reasoning) von Google · 2. Apr. 2026	21.8	33	64 tok/s	262K	$0.14/$0.40	Details
#57 V4 Flash (Reasoning, High Effort) von DeepSeek · 24. Apr. 2026	37.5	61	k. A.	1.0M	$0.14/$0.28	Details
#58 V4 Flash (Reasoning, Max Effort) von DeepSeek · 24. Apr. 2026	40.3	100	115 tok/s	1.0M	$0.14/$0.28	Details
#59 V4 Flash (Non-reasoning) von DeepSeek · 24. Apr. 2026	28.7	70	113 tok/s	1.0M	$0.14/$0.28	Details
#60 MiMo-V2.5 von Xiaomi · 22. Apr. 2026	37.2	60	64 tok/s	1.0M	$0.14/$0.28	Details
#61 Ring-flash-2.0 von InclusionAI · 19. Sept. 2025	8.2	11	k. A.	k. A.	$0.14/$0.57	Details
#62 Ling-flash-2.0 von InclusionAI · 17. Sept. 2025	9.7	13	66 tok/s	262K	$0.14/$0.57	Details
#63 gpt-oss-120b (high) von OpenAI · 5. Aug. 2025	23.8	52	297 tok/s	1.1M	$0.15/$0.60	Details
#64 gpt-oss-120b (low) von OpenAI · 5. Aug. 2025	14.9	33	337 tok/s	1.1M	$0.15/$0.60	Details
#65 Small 4 (Non-reasoning) von Mistral · 16. März 2026	12.4	27	149 tok/s	262K	$0.15/$0.60	Details
#66 Small 4 (Reasoning) von Mistral · 16. März 2026	19.6	43	175 tok/s	262K	$0.15/$0.60	Details
#67 Ministral 3 8B von Mistral · 2. Dez. 2025	9.0	24	113 tok/s	k. A.	$0.15/$0.15	Details
#68 GPT-4o mini von OpenAI · 18. Juli 2024	6.9	11	88 tok/s	400K	$0.15/$0.60	Details
#69 Gemini 2.0 Flash (Feb '25) von Google · 5. Feb. 2025	12.3	16	k. A.	131K	$0.15/$0.60	Details
#70 Solar Mini von Upstage · 25. Jan. 2024	6.2	11	75 tok/s	128K	$0.15/$0.15	Details
#71 GLM-4.5-Air von Z AI · 28. Juli 2025	16.5	18	71 tok/s	k. A.	$0.17/$0.98	Details
#72 Llama 4 Scout von Meta · 5. Apr. 2025	10.0	13	76 tok/s	k. A.	$0.18/$0.66	Details
#73 Qwen3 8B (Non-reasoning) von Alibaba · 28. Apr. 2025	5.1	6	65 tok/s	262K	$0.18/$0.70	Details
#74 Qwen3 VL 8B Instruct von Alibaba · 14. Okt. 2025	8.4	17	140 tok/s	262K	$0.18/$0.70	Details
#75 Qwen3 VL 8B (Reasoning) von Alibaba · 14. Okt. 2025	10.6	15	127 tok/s	262K	$0.18/$2.10	Details
#76 Qwen3 8B (Reasoning) von Alibaba · 28. Apr. 2025	8.3	7	65 tok/s	262K	$0.18/$2.10	Details
#77 Ministral 3 14B von Mistral · 2. Dez. 2025	11.1	17	65 tok/s	k. A.	$0.20/$0.20	Details
#78 Nemotron Nano 12B v2 VL (Reasoning) von NVIDIA · 28. Okt. 2025	9.0	17	118 tok/s	k. A.	$0.20/$0.60	Details
#79 Nemotron Nano 12B v2 VL (Non-reasoning) von NVIDIA · 28. Okt. 2025	4.6	9	196 tok/s	k. A.	$0.20/$0.60	Details
#80 Step 3.7 Flash von StepFun · 29. Mai 2026	30.3	52	401 tok/s	256K	$0.20/$1.15	Details
#81 Reka Flash 3 von Reka AI · 10. März 2025	4.1	6	92 tok/s	k. A.	$0.20/$0.80	Details
#82 GPT-5.4 nano (medium) von OpenAI · 17. März 2026	30.2	50	174 tok/s	400K	$0.20/$1.25	Details
#83 GPT-5.4 nano (Non-Reasoning) von OpenAI · 17. März 2026	17.6	29	161 tok/s	400K	$0.20/$1.25	Details
#84 GPT-5.4 nano (xhigh) von OpenAI · 17. März 2026	38.2	63	163 tok/s	400K	$0.20/$1.25	Details
#85 Small (Sep '24) von Mistral · 17. Sept. 2024	4.7	10	145 tok/s	262K	$0.20/$0.60	Details
#86 Grok 4 Fast (Non-reasoning) von SpaceXAI · 19. Sept. 2025	16.5	21	k. A.	500K	$0.20/$0.50	Details
#87 Grok 4 Fast (Reasoning) von SpaceXAI · 19. Sept. 2025	27.4	35	k. A.	500K	$0.20/$0.50	Details
#88 Reka Flash (Sep '24) von Reka AI · 4. Okt. 2024	6.3	8	85 tok/s	k. A.	$0.20/$0.80	Details
#89 Jamba 1.5 Mini von AI21 Labs · 22. Aug. 2024	2.7	4	k. A.	k. A.	$0.20/$0.40	Details
#90 Jamba 1.6 Mini von AI21 Labs · 6. März 2025	2.6	6	182 tok/s	k. A.	$0.20/$0.40	Details
#91 Qwen3 30B A3B 2507 Instruct von Alibaba · 29. Juli 2025	9.1	17	156 tok/s	262K	$0.20/$0.80	Details
#92 Qwen3 VL 30B A3B (Reasoning) von Alibaba · 3. Okt. 2025	13.3	17	123 tok/s	262K	$0.20/$2.40	Details
#93 Qwen3 VL 30B A3B Instruct von Alibaba · 3. Okt. 2025	10.0	19	126 tok/s	262K	$0.20/$0.80	Details
#94 Qwen3 30B A3B 2507 (Reasoning) von Alibaba · 30. Juli 2025	14.4	19	156 tok/s	262K	$0.20/$2.40	Details
#95 Qwen3 30B A3B (Reasoning) von Alibaba · 28. Apr. 2025	9.3	11	113 tok/s	262K	$0.20/$2.40	Details
#96 Qwen3 30B A3B (Non-reasoning) von Alibaba · 28. Apr. 2025	6.8	11	107 tok/s	262K	$0.20/$0.80	Details
#97 Seed-OSS-36B-Instruct von ByteDance Seed · 20. Aug. 2025	18.3	23	34 tok/s	k. A.	$0.21/$0.57	Details
#98 Trinity Large Thinking von Arcee AI · 1. Apr. 2026	24.5	44	174 tok/s	262K	$0.23/$0.88	Details
#99 Qwen3.6 35B A3B (Reasoning) von Alibaba · 16. Apr. 2026	31.6	48	134 tok/s	262K	$0.25/$1.49	Details
#100 Gemini 3.1 Flash-Lite von Google · 3. März 2026	25.0	38	315 tok/s	1.0M	$0.25/$1.50	Details

Zeige 100 von 370 Modelle

Das KI-Modell-Leaderboard verstehen

Dieses umfassende KI-Modell-Leaderboard hilft Ihnen, zu vergleichen und auszuwählen die besten Large Language Models (LLMs) für Ihre Anforderungen. Wir erfassen standardisierte KI-Benchmarks, Token-Preise, Inference-Geschwindigkeit und Modellfähigkeiten bei allen großen KI-Anbietern wie OpenAI, Anthropic, Google, Meta, und DeepSeek.

Kern-KI-Benchmarks erklärt

MMLU-ProTestet breites Wissen über 14 akademische Fachbereiche

GPQADenken & Problemlösung auf Promotionsniveau

AIME 2025Mathematisches Denken auf Spitzenniveau

Coding IndexLiveCodeBench + SciCode kombiniert

Math IndexAIME + MATH-500 kombiniert

Wichtige Kennzahlen

Token-PreisgestaltungInput- vs. Output-Kosten pro 1 Mio. Tokens

Inference-GeschwindigkeitTokens/Sekunde für Antwortzeit

VeröffentlichungsdatumNeueste Techniken & Wissensstand

Benchmark-ScoresFähigkeitsvergleich von 0-100 %

So wählen Sie das richtige KI-Modell für Ihren Use Case

Für Forschung & Analyse

Priorisieren Sie Modelle mit hohen MMLU-Pro- (70 %+) und GPQA-Werten (60 %+), wenn es um komplexe Denkaufgaben, wissenschaftliche Recherche und technische Dokumentation geht

Für Kostenoptimierung

Sortieren Sie nach Input-/Output-Preisen - kleinere Modelle liefern bei einfachen Aufgaben oft 80 % der Flaggschiff-Leistung zu 10 % der Kosten

Für Mathe & MINT

Filtern Sie nach Math-Index oder AIME-2025-Scores (50 %+) für quantitative Analysen, Engineering-Berechnungen und wissenschaftliche Anwendungen

Alle Benchmark-Scores und Preisdaten werden täglich von Artificial Analysis aktualisiert, um die neuesten Modellversionen und Fähigkeiten abzubilden. Nutzen Sie die Sortierfilter oben, um KI-Modelle nach Intelligenz, Kosten, Coding-Fähigkeit, Mathe-Leistung, Geschwindigkeit oder Veröffentlichungsdatum zu finden.

Häufig gestellte Fragen

Was ist MMLU-Pro und warum gilt es als Standard-Benchmark für KI-Intelligenz?

MMLU-Pro (Massive Multitask Language Understanding - Professional) ist der umfassendste KI-Benchmark und testet Modelle in 14 akademischen Fachbereichen, darunter Mathematik, Naturwissenschaften, Geschichte, Recht und Ethik. Die Werte reichen von 46 % (Grundkompetenz) bis 87 % (nahe Expertenniveau). Modelle über 75 % zeigen starke allgemeine Intelligenz für professionelle Anwendungen, während Werte unter 60 % auf Einschränkungen bei komplexen Denkaufgaben hindeuten.

Was misst GPQA und welche Modelle erzielen die höchsten Werte?

GPQA (Graduate-level Google-Proof Q&A) prüft Denken auf Promotionsniveau mit Fragen, die bewusst "Google-proof" sind - sie erfordern tiefes Verständnis statt bloßer Faktenrecherche. Spitzenmodelle wie GPT-5.1 (87,3 %), GPT-5 mini (82,8 %) und o3 (82,7 %) sind bei GPQA besonders stark und eignen sich für Forschung, technische Analysen und komplexe Problemlösung. Modelle unter 50 % GPQA haben oft Schwierigkeiten bei anspruchsvollem Denken und liefern eher oberflächliche Antworten.

Was ist AIME 2025 und wie bewertet es die mathematischen Fähigkeiten von KI?

AIME 2025 (American Invitational Mathematics Examination) ist ein Benchmark auf Wettbewerbsniveau, der fortgeschrittene Problemlösung, Algebra, Geometrie und Zahlentheorie testet. Werte über 80 % (wie GPT-5 Codex mit 98,7 % oder GPT-5.1 mit 94 %) zeigen außergewöhnliches mathematisches Denken für Engineering, Scientific Computing und quantitative Analysen. Modelle unter 50 % können bei mehrstufigen mathematischen Aufgaben Probleme haben oder benötigen eine explizite Aufschlüsselung.

Wie wird die Preisgestaltung von KI-Modellen berechnet und was gilt als kosteneffizient?

Die Preise von KI-Modellen werden pro 1 Million Tokens berechnet (etwa 750.000 Wörter). Input-Preise betreffen den Text, den Sie senden, Output-Preise die generierten Antworten. Günstige Modelle wie Llama 3.3 70B kosten $0.54/$0.71 pro Million Tokens, Mid-Tier-Modelle wie GPT-5 nano $0.05/$0.40, Premium-Modelle wie GPT-5 $1.25/$10. Bei typischen Anwendungen mit einem Input-/Output-Verhältnis von 3:1 können Budget-Modelle 10- bis 20-mal günstiger sein und dennoch 70-80 % der Leistung liefern.

Welche KI-Modelle eignen sich am besten für Coding und Programmierung?

Sortieren Sie nach Coding Index um die besten Programmiermodelle zu sehen. Unser Coding Index kombiniert LiveCodeBench, SciCode und Coding-Benchmarks. Zu den Top-Performern gehören GPT-5.1 (57,5), GPT-5 mini (51,4) und GPT-5 Codex (53,5). Diese Modelle sind stark bei Codegenerierung, Debugging, Refactoring und der Erklärung komplexer Algorithmen. Für kostenbewusste Entwickler bieten Modelle mit 40+ Punkten im Coding Index ein sehr gutes Preis-Leistungs-Verhältnis für Routineaufgaben.

Wie oft werden KI-Modell-Benchmarks und Rankings aktualisiert?

Unser Leaderboard wird täglich mit der Artificial Analysis API synchronisiert, damit Benchmark-Scores (MMLU-Pro, GPQA, AIME 2025), Preise und Inference-Geschwindigkeit die neuesten Modellversionen widerspiegeln. Neue Modell-Releases erscheinen sofort unter der Sortierung "Neueste". Benchmark-Scores können sich ändern, wenn Anbieter aktualisierte Versionen veröffentlichen - zum Beispiel erreichte GPT-5.1 (veröffentlicht im November 2025) 69,7 Intelligenzpunkte gegenüber 68,5 bei GPT-5 aus August 2025.

Welche Inference-Geschwindigkeit (Tokens/Sekunde) brauche ich für meine Anwendung?

Die Inference-Geschwindigkeit bestimmt, wie schnell Modelle Antworten erzeugen. Für Echtzeit-Chatbots und interaktive Anwendungen sind 100+ Tokens/Sekunde sinnvoll (z. B. gpt-oss-120B mit 340 tok/s). Für Hintergrundverarbeitung und Batch-Jobs reichen 50-100 tok/s. Premium-Reasoning-Modelle wie GPT-5 (103 tok/s) balancieren Geschwindigkeit und Fähigkeiten. Wichtig: Höhere Geschwindigkeit bedeutet nicht automatisch bessere Qualität - langsamere Modelle liefern oft durchdachtere, detailliertere Antworten.

Kann ich diese KI-Modelle kostenlos testen, bevor ich mich entscheide?

Ja! Probieren Sie unsere kostenlose KI-Chatoberfläche aus, um verschiedene Modelle sofort ohne Account zu testen. Viele Anbieter haben ebenfalls kostenlose Stufen: OpenAI (ChatGPT mit Tageslimits), Anthropic (Claude mit Nutzungslimits), Google (Gemini Free Tier) und Open-Source-Modelle wie Llama 3.3. Vergleichen Sie die Leistung für Ihren konkreten Use Case, bevor Sie auf bezahlte Pläne wechseln.