MiMo-V2-Omni
vonXiaomi
MiMo-V2-Omni is a frontier omni-modal model that natively processes image, video, and audio inputs within a unified architecture. It combines strong multimodal perception with agentic capability - visual grounding, multi-step planning, tool use, and code execution - making it well-suited for complex real-world tasks that span modalities, 256K context window.
Spezifikationen
Technische Details und Preise.
Benchmarks
7 Benchmark-Scores von Artificial Analysis.
Composite Indices
Intelligence, Coding, Math
Standard Benchmarks
Academic and industry benchmarks
Häufig gestellte Fragen
Wofür eignet sich MiMo-V2-Omni?
Nutzen Sie MiMo-V2-Omni für alltägliche Aufgaben wie Schreiben, Zusammenfassen, Brainstorming und klare Erklärungen.
Wie viel kostet MiMo-V2-Omni?
Die Abrechnung erfolgt nutzungsbasiert. Aktuell kostet die Eingabe $0.00/1M tokens und die Ausgabe $0.00/1M tokens.
Kann ich MiMo-V2-Omni kostenlos testen?
Ja. Sie können sofort einen Chat starten und das Modell testen, bevor Sie sich für einen Plan entscheiden.
Unterstützt MiMo-V2-Omni Bilder oder Audio?
MiMo-V2-Omni kann Bilder verstehen.
Ähnliche Modelle
Weitere Modelle, die Sie sich ansehen könnten.
Benchmarks und Preise stammen, sofern verfügbar, von Artificial Analysis. OpenRouter-Spezifikationen dienen als Fallback.