FLOPS (Floating Point Operations per Second) messen, wie viele Gleitkommaberechnungen ein System pro Sekunde durchführen kann.
FLOPS dienen als Standardkennzahl, um Rechenleistung zu vergleichen. KI-Modelle mit Milliarden Parametern benötigen Billionen von FLOPS pro Trainingsiteration. Hardware-Hersteller geben Peak-FLOPS an, während reale Workloads oft darunter liegen, abhängig von Speicherbandbreite, Präzision oder Auslastung.
Tipps
- Mixed Precision: Niedrigere Datenformate erhöhen effektive FLOPS bei gleicher Hardware.
- Profiling: Tools wie Nsight oder perf zeigen tatsächliche FLOPS-Auslastung.
- Marketing vs. Realität: Für SEO-optimierte Hardwarevergleiche sollten Peak- und Sustained-Werte erwähnt werden.