KI-Begriff 1 Min. Lesezeit

Pruning

Beim Pruning werden unwichtige Gewichte oder Neuronen entfernt, um Modelle schlanker und schneller zu machen.


Pruning analysiert, welche Parameter kaum zum Ergebnis beitragen, und setzt sie auf null oder entfernt sie vollständig. Das reduziert Speicherbedarf und beschleunigt Inferenz, ohne die Genauigkeit stark zu beeinträchtigen. Varianten reichen von Magnitude-Pruning über strukturierte Filter-Entfernung bis zu dynamischen Methoden.

Vorteile

  • Kostensenkung: Kleinere Modelle benötigen weniger VRAM und Rechenzeit.
  • Edge-Deployment: Pruned Networks passen auf mobile Hardware.
  • Kombination: Häufig zusammen mit Quantisierung und Distillation eingesetzt.
← Zurück zum Glossar