Was es ist: Eine Kompressionstechnik, die die Vektorspeichergröße reduziert, indem Vektoren in kleinere Teile aufgeteilt und “Codebücher” verwendet werden.
Wie es funktioniert:
- Teilt jeden Vektor in kleinere Sub-Vektoren auf
- Erstellt ein “Codebuch” mit gemeinsamen Mustern für jeden Teil
- Speichert Referenzen zu Codebuch-Einträgen anstelle der tatsächlichen Werte
Warum es wichtig ist: Spart massive Mengen an Speicher und Storage bei gleichzeitig angemessener Suchqualität. Essentiell für großskalige Deployments.
Real-World-Analogie: Wie Abkürzungen beim Texten zu verwenden - “LOL” anstelle von “laugh out loud”. Sie verlieren etwas Nuance, sparen aber Platz und können immer noch effektiv kommunizieren.