Was es ist: Teilt Vektorraum in Cluster auf (wie Aktenschränke), sodass Sie nur relevante Bereiche durchsuchen anstatt alles.
Wie es funktioniert:
- Gruppiert ähnliche Vektoren während der Indizierung in Cluster
- Bei der Suche identifiziert es, welche Cluster ähnliche Vektoren enthalten könnten
- Sucht nur innerhalb dieser relevanten Cluster, nicht im gesamten Datensatz
Warum es wichtig ist: Reduziert die Suchzeit dramatisch durch Eliminierung irrelevanter Bereiche. Kompromiss zwischen Geschwindigkeit und Genauigkeit.
Real-World-Analogie: Wie eine Bibliothek nach Themen zu organisieren - beim Suchen eines Kochbuchs durchsuchen Sie nur die Kochabteilung, nicht die ganze Bibliothek.