KI-Begriff 1 Min. Lesezeit

Distanz

Distanzmetriken quantifizieren, wie ähnlich oder unterschiedlich zwei Datenpunkte im Vektorraum sind.


Die Distanz zwischen zwei Punkten entscheidet, welche Nachbarn in einer Vektordatenbank gefunden werden. Je nach Datencharakteristik kommen euklidische Distanz, Kosinus-Distanz oder Manhattan-Distanz zum Einsatz. Sie beeinflussen Ranking, Clustering oder Anomalieerkennung.

Praxis

  • Retrieval: Relevante Dokumente werden über den kleinsten Distanzwert ermittelt.
  • Normalisierung: Einheitliche Skalen vermeiden Verzerrungen in der Distanzberechnung.
  • Eval: Heatmaps und Distanzstatistiken helfen, schlechte Embeddings aufzuspüren.
← Zurück zum Glossar