KI-Begriff 1 Min. Lesezeit

Similarity

Similarity-Metriken bestimmen, wie ähnlich zwei Vektoren oder Dokumente sind und steuern somit Such- und Empfehlungssysteme.


Similarity ist das Gegenstück zur Distanz. Typische Maße sind Kosinus-Ähnlichkeit, Dot Product oder Jaccard-Index. Je höher der Wert, desto ähnlicher sind zwei Datenpunkte. Vektorbasierte Suche, Empfehlungsmaschinen und RAG-Workflows nutzen Similarity, um relevante Ergebnisse zu reihen.

Best Practices

  • Normalisierung: Einheitliche Längen verhindern verzerrte Werte.
  • Schwellwerte: Definierte Cut-offs trennen relevante von irrelevanten Treffern.
  • Monitoring: Similarity-Distributionen zeigen an, ob Embeddings driften oder unbrauchbar werden.
← Zurück zum Glossar
EU Made in Europe

Chat with 100+ AI Models in one App.

Use Claude, ChatGPT, Gemini alongside with EU-Hosted Models like Deepseek, GLM-5, Kimi K2.5 and many more.

Kundensupport