Kosinus-Ähnlichkeit

Um eine Nächste-Nachbarn-Bestimmung wie zuvor beschrieben durchführen zu können, müssen insbesondere die Abstände zwischen zwei Punkten (im n-dimensionalen Raum) berechnet werden.

Es ist sehr naheliegend, an dieser Stelle die übliche Euklidische Metrik zu verwenden: Der Abstand zwischen zwei Punkten und lässt sich bestimmen, indem

berechnet wird.

Obwohl die Euklidische Metrik durchaus verwendet werden kann, ist es bei Empfehlungssystemen in der Praxis häufig sinnvoller, ein Abstandsmaß zu verwenden, dass auf der Kosinus-Ähnlichkeit beruht. Der Grund besteht unter anderem darin, dass in der Regel viele Einträge der Punkte bzw. Vektoren gleich Null sind. In diesen Fällen lässt sich die Kosinus-Ähnlichkeit effizient bestimmen.

Die Kosinus-Ähnlichkeit zweier Punkte und ist

und nimmt damit stets einen Wert zwischen -1 und 1 an. Nun lässt sich der Kosinus-Abstand folgendermaßen definieren:

Es sei bemerkt, dass es sich dabei um keine Metrik im mathematischen Sinne handelt, da gleich mehrere dafür notwendige Axiome nicht erfüllt sind (insbesondere die Dreiecksungleichung). Dennoch erhalten wir ein Abstandsmaß, das im Bereich des maschinellen Lernens sinnvoll ist und häufig zum Einsatz kommt.

Quiz
Bestimme den Kosinus-Abstand für x=(0,1,0) und y=(1,0,1).
-1.0
0.0
0.5
1.0
Bestimme den Kosinus-Abstand für den Fall, dass x=y gilt.
-1.0
0.0
0.5
1.0
Bestimme den Kosinus-Abstand für den Fall, dass x=-y gilt.
-1.0
0.0
0.5
1.0
Inhaltsbasierte Systeme