.get

Die Funktion NearestNeighbor.get(X, y, k) erwartet folgende (verpflichtende) Argumente:

ArgumentDatentypHinweis
XDatenfeldVergleichsdaten als Matrix
yDatenfeldzu vergleichendes Objekt als Vektor
kZahlganzzahlig, positiv

Die Funktion führt eine Nächste-Nachbarn-Bestimmung anhand der Vergleichsdaten X sowie des zu vergleichenden Objekts y durch. Zurückgegeben werden die k nächsten Nachbarn anhand der Indizes der zugehörigen Vergleichsdaten aus X (aufsteigend sortiert nach Abstand).

Um genauer zu sein: Die Vergleichsdaten X sind als Matrix (zweidimensionales Datenfeld) zu definieren, wobei jede Zeile der Matrix als ein Objekt angesehen wird. Dies bedeutet auch, dass die Länge des Vektors bzw. des Objekts y der Anzahl der Spalten von X entsprechen muss. Zurückgegeben werden die Indizes der Zeilen (bzw. Objekte) der Matrix, die (bezogen auf das gewählte Abstandsmaß) dem zu vergleichenden Objekt y am nächsten sind.

Es kann folgende Option verwendet werden:

VariableDatentypHinweisDefault-Wert
metricZeichenkettemanhattan, euclidean, maximum, cosine, binaryeuclidean

Die Option metric definiert das Abstandsmaß, das zum Einsatz kommt. Hinweis: Die Auswahl binary ist nur dann sinnvoll, wenn alle Einträge von X binär sind (also ausschließlich 0 oder 1).

Hinweis

Es ist auch möglich, dass X als eine Liste von Objekten mit jeweils folgenden Variablen definiert wird:

VariableDatentypHinweis
inputDatenfeldObjekt als Vektor
indexZahlganzzahlig, nicht negativ

Dies bedeutet, dass für X auch die Trainingsdaten eines Klassifikationsproblems eingesetzt werden können.

Beispiel
Zur Durchführung einer Nächste-Nachbarn-Bestimmung werden Vergleichsdaten bestehend aus fünf Objekten definiert. Anschließend wird ein Objekt damit verglichen, wobei die nächsten Nachbarn zurückgegeben werden.
Beispiel
Wenn es sich um binäre Daten handelt, kann als Abstandsmaß binary sinnvoll sein.
Zur Übersicht