.elbow

Der Befehl ClusterAnalysis.elbow(X, k) erwartet folgende (verpflichtende) Argumente:

ArgumentDatentypHinweis
XDatenfeldMatrix (Liste von Objekten)
kZahlganzzahlig, mindestens 2

Es wird die Ellenbogenmethode unter Verwendung des k-Means-Algorithmus auf den Datensatz X angewandt, wobei maximal k Cluster berücksichtigt werden. Das Ergebnis wird grafisch dargestellt.

Zudem können folgende Optionen verwendet werden:

VariableDatentypHinweisDefault-Wert
maximal_iterationsZahlganzzahlig, positiv100
runsZahlganzzahlig, positiv10
weightsDatenfeldVektor zur Gewichtung[1, 1, ..., 1]
metricZeichenkettemanhattan, euclidean, maximum oder cosineeuclidean

Optional kann die maximale Anzahl an Iteration durch maximal_iterations sowie die Anzahl der Durchläufe (mit jeweils zufälligen Startwerten) durch runs variiert werden.

Zudem können die Gewichte der einzelnen Merkmale der Objekte mittels weights angepasst werden. Die Option metric definiert schließlich die Metrik bzw. das Abstandsmaß, das zum Einsatz kommt.

Die Abkürzung WCSS bei der Bezeichnung der y-Achse steht für "within-cluster sum of squares" und bedeutet damit soviel wie die Summe der quadrierten Abweichungen von den Cluster-Schwerpunkten.

Beispiel
Es werden Daten mit dem ClusteringData-Paket erstellt, welche anschließend unter Verwendung der Ellenbogenmethode analysiert werden.
.dbscan