.init

Der Befehl DecisionTree.init(X) erwartet folgende (verpflichtende) Argumente:

ArgumentDatentypHinweis
XDatenfeldTrainingsdaten (Liste von Objekten)

Es wird ein Entscheidungsbaum unter Verwendung der Trainingsdaten X erstellt. Dabei ist X eine Liste von Objekten mit jeweils folgenden Variablen:

VariableDatentypHinweis
inputDatenfeldObjekt des Datensatzes als Vektor
indexZahlganzzahlig, nicht negativ (Klassifikationsergebnis)

Zudem können folgende Optionen verwendet werden:

VariableDatentypHinweisDefault-Wert
feature_selectionZeichenketterandom oder periodicrandom
threshold_ruleZeichenkettemedian, average, range oder ginimedian
max_depthZahlganzzahlig, zwischen 1 und 256256

Die Option feature_selection entscheidet darüber, ob an jedem Knoten des Baumes ein zufälliges Merkmal oder ob (periodisch) ein Merkmal gemäß der Tiefe des Knotens gewählt wird. threshold_rule legt fest, nach welchem Maß der Schwellenwert zur Entscheidung der Knoten bestimmt werden soll: Median, Mittelwert, Mittelpunkt der Spannweite der Daten oder unter Berücksichtigung des Gini-Koeffizienten. Schließlich kann die Option max_depth verwendet werden, um die maximale Tiefe des Entscheidungsbaumes zu definieren.

Falls als Option feature_selection=random verwendet oder falls die maximale Tiefe des Baumes erreicht wird, dann ist der Entscheidungsbaum im Allgemeinen nicht deterministisch. Dies bedeutet, dass bei gleichen Eingabedaten (Trainingsdaten) durchaus unterschiedliche Ergebnisse erzielt werden.

Beispiel
Bevor ein Entscheidungsbaum bestimmt wird, werden Trainingsdaten im dafür benötigten Format definiert. Anschließend wird die Klassifikation eines Objekts durchgeführt.
Beispiel
Es wird ein Entscheidungsbaum bestimmt, um die IrisFlower-Datensätze zur klassifizieren.
.evaluate