taralino

.init

Der Befehl DecisionTree.init(X) erwartet folgende (verpflichtende) Argumente:

Argument	Datentyp	Hinweis
X	Datenfeld	Trainingsdaten (Liste von Objekten)

Es wird ein Entscheidungsbaum unter Verwendung der Trainingsdaten X erstellt. Dabei ist X eine Liste von Objekten mit jeweils folgenden Variablen:

Variable	Datentyp	Hinweis
input	Datenfeld	Objekt des Datensatzes als Vektor
index	Zahl	ganzzahlig, nicht negativ (Klassifikationsergebnis)

Zudem können folgende Optionen verwendet werden:

Variable	Datentyp	Hinweis	Default-Wert
feature_selection	Zeichenkette	random oder periodic	random
threshold_rule	Zeichenkette	median, average, range oder gini	median
max_depth	Zahl	ganzzahlig, zwischen 1 und 256	256

Die Option feature_selection entscheidet darüber, ob an jedem Knoten des Baumes ein zufälliges Merkmal oder ob (periodisch) ein Merkmal gemäß der Tiefe des Knotens gewählt wird. threshold_rule legt fest, nach welchem Maß der Schwellenwert zur Entscheidung der Knoten bestimmt werden soll: Median, Mittelwert, Mittelpunkt der Spannweite der Daten oder unter Berücksichtigung des Gini-Koeffizienten. Schließlich kann die Option max_depth verwendet werden, um die maximale Tiefe des Entscheidungsbaumes zu definieren.

Falls als Option feature_selection=random verwendet oder falls die maximale Tiefe des Baumes erreicht wird, dann ist der Entscheidungsbaum im Allgemeinen nicht deterministisch. Dies bedeutet, dass bei gleichen Eingabedaten (Trainingsdaten) durchaus unterschiedliche Ergebnisse erzielt werden.

Beispiel

Bevor ein Entscheidungsbaum bestimmt wird, werden Trainingsdaten im dafür benötigten Format definiert. Anschließend wird die Klassifikation eines Objekts durchgeführt.

<!DOCTYPE html>
<html>
<head>
  <meta charset="utf-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <script src="taralino.js"></script>
</head>
<body>
<script>

// Trainingsdaten mit bekanntem Klassifikationsergebnis
var X = [
  {input:[0.3, 0.2, 0.5], index:0},
  {input:[0.8, 0.4, 1.0], index:0},
  {input:[0.5, 1.0, 0.2], index:1},
  {input:[0.2, 0.3, 0.0], index:1}
];

// Zu testendes Objekt
var x = [0.3, 0.3, 0.3];

// Entscheidungsbaum erstellen
DecisionTree.init(X, {feature_selection:"periodic", threshold_rule:"average"});

// Testobjekt auswerten
var t = DecisionTree.evaluate(x);

// Ergebnis der Klassifikation
Console.print(t);

</script>
</body>
</html>

Vorschau Download Kopie speichern

Beispiel

Es wird ein Entscheidungsbaum bestimmt, um die IrisFlower-Datensätze zur klassifizieren.

<!DOCTYPE html>
<html>
<head>
  <meta charset="utf-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <script src="taralino.js"></script>
  <script src="IrisFlower.js"></script>
</head>
<body>
<script>

var X = IrisFlower.train();
var Y = IrisFlower.test();

DecisionTree.init(X);
DecisionTree.confusion_matrix(Y, {display:"on"});

</script>
</body>
</html>

Vorschau Download Kopie speichern