Beispiel Schwertlilien

Nachdem wir gelernt haben, was Entscheidungsbäume sind und wie diese mittels Trainingsdaten erstellt werden können, sammeln wir praktische Erfahrungen mit der Klassifikation von Schwertlilien:

Das IrisFlower-Paket beinhaltet Datensätze, um Blumen der Gattung Schwertlilie (Iris) anhand der Größe der Blütenblätter hinsichtlich dreier Arten der Gattung zu klassifizieren.

Zur Referenz

Um genauer zu sein: Die Blüte der Schwertlilie wird anhand der Kron- und Klechblätter beschrieben:

Als Klassifikationsergebnis wird jeder Blüte eine der folgenden Arten zugewiesen:

indexBeschreibung
0Borsten Schwertlilie (Iris setosa)
1Verschiedenfarbige Schwertlilie (Iris versicolor)
2Virginische Schwertlilie (Iris virginica)

Die Daten des Pakets sind in einen Trainings- und einen Test-Umfang aufgeteilt:

Trainings-Umfang100 Objekte
Test-Umfang50 Objekte

Im folgenden Beispiel werden diese Daten verwendet, um einen Entscheidungsbaum anhand der Trainingsdaten zu erstellen sowie anhand der Testdaten zu evaluieren. Hierzu kommt das DecisionTree-Paket zum Einsatz:

Zur Referenz

Die Wahl des Merkmals findet gemäß der periodischen Vorgehensweise statt und die Schwellwerte werden auf Grundlage der Mittelwert-Regel bestimmt.

Beispiel
Eintscheidungsbaum zur Klassifikation von Schwertlilien.
Aufgabe

Mache dich mit dem Quellcode zuvor vertraut und schaue dir die Referenz des DecisionTree-Pakets an:

Zur Referenz

Experimentiere anschließend mit den beiden Parametern feature_selection und threshold_rule bei der Erstellung des Entscheidungsbaumes bzw. der Entscheidungsregeln. Welche Wahl liefert bezogen auf die Testdaten das beste Ergebnis?

Quiz
Umfang der Trainingsdaten