Aufteilung in Klassen

Beim IrisFlower-Datensatz ist es sinnvoll, sich die einzelnen Merkmale in Abhängigkeit der Art der Gattung anzuschauen. Dadurch können die Verteilungen der einzelnen Merkmale in Abhängigkeit der Arten verglichen werden.

Zu diesem Zwecke können der Funktion Eda.pick (optional) Parameter zur Filterung übergeben werden:

{ filter : [4, "==", 0] }

Mit dem Beispiel zuvor werden bei der Auswahl mittels Eda.pick nur Zeilen des Datensatzes berücksichtig, für die das fünfte Merkmal (Spalte zum Index 4) gleich 0 ist. In unserem Falle wären das alle Blüten der Borsten-Schwertlilie (Iris setosa).

Zur Referenz

Beispiel
Aufteilung der Kelchblattlänge bezüglich der Art der Schwertlilie.
Beispiel
Aufteilung der Kelchblattlänge bezüglich der Art der Schwertlilie.

Im Beispiel zuvor haben wir bereits direkt eine Legende ergänzt, um den Farben ihre Art der Gattung zuzuweisen. Die Dokumentation zum Eda.key Befehl findest du hier:

Zur Referenz

Außerdem ist es sicherlich zunächst sinnvoll zu prüfen, wie viele Blüten pro Art im Datensatz vorhanden sind. Dazu dient die Funktion Eda.count, der ebenfalls Parameter zur Filterung übergeben werden können:

Zur Referenz

Beispiel
Anzahl der Blüten pro Art.
Quiz
Von welcher Art der Gattung sind am meisten Blüten im Datensatz vorhanden?
Iris setosa
Iris versicolor
Iris virginica
alle Arten gleich häufig