Der IrisFlower-Datensatz

Wie das Vorgehen einer explorativen Datenanalyse aussehen kann, erläutern wir in diesem Kurs anhand des IrisFlower-Datensatzes.

Der IrisFlower-Datensatz beinhaltet Daten, um Blumen der Gattung Schwertlilie (Iris) anhand der Größe der Blütenblätter hinsichtlich dreier Arten der Gattung zu klassifizieren. Dabei ist der Datensatz eigentlich nichts anderes als eine Tabelle bestehend aus fünf Spalten (Merkmalen) und 150 Zeilen (Objekten):

KelchblattlängeKelchblattbreiteKronblattlängeKronblattbreiteArt der Gattung
1ZahlenwertZahlenwertZahlenwertZahlenwert0, 1 oder 2
2ZahlenwertZahlenwertZahlenwertZahlenwert0, 1 oder 2
...............
150ZahlenwertZahlenwertZahlenwertZahlenwert0, 1 oder 2

Die Angaben zur Länge bzw. Breite sind jeweils positive Zahl in cm und die Art der Gattung (fünfte Spalte) wird folgendermaßen definiert:

0=Borsten Schwertlilie (Iris setosa)
1=Verschiedenfarbige Schwertlilie (Iris versicolor)
2=Virginische Schwertlilie (Iris virginica)

Der IrisFlower-Datensatz wird über das IrisFlower-Datenpaket bereitgestellt. Die vollständige Dokumentation findest du hier:

Zur Referenz

In den folgenden Abschnitten besteht unser Ziel darin, den Datensatz anhand einer explorativen Datenanalyse kennenzulernen.

Beispiel
Es wird der IrisFlower-Datensatz ausgelesen und ausgegeben.
Quiz
Wie viele Merkmale besitzt der IrisFlower-Datensatz?
4
5
50
100
150
750
Wie viele Objekte bzw. Blüten werden im IrisFlower-Datensatz beschrieben?
4
5
50
100
150
750
Statistische Kennzahlen