Beispiel Weinqualität

Als Anwendungsbeispiel verwenden wir einen Datensatz, der Eigenschaften von Weinen bereitstellt:

Zur Referenz

Pro Wein stehen elf Merkmale zur Verfügung, anhand derer die (gemessene) Qualität des Weines (als Wert zwischen 0 und 10) zu bestimmen ist:

Merkmal 1Säuregehalt (gesamt)
Merkmal 2Essigsäuregehalt
Merkmal 3Citronensäuregehalt
Merkmal 4Restsüße
Merkmal 5Chloridgehalt
Merkmal 6Schwefeldioxidgehalt (frei)
Merkmal 7Schwefeldioxidgehalt (gesamt)
Merkmal 8Dichte
Merkmal 9pH-Wert
Merkmal 10Sulfatgehalt
Merkmal 11Alkoholgehalt
ZielvariableQualität (gemessen) als Wert zwischen 0 und 10

Der gesamte zur Verfügung stehende Datensatz wird in zwei Umfänge aufgeteilt:

  1. Trainingsdaten: Dieser Teil des gesamten Datensatzes wird verwendet, um eine lineare Regression durchzuführen (d.h. eine Modellfunktion zu bestimmen).
  2. Testdaten: Anschließend kann dieser Teil genutzt werden, um das Ergebnis der linearen Regression unter Verwendung der zuvor bestimmten Modellfunktion zu evaluieren.

Wie dies genau aussehen kann, demonstrieren wir am folgenden Beispiel. Dort werden die Trainingsdaten verwendet, um eine lineare Regression durchzuführen bzw. die Modellfunktion zu bestimmen. Anschließend wird ein zufälliges Objekt der Testdaten gewählt, um dieses an der Modellfunktion auszuwerten.

Beispiel
Regressionsaufgabe zur Bestimmung der Weinqualität.
Aufgabe

Mache dich mit dem Quellcode zuvor vertraut. Schaue dir neben der Dokumentation des WineQuality-Datensatzes auch die Referenz des LinearRegression-Paketes an:

Zur Referenz

Führe den Quellcode mehrfach aus und diskutiere, ob die Weinqualität mittels linearer Regression gut vorhergesagt werden kann.

Quiz
Testphase mit Histogramm