Testphase mit Histogramm

Im Beispiel zuvor wurden nur einzelne Objekte der Testdaten ausgewertet. Eine geeignete Veranschaulichung der Ergebnisse sämtlicher Testobjekte bietet ein Histogramm. Dazu werden alle Objekte der Testdaten an der zuvor bestimmten Modellfunktion ausgewertet. Im Histogramm aufgetragen werden die Abweichungen zwischen bekanntem Ergebnis (Zielvariable) und Vorhersage aufgrund der Modellfunktion:

Die Abbildung zeigt das Ergebnis aus dem Beispiel zur Weinqualität. Der Darstellung ist zu entnehmen, dass 625 der insgesamt 1225 Objekte der Testdaten (und damit rund 51 Prozent) mit einer Abweichung von nicht mehr als einem halben Punkt auf der Qualitätsskala vorhergesagt werden konnten. Allerdings gibt es bei 23 Testobjekten eine Abweichung von zwei oder mehr Qualitätspunkten. Ob es sich dabei nun um zufriedenstellende Ergebnisse handelt oder nicht, kann nicht pauschal beantwortet werden. Das ist jeweils problemabhängig zu bewerten:

Das Histogramm gibt keine Aussage darüber, ob die lineare Regression ein ausreichend gutes Vorhersagemodell liefert. Dies hängt schlicht von der Aufgabenstellung sowie der geforderten Vorhersagegenauigkeit ab und muss jeweils problemspezifisch bewertet werden.

In aller Regel ergibt sich jedoch eine Glockenkurve (Normalverteilung) mit einem Maximum um 0 auf der x-Achse. Die Vorhersagegenauigkeit hängt nun davon ab, wie stark das Maximum ausgeprägt bzw. wie groß die Standardabweichung (bzw. Varianz) der Verteilung ist.

Beispiel
Regressionsaufgabe zur Bestimmung der Weinqualität: Testphase mit Histogramm. Hinweis: Die Skalierung der Balken ist im Vergleich zur Abbildung oben leicht unterschiedlich gewählt.
Aufgabe

Mache dich mit dem Quellcode zuvor vertraut und schaue dir dazu auch die Dokumentation der Histogramm-Funktion an:

Zur Referenz

Nimm folgende Veränderung vor: Bevor die Testdaten ausgewertet (und das Histogramm dargestellt wird), soll die Zielvariable jedes Testobjekts mit einem zufälligen Zahlenwert zwischen 2 und 10 überschrieben werden. Stimmt das nun dargestellte Histogramm mit deinen Erwartungen überein?

Quiz
Fehlermetriken