Konfusionsmatrix

Die visuelle Darstellung der Ergebnisse einer Testphase zuvor waren nur möglich, da wir ein sehr einfaches Klassifikationsproblem untersucht haben, dessen Objekte nichts anderes sind als bunte Punkte.

Im Allgemeinen ist eine derartige Darstellung nicht möglich, sondern man untersucht die sogenannte Wahrheitsmatrix oder Konfusionsmatrix. Dabei handelt es sich um eine Tabelle, welche das Ergebnis der Testphase beschreibt:

Gemäß der Anzahl der Klassen bzw. Kategorien besitzt die Tabelle vier Spalten und vier Zeilen. Gezählt wird jeweils, wie viele Testobjekte (mit bekannter Zugehörigkeit) als was (d.h. welche Farbe) klassifiziert wurden. Beispielsweise wurden 20 Testobjekte, welche bekanntermaßen der Klasse rot angehören, auch tatsächlich als rot klassifiziert. Hingegen wurden 3 Testobjekte mit der bekannten Klasse grün fälschlicherweise als blau klassifiziert.

Zudem kann der Tabelle als Summe der Einträge auf der Diagonalen entnommen werden, dass insgesamt 91 der 100 Testobjekte korrekt klassifiziert wurden.

Beispiel
Nächste-Nachbarn-Klassifikation mit Ausgabe der Konfusionsmatrix.
Quiz

Gegeben sei ein Klassifikationsproblem, welches Objekte in die drei Kategorien rot, grün und blau klassifiziert. Das Ergebnis einer Nächste-Nachbarn-Klassifikation wird anhand folgender Konfusionsmatrix zusammengefasst:

Wie viele Testobjekte der (bekannten) Klasse rot wurden fälschlicherweise als grün klassifiziert?
0
5
10
15
40
Es gibt Testobjekte, die fälschlicherweise als rot klassifiziert wurden.
Aussage stimmt
Aussage stimmt nicht
Wie viel Objekte wurden insgesamt getestet?
50
100
150
200
Wie viel Prozent der Testobjekte wurden insgesamt korrekt klassifiziert?
0%
25%
50%
75%
100%
Abstandsmaß