Der Datensatz

Die Struktur eines Datensatzes zur Klassifikation von Punkten bezüglich Farben ist folgende:

x-Koordinatey-KoordinateFarbe
0.510.58grün
0.710.90rot
0.170.04blau
0.510.67grün
0.330.06grün
.........
0.520.99grün
0.600.94rot
0.490.89grün

Ein neuronales Netz zur Klassifikation in rot, grün und blau könnte so aufgebaut sein:

Der Datensatz zuvor übertragen in Eingangssignal und Ausgangssignal zum Trainieren und Testen des neuronalen Netzes entspricht der folgenden Tabelle:

Eingangssignalgewünschtes AusgangssignalAusgangssignal entspricht
[ 0.51, 0.58 ][ 0, 1, 0 ]grün
[ 0.71, 0.90 ][ 1, 0, 0 ]rot
[ 0.17, 0.04 ][ 0, 0, 1 ]blau
[ 0.51, 0.67 ][ 0, 1, 0 ]grün
[ 0.33, 0.06 ][ 0, 1, 0 ]grün
.........
[ 0.52, 0.99 ][ 0, 1, 0 ]grün
[ 0.60, 0.94 ][ 1, 0, 0 ]rot
[ 0.49, 0.89 ][ 0, 1, 0 ]grün

Eine Möglichkeit, um mit der taralino-Bibliothek einen derartigen Datensatz zu erzeugen, bietet das ClassificationData-Paket. Die genaue Datenstruktur muss nicht zwingend vollständig verstanden werden, kann aber bei Interesse in der Referenz nachgeschlagen werden:

Zur Referenz

Wie nun damit ein Datensatz erzeugt und dargestellt werden kann, zeigt der folgende Quellcode.

Implementierung
Es wird ein Datensatz bestehend aus 2000 Objekten erzeugt: Jedes Objekt beinhaltet die Koordinaten eines Punktes (.input) sowie die zugehörige Farbe als Zeichenkette (.color).
Quiz
Trainingsphase