taralino

Trainingsphase

Zur Wiederholung: Ist ein Datensatz zum Trainieren und Testen eines neuronalen Netzes zur Lösung einer Klassifikationsaufgabe bekannt, so werden die Objekte (Zeilen) des Datensatzes zufällig aufgeteilt in Trainingsdaten und Testdaten. Die Trainingsdaten werden dann verwendet, um das neuronale Netz zu trainieren. Dies bedeutet, dass die Gewichte und Schwellwerte des neuronalen Netzes derart bestimmt werden, sodass die Ausgangssignale der am neuronalen Netz ausgewerteten Eingangssignale möglichst dem jeweils gewünschten Ausgangssignal entsprechen.

Die Trainingsphase ist ein iterativer Prozess: Es werden zahlreiche Rechen- bzw. Iterationsschritte wiederholt durchgeführt, in denen die Gewichte und Schwellwerte jeweils leicht angepasst werden. Erst wenn eine ausreichend große Anzahl an Iterationsschritten durchgeführt wurde und die Gewichte und Schwellwerte bezogen auf die Trainingsdaten möglichst gut eingestellt sind, sollte die Trainingsphase beendet werden.

Aufgrund der Komplexität können wir an dieser Stelle nicht genauer darauf eingehen, welche mathematischen Berechnungen in jedem Iterationsschritt durchgeführt werden. Für Fortgeschrittene in einem Satz: Es handelt sich im Wesentlichen um ein nichtlineares Optimierungsproblem, welches mit einem Gradientenabstiegsverfahren iterativ gelöst wird.

Nicht nur nach der Trainingsphase, sondern nach jedem beliebigen Iterationsschritt können die Testdaten verwendet werden, um das neuronale Netz zu testen. Dabei wird gezählt, wie viele Testobjekte korrekt klassifiziert werden (wobei wie gehabt als Ergebnis des neuronalen Netzes jeweils die Farbe bzw. das Neuron gewählt wird, das den größten Wert hat).

Wichtig ist schließlich noch folgende Bemerkung:

In jedem Iterationsschritt spielen zufällige Entscheidungen eine Rolle. Das ist einer von mehreren Gründen dafür, dass sich die Vorhersagegenauigkeit eines neuronalen Netzes zwischenzeitlich durchaus verschlechtern kann, wobei sie sich auf lange Sicht gesehen im Durchschnitt jedoch verbessern sollte.

Alles das, war zuvor beschrieben wurde, demonstriert die folgende Anwendung. Dazu wurde wie im vorherigen Abschnitt beschrieben ein Datensatz bestehend aus 2000 Punkten erzeugt, der zufällig in Trainings- und Testdaten aufgeteilt wird (jeweils 1000 Punkte). Es lässt sich beobachten, wie sich die Gewichte und Schwellwerte verändern und wie groß der Anteil der korrekt klassifizierten Testdaten ist. Ein abschließender Hinweis dazu:

Beim Initialisieren (d.h. vor dem ersten Iterationsschritt der Trainingsphase) werden sämtliche Gewichte und Schwellwerte des neuronalen Netzes auf einen zufälligen Zahlenwert zwischen -1 und 1 gesetzt.

Anwendung

Es wird ein neuronales Netz zur Klassifikation von Punkten wie zuvor beschrieben trainiert und getestet.

<!DOCTYPE html>
<html>
<head>
  <meta charset="utf-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <script src="taralino.js"></script>
</head>
<body>
<script>

var X = ClassificationData.get(1000, {categories:3, shape:"mixed"});
var Y = ClassificationData.get(1000, {categories:3, shape:"mixed"});
var i = 0;
NeuralNetwork.init([2,4,3]);

function color_gradient(q) {
  var c = [26,124,208];
  var d = [66,188,66];
  return [q*c[0]+(1-q)*d[0], q*c[1]+(1-q)*d[1], q*c[2]+(1-q)*d[2]];
};

function draw_neuron(x, y, a, b) {
  Canvas.circle(x, y, 0.6, {fill:color_gradient(a)});
  Canvas.circle(x, y, 0.35, {fill:"#ffffffcc"});
  if (typeof(b) == "number") {
    Canvas.circle(x-0.4, y-0.5, 0.4, {fill:"#4d576a"});
    Canvas.text(x-0.4, y-0.5, b.toFixed(2), {fill:"white"});
  };
};

function draw_arrow(x1, y1, x2, y2, t, c) {
  Canvas.arrow(x1, y1, x2, y2);
  Canvas.circle(t*x1+(1-t)*x2, t*y1+(1-t)*y2, 0.45, {fill:"#e2e2e2"});
  Canvas.text(t*x1+(1-t)*x2, t*y1+(1-t)*y2, c.toFixed(2));
};

function draw() {
  var T = NeuralNetwork.get_data();

  Canvas.clear();
  draw_neuron(0, 2.5, 0.5, "");
  draw_neuron(0, 5.5, 0.5, "");
  Canvas.text(0, 1.5, "y-Koordinate");
  Canvas.text(0, 6.5, "x-Koordinate");

  draw_neuron(6, 1, 0.5, T.biases[0][0]);
  draw_neuron(6, 3, 0.5, T.biases[0][1]);
  draw_neuron(6, 5, 0.5, T.biases[0][2]);
  draw_neuron(6, 7, 0.5, T.biases[0][3]);

  draw_neuron(12, 1.5, 0.5, T.biases[1][0]);
  draw_neuron(12, 4.0, 0.5, T.biases[1][1]);
  draw_neuron(12, 6.5, 0.5, T.biases[1][2]);
  Canvas.text(12, 1.5+0.8, "blau");
  Canvas.text(12, 4.0+0.8, "gruen");
  Canvas.text(12, 6.5+0.8, "rot");

  draw_arrow(0+0.8, 5.5-0.45, 6-1.0, 1+0.2, 0.2, T.weights[0][0][0]);
  draw_arrow(0+0.8, 5.5-0.15, 6-1.0, 3+0.2, 0.5, T.weights[0][1][0]);
  draw_arrow(0+0.8, 5.5+0.15, 6-1.0, 5+0.2, 0.7, T.weights[0][2][0]);
  draw_arrow(0+0.8, 5.5+0.45, 6-1.0, 7+0.2, 0.5, T.weights[0][3][0]);

  draw_arrow(0+0.8, 2.5-0.45, 6-1.0, 1-0.2, 0.5, T.weights[0][0][1]);
  draw_arrow(0+0.8, 2.5-0.15, 6-1.0, 3-0.2, 0.7, T.weights[0][1][1]);
  draw_arrow(0+0.8, 2.5+0.15, 6-1.0, 5-0.2, 0.2, T.weights[0][2][1]);
  draw_arrow(0+0.8, 2.5+0.45, 6-1.0, 7-0.2, 0.2, T.weights[0][3][1]);

  draw_arrow(6+0.8, 1-0.3, 12-1.0, 1.5-0.45, 0.5, T.weights[1][0][0]);
  draw_arrow(6+0.8, 1-0.0, 12-1.0, 4.0-0.45, 0.8, T.weights[1][1][0]);
  draw_arrow(6+0.8, 1+0.3, 12-1.0, 6.5-0.45, 0.13, T.weights[1][2][0]);

  draw_arrow(6+0.8, 3-0.3, 12-1.0, 1.5-0.15, 0.2, T.weights[1][0][1]);
  draw_arrow(6+0.8, 3-0.0, 12-1.0, 4.0-0.15, 0.8, T.weights[1][1][1]);
  draw_arrow(6+0.8, 3+0.3, 12-1.0, 6.5-0.15, 0.45, T.weights[1][2][1]);

  draw_arrow(6+0.8, 5-0.3, 12-1.0, 1.5+0.15, 0.45, T.weights[1][0][2]);
  draw_arrow(6+0.8, 5-0.0, 12-1.0, 4.0+0.15, 0.8, T.weights[1][1][2]);
  draw_arrow(6+0.8, 5+0.3, 12-1.0, 6.5+0.15, 0.2, T.weights[1][2][2]);

  draw_arrow(6+0.8, 7-0.3, 12-1.0, 1.5+0.45, 0.13, T.weights[1][0][3]);
  draw_arrow(6+0.8, 7-0.0, 12-1.0, 4.0+0.45, 0.8, T.weights[1][1][3]);
  draw_arrow(6+0.8, 7+0.3, 12-1.0, 6.5+0.45, 0.5, T.weights[1][2][3]);

  var A = [NeuralNetwork.test(Y)];
  if (A[0] < Y.length) A.push(Y.length-A[0]);
  Eda.donut(A, {width:420,color:["green","red"],div:"pie",label:"percentage"});
  Eda.key(["Iterationsschritt #"+i.toFixed(0),"Anteil der korrekt klassifizierten Testobjekte","Anteil der nicht korrekt klassifizierten Testobjekte"], {width:420,color:["#f6f6f6","green","red","none","none"],div:"key"});
};

function setup() {
  Canvas.init([-2,14], [-0.5,8.2], {width:728, background:"lightgrey", scaling:"off"});
  draw();
  Animation.init({fps:12, autoplay:"off"});
  Button.add("reset", "Neustart");
  Button.add("start", "Start");
  Button.add("stop", "Pause");
  Button.add("step", "Schrittweise");
};

function loop() {
  NeuralNetwork.train(X, {iterations:50, batch_size:100});
  i += 50;
  draw();
};

function on_click(id) {
  if (id == "start") Animation.start();
  if (id == "stop") Animation.stop();
  if (id == "step") {
    Animation.stop();
    loop();
  };
  if (id == "reset") {
    Animation.stop();
    X = ClassificationData.get(1000, {categories:3, shape:"mixed"});
    Y = ClassificationData.get(1000, {categories:3, shape:"mixed"});
    i = 0;
    NeuralNetwork.init([2,4,3]);
    draw();
  };
};

</script>
</body>
</html>

Vorschau Download Kopie speichern

Aufgabe

Mache dich mit der Anwendung zuvor vertraut. Führe eine erste Trainingsphase durch und schaue, ob du verstehst, was genau dargestellt wird. Falls nicht, lies dir die Hinweise zuvor nochmals in Ruhe durch.
Führe mehrfach einen Neustart und eine jeweils ausreichend lange Trainingsphase durch. Was ist das beste Ergebnis, das du erreichen konntest (bezogen auf den Anteil der korrekt klassifizierten Testobjekte)? Wie viele Iterationsschritte waren dafür notwendig?