Besondere Freude bereitet es uns euch Martin, der seit einem knappen Jahr C++ Developer im Team von tmc Linz ist, vorzustellen. Martin ist nicht nur ein talentierter Soft- und Hardwareentwickler, sondern auch leidenschaftlicher Musiker. Lesen Sie mehr über seine Tätigkeit bei tmc und sein großes Hobby, die Blasmusik.
Neuronale Netze: Stopfassistent (tmA²) Trainingsprozess
Um ein funktionsfähiges neuronales Netz zu schaffen, muss man sich viele Gedanken über einen umfassenden und unkomplizierten Trainingsprozess für das Netz machen. Das gesamte Verfahren besteht aus vier Schlüsselphasen: Rohdatenerfassung, Annotation zur Generierung von Ground-Truth-Informationen, ein sorgfältiges Trainingsverfahren mit Überwachung und eine sorgfältige Analyse der Datenergebnisse des neuronalen Netzes.
Erstens ist die Erfassung von Rohdaten für neuronale Netze bereits vor Beginn der Trainingsfunktion von entscheidender Bedeutung. Schließlich sind valide Informationen die Wiege und der Ursprung aller zuverlässigen Technologien. Und solche Daten sind besonders wichtig für das Erreichen einer ordnungsgemäßen Funktionalität in Ländern, in denen der tmA² noch nicht eingesetzt wurde.
Die Aufgabe des so genannten „Ground Truth“-Labelings stellt eine der wichtigsten Funktionen in allen Systemen der künstlichen Intelligenz (KI) dar. Denn um genau zu lernen, müssen die KI-Systeme die Daten mit den „Ground Truth“-Informationen kombinieren. Um eine vollständige Klassifizierungsliste der untersuchten Objekte zu erhalten, basiert der tmA² auf dem Prozess der semantischen Segmentierung, der die Trennung und gleichzeitige Klassifizierung von Objekten aus jedem einzelnen erhaltenen Bild beinhaltet. Man darf nicht vergessen, dass dieser Prozess wiederum durch die manuelle Beschriftung dieser Objekte nach einem bestimmten Klassifizierungssystem erreicht wird.
Das KI-System ist so konzipiert, dass es zwischen der ständig wachsenden Zahl von 29 verschiedenen Klassen unterscheiden kann. Daher müssen die spezialisierten, geschulten Entwickler in der Lage sein, jedem Pixel im bereitgestellten Tiefenbild eine dieser Klassen zuzuordnen.
Ein gut funktionierendes neuronales Netz kann daher durch die entscheidende Trainingsphase des Systems erreicht werden, die nur mit einem strengen, überwachten Lernprozess gleichzusetzen ist. Sobald die Informationen des Labeling-Prozesses eingegangen sind, kann das Training beginnen. Eine Teilmenge der Daten wird dann beiseite gelegt und dem System für eine spätere Auswertung unbekannt gehalten. Die Aufnahme neuer Daten in die Trainingsdatenbank setzt dann die Lernpipeline der Maschine in Gang. Und voilà, ein neu aufgebautes neuronales Netz entsteht!
Nach Abschluss des Trainingsprozesses muss das Netz eine Reihe strenger Bewertungen durchlaufen.
Der Bewertungsprozess gliedert sich in drei wichtige Phasen
1.) Neue Objekte müssen richtig erkannt werden.
Die Bewertung, ob die neuen Objekte erkannt werden, wird mit der unbekannten Teilmenge der Daten abgeglichen.
2.) Kein Overfitting
Die Feststellung einer „Überanpassung“ würde darauf hindeuten, dass das Training des neuronalen Netzes zu sehr vom Trainingsdatensatz abhängt und somit die allgemeine Leistung des neuronalen Netzes beeinträchtigt.
3.) Kein Verlernen
Es wird sichergestellt, dass bereits trainierte Informationen nicht wieder verlernt werden.
Letztlich beruhen die Endergebnisse auf einer dreifachen Säule von Datenkorrelationen, die alle von der KI gesammelt werden, dem Input für die KI und dem Ertrag aus dem Bild der Ground-Truth, folglich werden sie so zum Ursprung von zuverlässigen neuronalen Netzen.
Wenn du mehr über neuronale Netze und unseren digitalen Stopfassistenten wissen möchtest, kontaktiere uns oder verbinde dich mit uns auf LinkedIn. Es ist unsere Aufgabe, erstklassige Lösungen für die Digitalisierung der Eisenbahninfrastruktur zu liefern.