Deep-Learning-Einheiten für den automatischen Weichenstopf-Assistenten
Deep Learning – ein neues Phänomen?
Diese Frage kann klar mit einem Nein beantwortet werden, auch wenn die Technik einige Jahre in der Versenkung verschwand. Deep Learning ist direkt von den Vorgängen im menschlichen Gehirn inspiriert. So gesehen stellt die Technik einen Transfer der biologischen Basis des Lernens auf neuronaler Ebene hin zu einem digital-maschinellen Vorgang dar.
Darüber hinaus stammen die ersten grundlegenden theoretischen Elemente von NN bereits aus den 1940er-Jahren und Deep Learning ist lediglich ein neuer Name für eine alte Technik. Zwei Forscher zeichnen für die Entwicklung dieser Klasse von Lernalgorithmen verantwortlich: Warren McCulloch und Walter Pitts, die auch als Begründer der Kognitionswissenschaften gelten.
Das Interesse an NN ließ jedoch stark nach. Einer der Hauptgründe: Mangelnde Rechnerleistung brachte die Technik schnell an die Grenzen der Verwendbarkeit. Mit der Verfügbarkeit neuer leistungsstarker Grafikkarten kam es ab 2012 zu einer Renaissance für NN, insbesondere für Deep-Learning-Algorithmen und deren Möglichkeiten in der digitalen Bildverarbeitung.
Es wurden keine Maschinen gefunden, die den Filterkriterien entsprechen.
Deep-Learning-Einheiten für den automatischen Weichenstopf-Assistenten
Maschinen, die die Schulbank drücken? Was im ersten Augenblick vielleicht nach Science-Fiction klingt, ist bei Plasser & Theurer Realität. Unser Entwicklungsteam arbeitet aktuell an einem lernenden 3D-Scan-basierten Sensorsystem und bringt diesem bei, autonome Entscheidungen zu treffen. Die hierfür verwendete Methode: Deep Learning.
Das smarte Weichenstopf-Assistenzsystem „PlasserSmartTamping – The Assistant“ unterstützt den Bediener, die operativen Systeme seiner Maschine zu managen, und stellt darüber hinaus einen wichtigen Schritt zur Automatisierung von Stopfmaschinen dar. Das Spannende daran: Das zukünftige Verhalten wird dem automatischen Assistenzsystem nicht statisch einprogrammiert, sondern beruht – wenn man so will – auf aktivem Selbststudium der Maschine. Die KI-basierte Deep-Learning-Technik optimiert dabei die Analyse von visuellen Reizen und der daraus resultierenden Handlungsentscheidung.
Deep Learning in der Bildverarbeitung
Deep Learning ist eine Form des überwachten maschinellen Lernens, wobei einem Computer ein Trainingssatz von Beispielen bereitgestellt wird. Durch diese Lerndaten erlangt er die Fähigkeit, auch auf die Fälle korrekt zu reagieren, die im eingespeisten Datenmaterial so nicht vorkamen. Durch eine Lernphase, in der mehrmalige Abfolgen von Auswertungen seitens des Systems und manuelle Korrekturen vorgenommen werden, kommt es laufend zu besseren Ergebnissen.
Der Lernprozess optimiert die Fähigkeit des Systems. Die mehr und mehr gewachsene Präzision, entstanden durch die Auswertung der Lernsätze, kann so für Bildmaterial realer Umgebungen adaptiert werden.
So funktioniert’s
Dem Rechensystem wird ein Objekt in Form eines Bilds präsentiert und es soll daraufhin entscheiden, welches Objekt dargestellt ist. Die Algorithmen, auf denen die Entscheidungsfindung beruht, besitzen die Fähigkeit zur Generalisierung, wodurch nicht jedes Entscheidungskriterium vorab programmiert werden muss. So wird anhand der Lernerfahrung das ungesehene Objekte einer zuvor trainierten Klasse zugeordnet.
Beim Trainieren eines Lernmodells werden Parameter, sogenannte Netzwerkgewichte, so angepasst, dass eine bestimmte Eingabe (in diesem Fall das Bild) einer bestimmten Ausgabe (einer Klasse) zugeordnet wird. Das Programm erhält damit die Fähigkeit, eigene Entscheidungen für Problemstellungen zu finden. Bei den Objekten handelt es sich beispielsweise um eine Schwelle, eine Schiene, das Schotterbett, ein Kabel oder eine Pflanze. Die Reaktion des Assistenten ist in weiterer Folge abhängig vom jeweiligen Objekt.
Deep Learning und neuronale Netzwerke
Deep Learning ist eine Form des Lernens, die aus dem Bereich der neuronalen Netze (NN) stammt. Ein solches Netz besteht aus künstlichen Neuronen und orientiert sich an der Funktionsweise des menschlichen Gehirns. Im Bereich der NN unterscheidet man flache (engl. „Shallow Neural Networks“) und tiefe neuronale Netzwerken (engl. „Deep Neural Networks“). Beide Formen verfügen über sogenannte versteckte Ebenen (engl. „Hidden Layer“). Im Falle der tiefen NN sind dies mehrere, während es bei flachen NN nur ein einzelner ist. Deep Learning, also NN mit vielen Hidden Layer, leitete hier die Grundlage für eine enorme Weiterentwicklung in der Bilderkennung ein: Auf Deep Learning basierende Convolutional Neural Networks (CNN – faltende neuronale Netzwerke) revolutionierten die Bildklassifikation regelrecht und ermöglichten seit ihrer Einführung enorme Fortschritte besonders im Bereich der Computer Vision. Die visuellen Erkennungsmöglichkeiten übertreffen heute in einigen Anwendungsfeldern bereits die von Menschen.
Sie wollen tiefer in das Thema Deep Learning bei Plasser & Theurer, Convolutional Neural Networks und ihre Erweiterungsform der FCN, Fully Convolutional Networks (spezielle tiefenfaltende neurale Netzwerke), einsteigen? Detailliertere Informationen finden Sie hier.