25.05.2022

Orbbec Best Student Paper Award

QBV / Junger

M. Sc. Christina Junger  wurde für ihren Beitrag “Optimisation of a stereo image analysis by densify the disparity map based on a deep learning stereo matching framework” auf der SPIE-Conference „Dimensional Optical Metrology and Inspection for Practical Applications XI“ vom 05. bis 06.04.2022 in Orlando (Florida / USA) mit dem Orbbec Best Student Paper Award ausgezeichnet.

Das Paper nimmt Bezug auf das Projekt E4SM, an dem das Fachgebiet Qualitätssicherung und Industrielle Bildverarbeitung beteiligt ist. Ziel des Projektes ist es, effiziente Lernmethoden für robotergestützte Fertigungsprozesse für bereichsübergreifende Datenströme zu entwickeln. Hierzu zählen unter anderem die Verbesserung von Erkennungsaufgaben sowie Prozessoptimierungen. In dieser Veröffentlichung wird eine Optimierung einer Stereobildanalyse durch Verdichtung der Disparitätskarte auf der Grundlage eines tiefen neuronalen Netzes vorgestellt.

Ein passives Stereokamerasystem ist ein optisches Messsystem, welches Objekte/Szenen als 3D Punktwolke erfasst. Dieses Messsystem wird in vielen Anwendungsbereichen eingesetzt -  wie zum Beispiel bei robotergestützten Fertigungsprozessen. In jüngster Zeit wurden viele verschiedene effiziente Stereo Matching Algorithmen auf der Grundlage von tiefen neuronalen Netze entwickelt, um unter anderem die Grenzen der herkömmlichen Korrespondenzpunktanalyse zu überwinden. Zu den Herausforderungen gehören Objekte mit geringer Textur oder mit einer optisch unkooperativen Oberfläche. Eines dieser tiefen neuronalen Netze ist das Adaptive Aggregation Network (AANet+).

Das AANet+ wurde auf einem eigenen Testdatensatz mit verschiedenen Messanordnungen auf seine Anwendbarkeit und Effizienz hin untersucht. Zudem wurden die Ergebnisse mit zwei traditionellen Stereo-Matching-Algorithmen (Semi-Global Block Matching und DAISY) verglichen. Im Vergleich zu den traditionell berechneten Disparitätskarten ist das AANet+ in der Lage, texturarme Objekte und optisch nicht-kooperative Objekte robust zu erkennen. Des Weiteren werden Objektabgrenzungen exzellent erfasst. Tiefe neuronale Netze werden jedoch stark von den Trainingsdaten begrenzt, wodurch diese für Multi-View-Stereosysteme mit unterschiedlicher Kameraanordnung oder bei Kleinserien mit verschiedenen Anwendungen unattraktiv sind.