Anzahl der Treffer: 469
Erstellt: Sat, 02 Jul 2022 23:14:40 +0200 in 0.0793 sec


Katzmann, Alexander;
Deep learning for clinical decision support in oncology. - Ilmenau : Universitätsbibliothek, 2022. - 1 Online-Ressource (168 Seiten)
Technische Universität Ilmenau, Dissertation 2022

Bibliography p. 123-139

In den letzten Jahrzehnten sind medizinische Bildgebungsverfahren wie die Computertomographie (CT) zu einem unersetzbaren Werkzeug moderner Medizin geworden, welche eine zeitnahe, nicht-invasive Begutachtung von Organen und Geweben ermöglichen. Die Menge an anfallenden Daten ist dabei rapide gestiegen, allein innerhalb der letzten Jahre um den Faktor 15, und aktuell verantwortlich für 30 % des weltweiten Datenvolumens. Die Anzahl ausgebildeter Radiologen ist weitestgehend stabil, wodurch die medizinische Bildanalyse, angesiedelt zwischen Medizin und Ingenieurwissenschaften, zu einem schnell wachsenden Feld geworden ist. Eine erfolgreiche Anwendung verspricht Zeitersparnisse, und kann zu einer höheren diagnostischen Qualität beitragen. Viele Arbeiten fokussieren sich auf "Radiomics", die Extraktion und Analyse von manuell konstruierten Features. Diese sind jedoch anfällig gegenüber externen Faktoren wie dem Bildgebungsprotokoll, woraus Implikationen für Reproduzierbarkeit und klinische Anwendbarkeit resultieren. In jüngster Zeit sind Methoden des "Deep Learning" zu einer häufig verwendeten Lösung algorithmischer Problemstellungen geworden. Durch Anwendungen in Bereichen wie Robotik, Physik, Mathematik und Wirtschaft, wurde die Forschung im Bereich maschinellen Lernens wesentlich verändert. Ein Kriterium für den Erfolg stellt die Verfügbarkeit großer Datenmengen dar. Diese sind im medizinischen Bereich rar, da die Bilddaten strengen Anforderungen bezüglich Datenschutz und Datensicherheit unterliegen, und oft heterogene Qualität, sowie ungleichmäßige oder fehlerhafte Annotationen aufweisen, wodurch ein bedeutender Teil der Methoden keine Anwendung finden kann. Angesiedelt im Bereich onkologischer Bildgebung zeigt diese Arbeit Wege zur erfolgreichen Nutzung von Deep Learning für medizinische Bilddaten auf. Mittels neuer Methoden für klinisch relevante Anwendungen wie die Schätzung von Läsionswachtum, Überleben, und Entscheidungkonfidenz, sowie Meta-Learning, Klassifikator-Ensembling, und Entscheidungsvisualisierung, werden Wege zur Verbesserungen gegenüber State-of-the-Art-Algorithmen aufgezeigt, welche ein breites Anwendungsfeld haben. Hierdurch leistet die Arbeit einen wesentlichen Beitrag in Richtung einer klinischen Anwendung von Deep Learning, zielt auf eine verbesserte Diagnose, und damit letztlich eine verbesserte Gesundheitsversorgung insgesamt.



https://doi.org/10.22032/dbt.51864
Eisenbach, Markus; Aganian, Dustin; Köhler, Mona; Stephan, Benedict; Schröter, Christof; Groß, Horst-Michael;
Visual scene understanding for enabling situation-aware cobots. - Ilmenau : Universitätsbibliothek. - 1 Online-Ressource (2 Seiten)Publikation entstand im Rahmen der Veranstaltung: IEEE International Conference on Automation Science and Engineering ; 17 (Lyon, France) : 2021.08.23-27, TuBT7 Special Session: Robotic Control and Robotization of Tasks within Industry 4.0

Although in the course of Industry 4.0, a high degree of automation is the objective, not every process can be fully automated - especially in versatile manufacturing. In these applications, collaborative robots (cobots) as helpers are a promising direction. We analyze the collaborative assembly scenario and conclude that visual scene understanding is a prerequisite to enable autonomous decisions by cobots. We identify the open challenges in these visual recognition tasks and propose promising new ideas on how to overcome them.



https://doi.org/10.22032/dbt.51471
Döring, Nicola; Mikhailova, Veronika; Brandenburg, Karlheinz; Broll, Wolfgang; Groß, Horst-Michael; Werner, Stephan; Raake, Alexander;
Saying "Hi" to grandma in nine different ways : established and innovative communication media in the grandparent-grandchild relationship. - In: Technology, Mind, and Behavior, ISSN 2689-0208, (2021), insges. 1 S.

https://tmb.apaopen.org/pub/8je5p43m/release/1?readingCollection=b5d405be
Keßler, Jens;
Planungsmethoden für eine sozial akzeptable Navigation von Assistenzrobotern. - Ilmenau : Universitätsbibliothek, 2021. - 1 Online-Ressource (xiii, 195 Seiten)
Technische Universität Ilmenau, Dissertation 2021

In den vergangenen Jahren wurde im Bereich der mobilen Assistenzrobotik auch das Themenfeld der sozial-akzeptablen Navigation weiterentwickelt. Dabei kommt zu den vorhandenen Herausforderungen der Navigation nun auch der Faktor Mensch hinzu. Aus dem Themenbereich der sozial-akzeptablen Navigation widmet sich die vorliegende Arbeit zwei Aspekten, wobei der Fokus immer auf einem mobilen Roboter liegt, welcher sich im häuslichen Umfeld bewegt. Der erste Aspekt der Arbeit behandelt, wie ein Roboter sich in einer häuslichen Umgebung bewegen soll. Dabei ist von Interesse, welche Pfade der mobile Roboter im Beisein eines Bewohners plant. Die wissenschaftliche Leistung der Arbeit ist, vorhandene Planungsansätze auf Raum und Zeit zu erweitern und es so zu ermöglichen, die Bewegung einer Person in die Planungsphase zu integrieren. Dazu werden simple Bewegungsprädiktionsmethoden untersucht und es wird eine mathematische Beschreibung entwickelt, die Bewegungsvorhersagen von Personen in die Planung mit einbezieht. Durch die so weiterentwickelten Planungsverfahren werden zwei Szenarien experimentell näher untersucht: A) frontales Heranfahren an eine Person, B) frühzeitiges Ausweichen einer entgegenkommenden Person. Im zweiten Aspekt der vorliegenden Arbeit wird auf ein bisher nur sehr wenig beachtetes Problem der mobilen Robotik eingegangen: wie findet ein mobiler Roboter für seine jeweilige - häufig nur abstrakt formulierbare - Aufgabe sinnvolle Zielpunkte in seiner Einsatzumgebung, ohne dass diese statisch vorgegeben sein müssen? Als Lösungsansatz wird in dieser Arbeit ein Verfahren vorgeschlagen, welches eine abstrakte Aufgabe auf mehrere Kriterien abbildet und diese nach Extrempunkten untersucht. Diese Extrempunkte ergeben einzeln oder in Kombination mögliche Zielpunkte des Roboters. Die wissenschaftlichen Beiträge sind, für dieses Verfahren zu untersuchen, welche mathematische Formulierung der Einzelkriterien sinnvoll ist, welche Ergebnisse eine Optimierung mit unabhängigen Einzelkriterien liefert (Pareto-Optimalität) bzw. welche Ergebnisse die Kombination der einzelnen Kriterien zu einer Gesamtfunktion erzielt werden können (Superpositionsprinzip). Durch den hier präsentierten Ansatz werden folgende zwei Szenarien für die häusliche Navigation experimentell untersucht: C) Beobachten einer Person, D) Finden einer Parkposition bei potentiellen Engstellen. Für alle Szenarien gilt: es soll insbesondere das Weltwissen des Roboters zur Lösungsfindung genutzt werden. Dies alles setzt eine Akquise von Umweltwissen durch den Roboter voraus. Hierzu werden in der Arbeit praktisch einsetzbare Verfahren vorgestellt, welche das nötige Umweltwissen zur Schätzung der Oberkörperpose, Beobachtbarkeit und Bewegungsprädiktion ermitteln können.



https://doi.org/10.22032/dbt.50287
Balada, Christoph; Eisenbach, Markus; Groß, Horst-Michael;
Evaluation of transfer learning for visual road condition assessment. - In: Artificial neural networks and machine learning - ICANN 2021, (2021), S. 540-551

Through deep learning, major advances have been made in the field of visual road condition assessment in recent years. However, many approaches train from scratch and avoid transfer learning due to the different nature of road surface data and the ImageNet dataset, which is commonly used for pre-training neural networks for visual recognition. We show that, despite the huge differences in the data, transfer learning outperforms training from scratch in terms of generalization. In extensive experiments, we explore the underlying cause by examining various transfer learning effects. For our experiments, we are incorporating seven known architectures. Therefore, this is the first comprehensive study of transfer learning in the field of visual road condition assessment.



Aganian, Dustin; Eisenbach, Markus; Wagner, Joachim; Seichter, Daniel; Groß, Horst-Michael;
Revisiting loss functions for person re-identification. - In: Artificial neural networks and machine learning - ICANN 2021, (2021), S. 30-42

Appearance-based person re-identification is very challenging, i.a. due to changing illumination, image distortion, and differences in viewpoint. Therefore, it is crucial to learn an expressive feature embedding that compensates for changing environmental conditions. There are many loss functions available to achieve this goal. However, it is hard to judge which one is the best. In related work, the experiments are only performed on the same datasets, but the use of different setups and different training techniques compromises the comparability. Therefore, we compare the most widely used and most promising loss functions under identical conditions on three different setups. We provide insights into why some of the loss functions work better than others and what additional benefits they provide. We further propose sequential training as an additional training trick that improves the performance of most loss functions. In our conclusion, we provide guidance for future usage an d research regarding loss functions for appearance-based person re-identification. Source code is available (Source code: https://www.tu-ilmenau.de/neurob/data-sets-code/re-id-loss/).



Fischer, Kai; Simon, Martin; Ölsner, Florian; Milz, Stefan; Groß, Horst-Michael; Mäder, Patrick;
StickyPillars: robust and efficient feature matching on point clouds using graph neural networks. - In: 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition, (2021), S. 313-323

Robust point cloud registration in real-time is an important prerequisite for many mapping and localization algorithms. Traditional methods like ICP tend to fail without good initialization, insufficient overlap or in the presence of dynamic objects. Modern deep learning based registration approaches present much better results, but suffer from a heavy runtime. We overcome these drawbacks by introducing StickyPillars, a fast, accurate and extremely robust deep middle-end 3D feature matching method on point clouds. It uses graph neural networks and performs context aggregation on sparse 3D key-points with the aid of transformer based multi-head self and cross-attention. The network output is used as the cost for an optimal transport problem whose solution yields the final matching probabilities. The system does not rely on hand crafted feature descriptors or heuristic matching strategies. We present state-of-art art accuracy results on the registration problem demonstrated on the KITTI dataset while being four times faster then leading deep methods. Furthermore, we integrate our matching system into a LiDAR odometry pipeline yielding most accurate results on the KITTI odometry dataset. Finally, we demonstrate robustness on KITTI odometry. Our method remains stable in accuracy where state-of-the-art procedures fail on frame drops and higher speeds.



https://doi.org/10.1109/CVPR46437.2021.00038
Stricker, Ronny; Aganian, Dustin; Sesselmann, Maximilian; Seichter, Daniel; Engelhardt, Marius; Spielhofer, Roland; Hahn, Matthias; Hautz, Astrid; Debes, Klaus; Groß, Horst-Michael;
Road surface segmentation - pixel-perfect distress and object detection for road assessment. - In: 2021 IEEE 17th International Conference on Automation Science and Engineering (CASE), (2021), S. 1789-1796

Visual road assessment, which is carried out by many countries, involves the evaluation of millions of surface images. This exhaustive task is usually done manually and therefore is costly in terms of time and prone to failure. Different methods for automatic distress detection have been presented in the literature recently. However, most of the approaches are focused on crack detection only. This paper focuses on detecting multiple distress types and object classes on asphalt roads, aiming to fully automate distress detection on road surfaces in Austria, Switzerland, and Germany using image segmentation with neural networks. The paper introduces a distress and object catalog developed by experts of the involved countries that guarantees convertibility into federal distress catalogs. We evaluate the performance gain of different neural network architectures and advanced training techniques by conducting extensive experiments.



https://doi.org/10.1109/CASE49439.2021.9551591
Seichter, Daniel; Köhler, Mona; Lewandowski, Benjamin; Wengefeld, Tim; Groß, Horst-Michael;
Efficient RGB-D semantic segmentation for indoor scene analysis. - In: 2021 IEEE International Conference on Robotics and Automation, (2021), S. 13525-13531

Analyzing scenes thoroughly is crucial for mobile robots acting in different environments. Semantic segmentation can enhance various subsequent tasks, such as (semantically assisted) person perception, (semantic) free space detection, (semantic) mapping, and (semantic) navigation. In this paper, we propose an efficient and robust RGB-D segmentation approach that can be optimized to a high degree using NVIDIA TensorRT and, thus, is well suited as a common initial processing step in a complex system for scene analysis on mobile robots. We show that RGB-D segmentation is superior to processing RGB images solely and that it can still be performed in real time if the network architecture is carefully designed. We evaluate our proposed Efficient Scene Analysis Network (ESANet) on the common indoor datasets NYUv2 and SUNRGB-D and show that we reach state-of-the-art performance while enabling faster inference. Furthermore, our evaluation on the outdoor dataset Cityscapes shows that our approach is suitable for other areas of application as well. Finally, instead of presenting benchmark results only, we also show qualitative results in one of our indoor application scenarios.



https://doi.org/10.1109/ICRA48506.2021.9561675
Müller, Steffen; Stephan, Benedict; Groß, Horst-Michael;
MDP-based motion planning for grasping in dynamic scenarios. - In: 2021 European Conference on Mobile Robots (ECMR), (2021), insges. 8 S.

Path planning for robotic manipulation is a well understood topic as long as the execution of the plan takes place in a static scene. Unfortunately, for applications involving human interaction partners a dynamic obstacle configuration has to be considered. Furthermore, if it comes to grasping objects from a human hand, there is not a single goal position and the optimal grasping configuration may change during the execution of the grasp movement. This makes a continuous re-planning in a loop necessary. Besides efficiency and security concerns, such periodic planning raises the additional requirement of consistency, which is hard to achieve with traditional sampling based planners. We present an online capable planner for continuous control of a robotic grasp task. The planner additionally is able to resolve multiple possible grasp poses and additional goal functions by applying an MDP-like optimization of future rewards. Furthermore, we present a heuristic for setting edges in a probabilistic roadmap graph that improves the connectivity and keeps edge count low.



https://doi.org/10.1109/ECMR50962.2021.9568813