Anzahl der Treffer: 474
Erstellt: Tue, 29 Nov 2022 23:12:49 +0100 in 0.0645 sec

Wengefeld, Tim; Schütz, Benjamin; Girdziunaite, Gerda; Scheidig, Andrea; Groß, Horst-Michael
The MORPHIA Project: first results of a long-term user study in an elderly care scenario from robotic point of view. - In: 54th International Symposium on Robotics, (2022), S. 66-73

In an aging society, efficiently organizing care taking tasks is of great importance including several players (here referred to as caregivers) like relatives, friends, professional caretakers, employees of retirement homes, clubs and so on. Especially for long-distance relationships, this can be burdensome and time-consuming. While supporting devices, like mobile phones or tablets, are slowly reaching the elder community, the drawbacks are obvious. These passive devices need to be handled by the elderly themselves, this includes an proper understanding of the operation, remembering to charge the devices, or even to hear incoming calls or messages. In the project MORPHIA, we target these drawbacks by combining a social communication platform on a tablet with a mobile robotic platform that can be remote-controlled by all mentioned actors of the supporting network or actively deliver messages emitted from the network. In this paper, we present the first stage of our demonstrator in terms of implemented hard- and software components. Since the price is a key factor for acceptance of such a system in the care community, we performed a technical assessment of these components based on our findings during the development process. In addition, we present the results of the first user tests with 5 participants over two weeks each between August and November 2021 (two further test iterations are planned for 2022 and 2023). This includes general usage of specific robotic services as well as technical benchmarks to assess the robustness of the developed system in domestic environments.

Seichter, Daniel; Fischedick, Söhnke Benedikt; Köhler, Mona; Groß, Horst-Michael
Efficient multi-task RGB-D scene analysis for indoor environments. - In: IEEE Xplore digital library, ISSN 2473-2001, (2022), insges. 10 S.

Semantic scene understanding is essential for mobile agents acting in various environments. Although semantic segmentation already provides a lot of information, details about individual objects as well as the general scene are missing but required for many real-world applications. However, solving multiple tasks separately is expensive and cannot be accomplished in real time given limited computing and battery capabilities on a mobile platform. In this paper, we propose an efficient multi-task approach for RGB-D scene analysis (EMSANet) that simultaneously performs semantic and instance segmentation (panoptic segmentation), instance orientation estimation, and scene classification. We show that all tasks can be accomplished using a single neural network in real time on a mobile platform without diminishing performance - by contrast, the individual tasks are able to benefit from each other. In order to evaluate our multi-task approach, we extend the annotations of the common RGB-D indoor datasets NYUv2 and SUNRGB-D for instance segmentation and orientation estimation. To the best of our knowledge, we are the first to provide results in such a comprehensive multi-task setting for indoor scene analysis on NYUv2 and SUNRGB-D.
Döring, Nicola; Conde, Melisa; Brandenburg, Karlheinz; Broll, Wolfgang; Groß, Horst-Michael; Werner, Stephan; Raake, Alexander
Can communication technologies reduce loneliness and social isolation in older people? : a scoping review of reviews. - In: International journal of environmental research and public health, ISSN 1660-4601, Bd. 19 (2022), 18, 11310, S. 1-20

Background: Loneliness and social isolation in older age are considered major public health concerns and research on technology-based solutions is growing rapidly. This scoping review of reviews aims to summarize the communication technologies (CTs) (review question RQ1), theoretical frameworks (RQ2), study designs (RQ3), and positive effects of technology use (RQ4) present in the research field. Methods: A comprehensive multi-disciplinary, multi-database literature search was conducted. Identified reviews were analyzed according to the PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) framework. A total of N = 28 research reviews that cover 248 primary studies spanning 50 years were included. Results: The majority of the included reviews addressed general internet and computer use (82% each) (RQ1). Of the 28 reviews, only one (4%) worked with a theoretical framework (RQ2) and 26 (93%) covered primary studies with quantitative-experimental designs (RQ3). The positive effects of technology use were shown in 55% of the outcome measures for loneliness and 44% of the outcome measures for social isolation (RQ4). Conclusion: While research reviews show that CTs can reduce loneliness and social isolation in older people, causal evidence is limited and insights on innovative technologies such as augmented reality systems are scarce.
Seichter, Daniel; Langer, Patrick; Wengefeld, Tim; Lewandowski, Benjamin; Höchemer, Dominik; Groß, Horst-Michael
Efficient and robust semantic mapping for indoor environments. - In: IEEE Xplore digital library, ISSN 2473-2001, (2022), S. 9221-9227

A key proficiency an autonomous mobile robot must have to perform high-level tasks is a strong understanding of its environment. This involves information about what types of objects are present, where they are, what their spatial extend is, and how they can be reached, i.e., information about free space is also crucial. Semantic maps are a powerful instrument providing such information. However, applying semantic segmentation and building 3D maps with high spatial resolution is challenging given limited resources on mobile robots. In this paper, we incorporate semantic information into efficient occupancy normal distribution transform (NDT) maps to enable real-time semantic mapping on mobile robots. On the publicly available dataset Hypersim, we show that, due to their sub-voxel accuracy, semantic NDT maps are superior to other approaches. We compare them to the recent state-of-the-art approach based on voxels and semantic Bayesian spatial kernel inference (S-BKI) and to an optimized version of it derived in this paper. The proposed semantic NDT maps can represent semantics to the same level of detail, while mapping is 2.7 to 17.5 times faster. For the same grid resolution, they perform significantly better, while mapping is up to more than 5 times faster. Finally, we prove the real-world applicability of semantic NDT maps with qualitative results in a domestic application.
Katzmann, Alexander;
Deep learning for clinical decision support in oncology. - Ilmenau : Universitätsbibliothek, 2022. - 1 Online-Ressource (168 Seiten)
Technische Universität Ilmenau, Dissertation 2022

Bibliography p. 123-139

In den letzten Jahrzehnten sind medizinische Bildgebungsverfahren wie die Computertomographie (CT) zu einem unersetzbaren Werkzeug moderner Medizin geworden, welche eine zeitnahe, nicht-invasive Begutachtung von Organen und Geweben ermöglichen. Die Menge an anfallenden Daten ist dabei rapide gestiegen, allein innerhalb der letzten Jahre um den Faktor 15, und aktuell verantwortlich für 30 % des weltweiten Datenvolumens. Die Anzahl ausgebildeter Radiologen ist weitestgehend stabil, wodurch die medizinische Bildanalyse, angesiedelt zwischen Medizin und Ingenieurwissenschaften, zu einem schnell wachsenden Feld geworden ist. Eine erfolgreiche Anwendung verspricht Zeitersparnisse, und kann zu einer höheren diagnostischen Qualität beitragen. Viele Arbeiten fokussieren sich auf "Radiomics", die Extraktion und Analyse von manuell konstruierten Features. Diese sind jedoch anfällig gegenüber externen Faktoren wie dem Bildgebungsprotokoll, woraus Implikationen für Reproduzierbarkeit und klinische Anwendbarkeit resultieren. In jüngster Zeit sind Methoden des "Deep Learning" zu einer häufig verwendeten Lösung algorithmischer Problemstellungen geworden. Durch Anwendungen in Bereichen wie Robotik, Physik, Mathematik und Wirtschaft, wurde die Forschung im Bereich maschinellen Lernens wesentlich verändert. Ein Kriterium für den Erfolg stellt die Verfügbarkeit großer Datenmengen dar. Diese sind im medizinischen Bereich rar, da die Bilddaten strengen Anforderungen bezüglich Datenschutz und Datensicherheit unterliegen, und oft heterogene Qualität, sowie ungleichmäßige oder fehlerhafte Annotationen aufweisen, wodurch ein bedeutender Teil der Methoden keine Anwendung finden kann. Angesiedelt im Bereich onkologischer Bildgebung zeigt diese Arbeit Wege zur erfolgreichen Nutzung von Deep Learning für medizinische Bilddaten auf. Mittels neuer Methoden für klinisch relevante Anwendungen wie die Schätzung von Läsionswachtum, Überleben, und Entscheidungkonfidenz, sowie Meta-Learning, Klassifikator-Ensembling, und Entscheidungsvisualisierung, werden Wege zur Verbesserungen gegenüber State-of-the-Art-Algorithmen aufgezeigt, welche ein breites Anwendungsfeld haben. Hierdurch leistet die Arbeit einen wesentlichen Beitrag in Richtung einer klinischen Anwendung von Deep Learning, zielt auf eine verbesserte Diagnose, und damit letztlich eine verbesserte Gesundheitsversorgung insgesamt.
Eisenbach, Markus; Aganian, Dustin; Köhler, Mona; Stephan, Benedict; Schröter, Christof; Groß, Horst-Michael
Visual scene understanding for enabling situation-aware cobots. - Ilmenau : Universitätsbibliothek. - 1 Online-Ressource (2 Seiten)Publikation entstand im Rahmen der Veranstaltung: IEEE International Conference on Automation Science and Engineering ; 17 (Lyon, France) : 2021.08.23-27, TuBT7 Special Session: Robotic Control and Robotization of Tasks within Industry 4.0

Although in the course of Industry 4.0, a high degree of automation is the objective, not every process can be fully automated - especially in versatile manufacturing. In these applications, collaborative robots (cobots) as helpers are a promising direction. We analyze the collaborative assembly scenario and conclude that visual scene understanding is a prerequisite to enable autonomous decisions by cobots. We identify the open challenges in these visual recognition tasks and propose promising new ideas on how to overcome them.
Döring, Nicola; Mikhailova, Veronika; Brandenburg, Karlheinz; Broll, Wolfgang; Groß, Horst-Michael; Werner, Stephan; Raake, Alexander
Saying "Hi" to grandma in nine different ways : established and innovative communication media in the grandparent-grandchild relationship. - In: Technology, Mind, and Behavior, ISSN 2689-0208, (2021), insges. 1 S.
Keßler, Jens;
Planungsmethoden für eine sozial akzeptable Navigation von Assistenzrobotern. - Ilmenau : Universitätsbibliothek, 2021. - 1 Online-Ressource (xiii, 195 Seiten)
Technische Universität Ilmenau, Dissertation 2021

In den vergangenen Jahren wurde im Bereich der mobilen Assistenzrobotik auch das Themenfeld der sozial-akzeptablen Navigation weiterentwickelt. Dabei kommt zu den vorhandenen Herausforderungen der Navigation nun auch der Faktor Mensch hinzu. Aus dem Themenbereich der sozial-akzeptablen Navigation widmet sich die vorliegende Arbeit zwei Aspekten, wobei der Fokus immer auf einem mobilen Roboter liegt, welcher sich im häuslichen Umfeld bewegt. Der erste Aspekt der Arbeit behandelt, wie ein Roboter sich in einer häuslichen Umgebung bewegen soll. Dabei ist von Interesse, welche Pfade der mobile Roboter im Beisein eines Bewohners plant. Die wissenschaftliche Leistung der Arbeit ist, vorhandene Planungsansätze auf Raum und Zeit zu erweitern und es so zu ermöglichen, die Bewegung einer Person in die Planungsphase zu integrieren. Dazu werden simple Bewegungsprädiktionsmethoden untersucht und es wird eine mathematische Beschreibung entwickelt, die Bewegungsvorhersagen von Personen in die Planung mit einbezieht. Durch die so weiterentwickelten Planungsverfahren werden zwei Szenarien experimentell näher untersucht: A) frontales Heranfahren an eine Person, B) frühzeitiges Ausweichen einer entgegenkommenden Person. Im zweiten Aspekt der vorliegenden Arbeit wird auf ein bisher nur sehr wenig beachtetes Problem der mobilen Robotik eingegangen: wie findet ein mobiler Roboter für seine jeweilige - häufig nur abstrakt formulierbare - Aufgabe sinnvolle Zielpunkte in seiner Einsatzumgebung, ohne dass diese statisch vorgegeben sein müssen? Als Lösungsansatz wird in dieser Arbeit ein Verfahren vorgeschlagen, welches eine abstrakte Aufgabe auf mehrere Kriterien abbildet und diese nach Extrempunkten untersucht. Diese Extrempunkte ergeben einzeln oder in Kombination mögliche Zielpunkte des Roboters. Die wissenschaftlichen Beiträge sind, für dieses Verfahren zu untersuchen, welche mathematische Formulierung der Einzelkriterien sinnvoll ist, welche Ergebnisse eine Optimierung mit unabhängigen Einzelkriterien liefert (Pareto-Optimalität) bzw. welche Ergebnisse die Kombination der einzelnen Kriterien zu einer Gesamtfunktion erzielt werden können (Superpositionsprinzip). Durch den hier präsentierten Ansatz werden folgende zwei Szenarien für die häusliche Navigation experimentell untersucht: C) Beobachten einer Person, D) Finden einer Parkposition bei potentiellen Engstellen. Für alle Szenarien gilt: es soll insbesondere das Weltwissen des Roboters zur Lösungsfindung genutzt werden. Dies alles setzt eine Akquise von Umweltwissen durch den Roboter voraus. Hierzu werden in der Arbeit praktisch einsetzbare Verfahren vorgestellt, welche das nötige Umweltwissen zur Schätzung der Oberkörperpose, Beobachtbarkeit und Bewegungsprädiktion ermitteln können.
Balada, Christoph; Eisenbach, Markus; Groß, Horst-Michael
Evaluation of transfer learning for visual road condition assessment. - In: Artificial neural networks and machine learning - ICANN 2021, (2021), S. 540-551

Through deep learning, major advances have been made in the field of visual road condition assessment in recent years. However, many approaches train from scratch and avoid transfer learning due to the different nature of road surface data and the ImageNet dataset, which is commonly used for pre-training neural networks for visual recognition. We show that, despite the huge differences in the data, transfer learning outperforms training from scratch in terms of generalization. In extensive experiments, we explore the underlying cause by examining various transfer learning effects. For our experiments, we are incorporating seven known architectures. Therefore, this is the first comprehensive study of transfer learning in the field of visual road condition assessment.

Aganian, Dustin; Eisenbach, Markus; Wagner, Joachim; Seichter, Daniel; Groß, Horst-Michael
Revisiting loss functions for person re-identification. - In: Artificial neural networks and machine learning - ICANN 2021, (2021), S. 30-42

Appearance-based person re-identification is very challenging, i.a. due to changing illumination, image distortion, and differences in viewpoint. Therefore, it is crucial to learn an expressive feature embedding that compensates for changing environmental conditions. There are many loss functions available to achieve this goal. However, it is hard to judge which one is the best. In related work, the experiments are only performed on the same datasets, but the use of different setups and different training techniques compromises the comparability. Therefore, we compare the most widely used and most promising loss functions under identical conditions on three different setups. We provide insights into why some of the loss functions work better than others and what additional benefits they provide. We further propose sequential training as an additional training trick that improves the performance of most loss functions. In our conclusion, we provide guidance for future usage an d research regarding loss functions for appearance-based person re-identification. Source code is available (Source code: