Studienabschlussarbeiten

Anzahl der Treffer: 718
Erstellt: Mon, 06 May 2024 17:05:24 +0200 in 0.0675 sec


Arsalan, Muhammad;
AI-supported improvement of pose estimation of ChArUco markers for camera calibration. - Ilmenau. - 96 Seiten
Technische Universität Ilmenau, Masterarbeit 2023

In der Mensch-Roboter Kollaboration sowie bei Anwendungen mit unbemannten Fluggeräten (engl. Unmanned Aerial Vehicle, UAV) hat hierbei die Posenschätzung sowie Kalibrierung eine wichtige Schlüsselrolle. UAVs finden in verschiedenen Anwendungsbereichen wie Luftbildfotografie, Kartierung und Vermessung Verwendung. Das Landen in anspruchsvollen Umgebungen wie auf einem sich bewegenden Objekt bei Nacht oder in unwbwnwm Boden stellt jedoch aufgrund von schlechten Lichtverhältnissen und hoher Bewegung eine Herausforderung dar. Die Kamerakalibrierung ermöglicht es dem UAV, seine Position und Entfernung genau zu schätzen und somit eine sichere und präzise Landung durch Echtzeit-Anpassung des Flugwegs zu gewährleisten. Hierfür werden beispielsweise Marker wie ArUco-Marker verwendet. Bei Verwendung der traditionellen OpenCV-Methode gestaltet sich die Markererkennung unter den genannten Umweltbedingungen schwierig, was zu einer ungenauen Schätzung der Kamerakalibrierungsparameter und der Position führt. Diese Masterarbeit beschreibt die Implementierung des DeepChArUco Frameworks (nicht frei verfügbar) nach der Veröffentlichung [HDC+18]. Dieses Framework umfasst zwei Deep Convolutional Neural Networks (ChArUcoNet und RefineNet). Für das Training des Modells werden zwei Datensatze verwendet: ein realer Datensatz des Fachgebiets Qualitätssicherung und Industrielle Bildverarbeitung (TU Ilmenau) für ChArUcoNet und eigene synthetisch generierte Daten für das RefineNet. Es werden verschiedene Datenaugmentierungstechniken angewendet, um die schwierigen Bedingungen im Datensatz widerzuspiegeln. Es werden vier verschiedene Testfallstrategien entwickelt, um die Markererkennungsleistung auf dem Testdatensatz zu bewerten: (1) traditionelle Methode, (2) ChArUcoNet ohne Verfeinerung, (3) ChArUcoNet mit traditioneller Verfeinerung und (4) ChArUcoNet mit RefineNet. Die Testergebnisse zeigen, dass die traditionelle Methode unter extremen Bedingungen schlechte Leistung erbringt und nur 54 % der ChArUco-Marker erkennt, was zu einer ungenauen Kalibrierungsparameterschätzung führt. Die trainierten Modelle verbessern die Markererkennung jedoch signifikant auf 92 %, was zu verbesserter Schätzung der Kalibrierungsparameter und präziser ChArUco-Positionsbestimmung unter komplexen Bedingungen führt. Eine Einschränkung der Implementierung besteht darin, dass in einigen Bildern identische IDs zweimal erkannt werden, was zu fehlerhafter Klassifizierung der IDs führt. In dieser Arbeit werden zukünftige Arbeiten beschrieben, um die Gesamtleistung der eigen umgesetzten DeepChArUco Methode zu verbessern. Im Rahmen dieser Arbeit entstand eine frei verfügbare Umsetzung des DeepChArUco-Frameworks (GitLab).



Mahmood, Muhammad Hassan;
Investigations of 3D reconstruction of uncooperative surfaces for cameras in the visible spectral range using the deep stereo framework. - Ilmenau. - 88 Seiten
Technische Universität Ilmenau, Masterarbeit 2023

Stereo-Matching-Algorithmen sind in der Computer Vision weit verbreitet, um die 3D-Strukturen einer Szene aus Stereobildpaaren zu schätzen. Derzeit bestehen Herausforderungen bei einer 3D Rekonstruktion von unkooperatiben Objekten, wie stark reflektierende, spiegelnde, transparente oder strukturarme Oberflächen. Diese Schwierigkeiten beeinträchtigen die Genauigkeit von Stereo-Matching-Methoden. Um diese Herausforderungen zukünftig zu minimieren, wird im Rahmen dieser Arbeit das Fast Disparity Fusion (FD-Fusion) Framework, ein Deep Stereo Framework, verwendet. Dies ist in der Lage, die Ergebnisse verschiedener Stereo-Matching-Methoden zu fusionieren. Die Evaluation erfolgt auf verschiedenen Trainingsstrategien. Für das Training des Modells werden zwei Datensätze verwendet: der bewährte Middlebury-Datensatz und ein neuerer Datensatz, namens Booster, der explizit die Herausforderungen bestimmter Oberflächen und Objekte hervorhebt. In mehreren Trainingsrunden werden verschiedene Techniken zur Datenerweiterung in die Trainingsstrategien integriert. Nach jeder Trainingsrunde werden die Ergebnisse ausgewertet. Obwohl diese Forschung keine bahnbrechenden Ergebnisse liefert, bietet sie mögliche Ansätze zur Bewältigung der Herausforderungen, die durch nicht-lambertianische Oberflächen entstehen. Durch ein besseres Verständnis der Beziehung zwischen der Beschaffenheit des Datensatzes und den am besten geeigneten Augmentierungstechniken soll diese Forschung einen Beitrag zur Weiterentwicklung von Stereo-Matching-Techniken für unkooperative Oberflächen leisten. Es wird erwartet, dass die Ergebnisse dieser Forschung wertvolle Erkenntnisse zur Lösung der anhaltenden Herausforderungen liefern, die mit der Nutzung von KI-basierten Stereo-Matching-Methoden für unkooperative Objekte langfristig verbunden sind. Darüber hinaus werden in dieser Studie potenzielle Wege für zukünftige Untersuchungen aufgezeigt, um die Schwierigkeiten, die nicht kooperative Oberflächen im sichtbaren Spektralbereich für Stereo-Matching-Algorithmen mit sich bringen, zu beseitigen.



Zhu, Qingfei;
Body features and face-mesh based video data cleaning for sleep condition monitoring. - Ilmenau. - 84 Seiten
Technische Universität Ilmenau, Masterarbeit 2023

In den letzten Jahren leiden immer mehr Mensch unter den Symptomen von Schlafstörungen. Diese Symptome können durch die Überwachung der Vitalparameter diagnostiziert werden. Herkömmliche Überwachungsmethoden wie die Polysomnographie (PSG) sind kompliziert in der Anwendung und beeinträchtigen die Qualität des Schlafs des Patienten. Ein multimodales und multispektrales Sensorsystem ermöglicht die Fernschätzung der Vitalparameter des menschlichen Körpers direkt aus dem Video, das von der Kopfposition, -orientierung und -bewegung abhängig ist. Um sicherzustellen, dass die Vitaldaten effektiv extrahiert werden können, muss daher in der Phase der Datenvorverarbeitung die Auswertbarkeit der erfassten Videodaten bestimmt werden. In der vorangegangenen Arbeit wurde das oben genannte Sensorsystem zur Langzeitüberwachung der Vitalparameter von Patienten mit Schlafapnoe im Schlaflabor des Universitätsklinikums Essen eingesetzt. Nach dem Stand der Technik gibt es keinen Anwendungsfall für die Reinigung von Gesichtsvideos zur Extraktion von Vitaldaten im medizinischen Umfeld. In dieser Arbeit wird eine stabile und effektive Methode auf der Grundlage von maschinellem Lernen und Techniken zur Gesichtsdetektion für die Bereinigung von Gesichtsvideodaten in diesem speziellen Szenario vorgeschlagen. Zunächst wird für jedes aufgenommene Bild das Gesicht detektiert und mit 478 Landmarken auf der Grundlage des Mediapipe Solution Face Mesh dargestellt. Diese Landmarken werden weiter definiert und als Gesichtsmerkmale ausgewählt. Mit den definierten und ausgewählten Gesichtsmerkmalen kann die Datenauswertbarkeit durch die Einstellung der Schwellenwerte bestimmt werden. In dieser Arbeit wurde maschinelles Lernen integriert, um die traditionelle Schwellenwertmethode für diese binäre Klassifizierung zu ersetzen. Darüber hinaus werden auch Arm- und Handdetektion berücksichtigt, um die Bilder mit typischen Verdeckungen des Gesichts zu bereinigen. Um die Leistung der vorgeschlagenen Methode zu bewerten, wurden 128-stündige Videos von 16 Patienten während des Schlafs mit 15,2-Hz-Bildern aufgenommen. Obwohl die Qualität der Grundwahrheit aufgrund der menschlichen Subjektivität variieren kann, was sich negativ auf das Modelltraining auswirkt, kann die vorgeschlagene Methode bei der Leave-One-Out-Validierung immer noch eine Genauigkeit von über 90 % erreichen.



Sun, Xinyu;
Proof of concept : deep learning based Ratio-of-Ratio analysis for Irritation-Free contactless pulse oximetry. - Ilmenau. - 105 Seiten
Technische Universität Ilmenau, Masterarbeit 2023

Das Verhältnis von gesamtem Hämoglobin (Hb) zur Menge des sauerstoffbindenden Hämoglobins (HbO2) im Blut wird als Sauerstoffsättigung bezeichnet. Während der COVID-19-Pandemie hat sich das Pulsoximeter, das die periphere Sauerstoffsättigung (SpO2) auf kontakthaltige Weise an der Fingerspitze misst, zu einem beliebten Produkt entwickelt. Im Hinblick auf eine bessere Hygiene und Bequemlichkeit können kontaktlose Messmethoden zur langfristigen bewässerungsfreien SpO2-Messung beitragen, wie z.B. die Diagnose und Überwachung von Patienten mit Schlafapnoe. Nach Untersuchungen zum Stand der Technik sind herkömmliche signal- oder bildbasierte Ansätze in der Regel weniger genau. In dieser Arbeit wird ein neuartiger Ansatz vorgeschlagen, um die kontaktlose Messung von SpO2 aus nahinfraroten Multispektralvideos unter Verwendung von Deep Learning zu erreichen. Die dreidimensionalen Convolutional Neural Networks (3D-CNN) werden zur Schätzung von SpO2 direkt aus hyperspektralen Videodaten nach einer Vorverarbeitungsphase eingesetzt, die unter anderem die Korrektur von Schatten, globales Enttrenden und die Normalisierung spektraler Kanäle beinhaltet. Im Experiment wurden mehr als 400 Minuten Videodaten verschiedener Handflächen- positionen von sieben Teilnehmern mit einer infraroten Hyperspektral- kamera mit 25 Kanälen von 690 nm bis 950 nm erfasst. Der tatsächliche SpO2-Wert, der vom Pulsoximeter an der Fingerspitze aufgezeichnet wurde, variierte zwischen 81% und 99%. Mit dem vorgeschlagenen Ansatz kann in verschiedenen Bewertungsszenarien der mittlere absolute Fehler (MAE) der geschätzten SpO2-Werte auf weniger als 2,6% reduziert werden, und der Pearson-Korrelationskoeffizient zwischen geschätzten zeitlichen SpO2-Schwankungen und tatsächlichen Werten einer einzelnen 5-minütigen Messung kann auf über 0,80 ansteigen. Es ist vorstellbar, dass Faktoren wie Hautfarbe, Umgebungs- lichtverhältnisse oder individuelle Handabdrücke zu einer Verschiebung der Domäne zwischen den Test- und Trainingsdaten beitragen können. Trotzdem hat der vorgeschlagene Ansatz in unserem Experiment auch zufriedenstellende Generalisierungsfähigkeiten gezeigt.



Tariq, Muhammad Shakil;
Implementation of a pre-processing data pipeline for multispectral image processing. - Ilmenau. - 92 Seiten
Technische Universität Ilmenau, Masterarbeit 2023

Multispektrale Bildgebung (MSI) kann hochaufgelöste Spektraldaten über einen breiten Bereich von Bändern aufzeichnen und hat sich in vielen Bereichen wie der medizinischen Bildgebung, der Fernerkundung, der Minenerkennung und der militärischen Zielverfolgung als sehr nützlich erwiesen. MSI ist Teil der Spektralbildgebung und kombiniert die Vorteile von Spektral-, Textur- und Forminformationen. Es kann versteckte Informationen in einer Szene aus verschiedenen Spektralbereichen aufdecken und die Systemeffizienz steigern, indem es diese Informationen in Bilderkennungsaufgaben integriert. Die inhärente Natur multispektraler Daten, die durch hohe Dimensionalität und Rechenkomplexität gekennzeichnet sind, stellt jedoch große Herausforderungen für eine effektive Bildverarbeitung und -klassifizierung dar. Unser Ziel ist es, diese Herausforderungen durch die Anwendung und Entwicklung einer innovativen Vorverarbeitungsdatenpipeline zu bewältigen, die auf multispektrale Bilder zugeschnitten ist. Da bestehende Vorverarbeitungspipelines für Bilderkennungsaufgaben Mängel aufweisen, versucht diese Arbeit, die Effizienz und Genauigkeit des Modelltrainings zu verbessern und dabei Algorithmen zur Reduzierung der Dimensionalität zu berücksichtigen. Die Methodik umfasst eine umfassende Überprüfung bestehender Dimensionsreduktionsalgorithmen und die Formulierung einer Kombination von Vorverarbeitungsfunktionen. Damit wird auch das Thema Maschinelles Lernen im Rahmen dieser Arbeit eingeführt. In der theoretischen Diskussion präsentieren wir einen Datensatz, der zum Entwurf und zur Implementierung einer neuen Vorverarbeitungspipeline führt, die modernste Algorithmen zur Dimensionsreduktion enthält. Darüber hinaus wird die Bildklassifizierung als Leistungsbewertung der ausgewählten Vorverarbeitungstechniken angenommen und die ausgewählten Bildklassifizierungsmodelle vorgestellt. In unserem Versuchsaufbau arbeiten wir an der Anwendung dieser Modelle auf vorverarbeitete Daten und präsentieren Ergebnisse in Form einer durchschnittlichen Top-1-Genauigkeit für die Kombination ausgewählter Modelle und Vorverarbeitungsfunktionen an Testdaten. Durch die Bereitstellung eines systematischen Ansatzes zur multispektralen/hyperspektralen Bildvorverarbeitung verbessert diese Studie die Vorverarbeitungsmethoden und trägt dazu bei, das volle Potenzial hyperspektraler Daten in realen Anwendungen auszuschöpfen.



Gundermann, Sina Maria;
Auswertung multimodaler Messdaten eines sensorbasierten Wegerfassungssystems mit den Werkzeugen der Qualitätssicherung. - Ilmenau. - 160 Seiten
Technische Universität Ilmenau, Masterarbeit 2023

Die Vermessung und Digitalisierung von Waldwegen im übergeordneten Projekt erfolgt mit zwei 2D-LIDAR-Sensoren, zwei TOF-Kameras und zwei Stereo-Kameras. Die fusionierte 3D-Punktwolke verfügt über metrische Informationen sowie Infrarot-, Remissions- und Spektralwerte. Das Ziel dieser Arbeit ist die Auswahl und Übertragung einiger klassischer Qualitätssicherungswerkzeuge auf das beschriebene Messprojekt sowie die Ermittlung der optimalen Steuerfaktorkombination der Sensoren für die Vermessung von Waldwegen. Als Referenz für die Beurteilung der metrischen Messdaten dient ein hochgenaues 3D-Lidar-System. Die Analyse des Sensorsystems ist in drei Stufen gegliedert: unter Laborbedingungen, unter Extrembedingungen und unter realen Bedingungen. Die Analyse der Sensoren unter Laborbedingungen erfolgt nach dem Standardablauf einer Messsystemanalyse. Um die optimale Einstellung der Sensoren für die Anwendung auf Waldwegen zu ermitteln, werden zunächst alle potenziellen Steuer- und Störfaktoren ermittelt. Der Einfluss einiger Störfaktoren kann bereits im Vorfeld rein rechnerisch als vernachlässigbar gering eingestuft werden. Die verbleibenden Störfaktoren und deren Einfluss auf das Messergebnis werden unter Extrembedingungen in einem Variablenvergleich analysiert. Mit Hilfe von Versuchsplänen nach Taguchi werden anschließend die Steuerfaktoren der Sensoren unter realen Bedingungen untersucht, um die Steuerfaktorkombination zu ermitteln, bei der die Störfaktoren den geringsten Einfluss auf das Messergebnis haben.



Implementation of an algorithm for determining the mass percentage of bulk solids based on 2D image and 3D height profile data as well as specific density. - Ilmenau. - 71 Seiten
Technische Universität Ilmenau, Masterarbeit 2023

In der industriellen Qualität spielt die Analyse und Klassifizierung von Schüttgütern eine wichtige Rolle sowohl in der Lebensmittelindustrie als auch im Bauwesen und Recycling. Zum Beispiel ist die automatisierte Analyse von Gesteinen für die Verwendung als Zuschlagstoffe im Beton unerlässlich, um zukünftige Zerstörungen durch reaktive Gesteine in Form von Alkali-Silica-Reaktion zu verhindern. Diese Arbeit zielt darauf ab, durch einen Algorithmus die Masse jedes Gesteinstyps, der als Zuschlagstoffe verwendet wird, zu schätzen, um ihre Qualität im Beton zu kontrollieren, indem mehrere Proben untersucht werden. Dazu werden Daten verwendet, die mit einem 3D-Laserlinienscanner und einer Präzisionswaage erfasst wurden, um die geschätzten Massenergebnisse jedes Gesteinstyps mit ihrer tatsächlichen Masse zu vergleichen.



Entwicklung, Aufbau und Evaluierung der Steuerungselektronik und -software für ein hyperspektrales Beleuchtungssystem. - Ilmenau. - 93 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2023

Bei der Steinbeis Qualitätssicherung und Bildverarbeitung GmbH wird im Rahmen des Forschungsprojekts "HyPetro" die VIS- und NIR-hyperspektrale Beleuchtung für ein hyperspektrales Bildverarbeitungssystem entwickelt. Diese Arbeit befasst sich mit der Entwicklung der Steuerungselektronik und -software für die NIR-hyperspektrale Beleuchtung. In den ersten Kapiteln werden Grundlagen über verschiedene Leuchtmittel behandelt sowie auf verschiedenen Beleuchtungsstrategien, die in der Bildverarbeitung zum Einsatz kommen, eingegangen. Es werden eine Anforderungsliste und Funktionstruktur erstellt, anhand derer die Komponenten für die Steuerungselektronik ausgewählt werden. Darauf folgt der Entwurf von Leiterplatten, um die Komponenten elektronisch miteinander zu verbinden und die Steuerungssoftware geschrieben. Als Grundlage für die Software wird ein Programmablaufplan erstellt. Ein erstes Funktionsmuster der Beleuchtung wird aufgebaut, mit welchem die Funktionalität der Steuerung und die technischen Parameter im Betrieb der Beleuchtung überprüft werden.



Krause, Leon ;
Entwicklung eines Konzeptes für einen Mikrotiterplatten-Reader. - Ilmenau. - 116 Seiten
Technische Universität Ilmenau, Masterarbeit 2023

Im Rahmen dieser Masterarbeit wird in Zusammenarbeit mit dem Unternehmen Steinbeis Qualitätssicherung und Bildverarbeitung GmbH ein Konzept für einen Mikrotiterplatten-Reader mit Digitalkamera entwickelt. Mikrotiterplatten-Reader sind in der Medizintechnik eingesetzte Laborgeräte, welche die Auswertung verschiedenster medizinischer Nachweisreaktionen mittels Bildverarbeitung ermöglichen. Die Konzeptentwicklung beinhaltet theoretische und experimentelle Untersuchungen, auf deren Grundlage das Bildverarbeitungssystem entworfen wird. Es werden sich grundlegend unterscheidende Anordnungskonzepte mit einer und mehreren Kameras sowie verschiedenen Beleuchtungssystemen untersucht. Dabei wird festgestellt, dass der Einsatz von Low-Cost-Bildverarbeitungskomponenten ein vielversprechender Ansatz für die Neuentwicklung eines Lesegeräts für Mikrotiterplatten ist. Weiterhin wird geprüft, ob die Verwendung eines Multi-Kamera-Systems zweckmäßig ist. Die Arbeit zeigt, dass der Einsatz mehrerer in einer Reihe angeordneter Kameras funktionserfüllend ist, zugleich aber kaum Vorteile gegenüber einer Einzelkameraanwendung hat. Im Rahmen dieser Masterarbeit wird schließlich ein aus einer Kamera bestehendes Low-Cost-Bildverarbeitungssystem mit Auf- und Durchlicht ausgewählt. Weiterhin beinhaltet die Konzeptentwicklung die Auslegung des 3-Achs-Positioniersystems. Dazu werden Lösungsprinzipe zur Umsetzung der Relativbewegung zwischen der Mikrotiterplatte und der Kamera erarbeitet und bewertet. Nach der Auswahl eines Positioniersystems werden die mechanischen und elektronischen Komponenten dimensioniert. Schlussendlich stehen ein CAD-Modell und ein Schaltplan zur Verfügung. Die Ergebnisse dieser Arbeit bilden die Grundlage zur Entwicklung eines funktionsfähigen Prototyps. Dieser wird ein erster Schritt hin zur Entwicklung eines serienreifen Mikrotiterplatten-Readers sein.



Entwicklung einer intelligenten Erkennungsroutine für Hyperspektralbilder unter Verwendung von klassischen, auf Bildmerkmalen trainierten Machine-Learning-Algorithmen. - Ilmenau. - 92 Seiten
Technische Universität Ilmenau, Masterarbeit 2022

Diese Arbeit beschäftigt sich mit grundlegenden Untersuchungen im Bereich der hyperspektralen Bildgebung. Als Grundlage diente ein Hyperspektraldatensatz verschiedener Gesteinskörnungen, bei denen sich die Klassen hinsichtlich ihrer Eignung für die Betonherstellung unterscheiden und deshalb bestmöglich mittels maschinellen Lernverfahren klassifiziert werden sollen. Für die Optimierung des Klassifikationsprozesses wurde eine lineare Diskriminanzanalyse als Dimensionsreduktionsverfahren sowie Bandselektionsverfahren untersucht, welche relevante Spektralkanäle des Hyperspektralkubus bestimmen sollen. Für die Klassifikation kam ein auf Form-, Farb- und Texturmerkmalen trainierter Random-Forest-Klassifikator zur Anwendung. Die Berechnung der Bildmerkmale erfolgte auf Basis der ortsaufgelösten Bilder ausgewählter Spektralbänder. Darüber hinaus wurden einzelne Punktspektren des Datensatzes klassifiziert, sowie das Deep-Learning-Modell ResNet-50 auf dimensionsreduzierte Bilder angewandt. Im Rahmen der Untersuchungen ermöglichte keine der betrachteten Klassifikationsmethoden allein, den Datensatz mit einer Erkennungsrate von über 99% hinreichend genau zu klassifizieren. Es erwies sich jedoch eine Kombination von Klassifikationsmodellen auf Entscheidungsebene sowie auf Merkmalsebene als sinnvoll. So brachte eine Kombination der Bildmerkmale, die einerseits auf Spektralkanälen des Hyperspektralkubus und anderseits auf dimensionsreduzierten 3-Kanalbildern berechnet wurden, die höchsten Erkennungsraten. Dabei führte eine höhere Anzahl an genutzten Spektralbändern stets zu höheren Erkennungsraten, während eine Erhöhung der berechneten Bildmerkmale nicht immer zu einer Verbesserung des Klassifikationsergebnisses führte. Embedded Merkmalsselektionsverfahren konnten erfolgreich charakteristische Spektralbänder des Datensatzes ermitteln. Aufgrund der geringen Interklassenvariabilität des Datensatzes sind die ermittelten Kanäle verschiedener Klassen jedoch oft identisch. Bei einer Klassifikation auf Basis von Punktspektren ist ein möglichst großer Spektralbereich von Vorteil. Für weitere Untersuchungen bietet sich eine Kombination aus klassischen Klassifikatormodellen auf Basis von Bildmerkmalen und Punktspektren, sowie die Nutzung von Deep-Learning-Modellen an.