Theses and projects

The group offers numerous topics for bachelor and master theses. Currently advertised topics

You can also contact ourstaff members with your own topic. Below is a list of completed, supervised theses in the department. In many cases the topics are still relevant. So please do not hesitate to contact us if you find topics of interest to you.

Completed Bachelor theses

Anzahl der Treffer: 127
Erstellt: Thu, 28 Mar 2024 23:02:48 +0100 in 0.0557 sec


Häuser, Franz;
Entwicklung eines Applikation-Frameworks für die Lärmmessung & Lärmbewertung. - 62 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

In dieser Bachelorarbeit wird ein Mess-Framework in Form einer Web-Applikation für Smart-Devices entwickelt, welche die subjektive Bewertung von Umgebungsgeräuschen in Verbindung mit der Erhebung von Metadaten wie Standort, Datum und Uhrzeit ermöglicht. Lärm schädigt Mensch und Tier. Für eine erfolgreiche Prävention ist das Verstehen der subjektiven Wahrnehmung von Geräuschen von zentraler Bedeutung. Die Betrachtung subjektiver Bewertungen in Verbindung mit objektiven Messungen ermöglicht es eventuell Prognosen zu objektiv gemessenen Schallereignissen über die subjektive Bewertung anzustellen. In dieser Bachelorarbeit wird mit diesem Ansatz ein Werkzeug entwickelt, welches eine solche subjektive Bewertung ermöglicht. Um den korrelativen Zusammenhang zukünftig überprüfen zu können wird ebenfalls Standort und Zeit der Aufnahme festgehalten. Zunächst werden Grundlagen der auditiven Wahrnehmung, der Lärmwahrnehmung, psychoakustischer Parameter sowie der Stand der Technik recherchiert. Es folgt die Konzeption der Applikation und ihrer einzelnen Module sowie die Umsetzung dieser.



Steger, Robert;
Weiterentwicklung und Evaluation von Verfahren zur Detektion visueller Fehler an kontrastreichen Kanten. - 119 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Diese Arbeit beschäftigt sich mit der Weiterentwicklung von Detektionsverfahren für visuelle Fehler, die in Bildern und Videos an kontrastreichen Kanten auftreten. Sowohl in der Literatur als auch in bereits existierenden Verfahren kam es vor, dass die Fehler Halo und Ringing verwechselt, bzw. als ein Fehler betrachtet wurden. Da sich die Fehler jedoch in Erscheinungsbild und Ursache voneinander unterscheiden, ist es im Zuge einer erfolgreichen Detektion nötig, sie voneinander zu trennen. Die beiden Artefakte wurden zunächst hinsichtlich ihrer Eigenschaften und damit Gemeinsamkeiten und Unterschiede analysiert. Zu diesem Zweck wurden die beiden Fehler hinsichtlich ihres Erscheinungsbildes und ihrer Ursachen untersucht und sowohl in Theorie als auch in Praxis miteinander verglichen. Analysiert wurden die Codecs H.262, H.264, H.265, JPEG und JPEG2000. Um das Ringing untersuchen zu können, ohne dass es von anderen Fehlern überlagert wird, wurde ein Verfahren zur künstlichen Generierung von Ringing in seiner Reinform entwickelt. Halo kann mithilfe von Schärfungsoperatoren erzeugt werden. Des Weiteren wurde für jeden Fehler ein spezifischer Detektionsalgorithmus konzipiert und implementiert, der in der Lage ist, den Fehler mithilfe einer pixelbasierten Detektionsmethode zu erkennen. Die Algorithmen bestehen aus zwei Teilen. Zuerst werden die Kanten heraus gefiltert, an denen die Fehler auftreten können, und anschließend wird das Artefakt anhand seines individuellen Musters gesucht. Diese Algorithmen wurden hinsichtlich ihrer erfolgreichen Detektion mithilfe von Probandentests evaluiert, und die Ergebnisse wurden mit bereits existierenden Verfahren zur Ringingdetektion abgeglichen, um zu ermitteln, ob eine Weiterentwicklung erfolgreich war. Herausgefunden wurde, dass sich die Codecs in der Praxis hinsichtlich des zu erwartenden Ringings stark unterscheiden. Für Bildcodecs kann die Detektion deutlich bessere Werte liefern als sein Vorgänger. Die Detektion von Videocodecs erweist sich als schwierig, weshalb auch die Ergebnisse des Algorithmus ungenügend sind. Der erste Teil, die Filterung der relevanten Kanten, liefert für beide Fehler gute Ergebnisse, der zweite Teil, die Detektion des Musters, ist in der Praxis allerdings nur für Halo anwendbar.



Schaller, Lukas;
Entwicklung und Evaluation von Verfahren zur Klassifikation von akustischen Szenen. - 59 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Die vorliegende Bachelorarbeit befasst sich mit dem Thema der automatischen Klassifizierung und Analyse von akustischen Szenen. Geräusche aus der Umwelt und dem innerstädtischen Bereich sollen mithilfe von geeigneten Methoden beschrieben und anschließend klassifiziert werden. Als Grundlage für alle im Rahmen dieser Arbeit durchgeführten Experimente, dient der öffentlich zugänglichen Datensatz Urban-Sound8k der New York University, welcher über 8000 kurze Audioaufnahmen von zehn verschiedenen Szenenklassen bereitstellt. Im Mittelpunkt der Arbeit steht die Zusammenstellung eines geeigneten Merkmalsraums zur Beschreibung spektraler und temporaler Eigenschaften der Szenen. Dafür wurden einige vielversprechende, aktuell verwendete Merkmale nachimplementiert. Diese werden einzeln und in Kombination mit anderen Audiomerkmalen evaluiert, um das am besten funktionierende System zu ermitteln. Anschließend wird versucht, mithilfe einer Filterung von stillen Signalblöcken und der Wahl eines geeigneten Klassifikationsverfahren die Ergebnisse zu optimieren.



Krämmer, Christopher;
Entwicklung und Evaluation von Verfahren zur Detektion von Banding-Artefakten in Videodaten. - 68 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Im Rahmen der vorliegenden Abschlussarbeit wird Banding, ein Bildfehler welcher bei der Quantisierung von Pixelwerten oder bei der blockweisen Transformation entsteht, genauer untersucht. Bestehende Ansätze zur Detektion werden aufgegriffen und mit dem Ziel der möglichst präzisen Lokalisierung der Band-Artefakte verbessert. Um die verschiedenen Algorithmen miteinander zu vergleichen, erfolgt eine Evaluation unter der Berücksichtigung grundlegender Eigenschaften der visuellen Wahrnehmung des Menschen. Als Ausgangsmaterial dienen speziell für die Evaluation von Banding entworfene Testbilder, deren Referenzdaten durch ein Modell erzeugt werden.



Zapf, Dominik;
Polyphonic pitch detection with deep learning techniques. - 60 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

In dieser Arbeit wurde ein System zur polyphonen Tonhöhenerkennung entwickelt, das Techniken des Deep Learnings nutzt, d.h. künstliche neuronale Netzwerke und Mengen von Audiodaten mit vorhandener Annotation der Tonhöhen. Verwendet wurde ein Feedforward Neural Network, dessen Parameter und Architektur durch Experimente bestimmt wurde. Zusätzlich wurden Methoden angewandt, die in anderen Arbeiten bereits zu einer Verbesserung der Tonhöhenerkennung führen konnten. Dies waren künstliche Datenvergrößerung durch Pitch Shifting, das Verwenden von Dropout zur Regularisierung und das Verwenden einer logarithmischen Frequenzachse. Trainiert und getestet wurden in unterschiedlichen Kombinationen auf dem Su-Datensatz des MIREX, dem MAPS-Datensatz und einem Datensatz namens SMT\_GUITAR, bestehend aus Gitarrenaufnahmen, aufgenommen am Fraunhofer IDMT. Es konnten gute Ergebnisse für das SMT\_GUITAR-Datenset erzielt werden, während die Ergebnisse für das MAPS-Datenset und das Su-Datenset deutlich schlechter ausfielen. Mit Pitch Shifting konnten die Ergebnisse beim Su-Datenset verbessert werden. Dropout führte zu deutlich schlechteren Ergebnissen und das Logarithmieren der Frequenzachse führte zu keinem nennenswerten Unterschied. Auch ein Rekurrentes Neuronales Netzwerk wurde getestet in Form eines LSTM-Netzwerks (Long Short Term Memory). Dabei fielen die Erkennungsgenauigkeiten sehr niedrig aus. Verglichen wurden die Ergebnisse mit denen des MIREX. Während die Präzision mit den eingeschickten Ergebnissen mithalten konnte, fiel das Recall hinter den meisten Methoden zurück.



Götz, Georg;
Untersuchung zum Einfluss von Head-Tracking auf die Externalisierung von Hörereignissen bei Divergenz zwischen synthetisierter Szene und Abhörraum unter Verwendung eines binauralen Kopfhörersystems. - 72 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Mit Hilfe der Binauralsynthese ist es möglich, eine auditive Szene zu reproduzieren und dabei einen authentischen räumlichen Höreindruck zu gewährleisten. Durch das Personalisieren des Systems und die Verwendung von Head-Tracking zum Ausgleich der Kopfbewegung des Rezipienten in Form einer dynamischen Binauralsynthese, ist eine nahezu exakte Annäherung an eine natürliche Hörsituation trotz Kopfhörerwiedergabe möglich. Falls die wiederzugebende Szene perzeptiv vom Abhörraum abweicht (Raumdivergenz), kommt es allerdings zu Beeinträchtigungen des räumlichen Höreindrucks. Die Externalisierung von Hörereignissen wird gestört und es kommt häufiger zur Im-Kopf-Lokalisation. Bisherige Forschungsergebnisse zeigen, dass durch eine dynamischen Binauralsynthese Vorne-Hinten-Vertauschungen aufgelöst werden können. Der Einfluss von Head-Tracking auf die Externalisierung von Hörereignissen ist allerdings noch nicht eindeutig geklärt. In dieser Arbeit wurde deshalb der Einfluss von Head-Tracking auf die Externalisierung von Hörereignissen mit einem binauralen Kopfhörersystem untersucht. Dabei wurde sowohl eine konvergente als auch eine divergente Abhörsituation betrachtet. Ein Hörtest wurde mit dem kommerziellen Binauralsynthesesystem Smyth Realiser A8 durchgeführt. Es konnte gezeigt werden, dass die Verwendung von Head-Tracking während einer Kopfdrehung die externalisierte Wahrnehmung für ausgewählte Schalleinfallsrichtungen verbessern kann. Der Effekt der Raumdivergenz konnte dabei allerdings nicht vollständig aufgelöst werden. Der gewonnene Datensatz legt nahe, dass Adaptionseffekte bei der Verwendung von Head-Tracking während einer Kopfbewegung eine Rolle spielen. Weiterhin wurde beobachtet, dass die Kopfdrehung für verschiedene Probanden unterschiedliche Einflüsse auf die Externalisierung hatte.



Hagedorn, Josua;
Untersuchungen zur Effzienz digital angesteuerter Lautsprecher-Arrays. - 87 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Die Ansteuerung von Array-Lautsprechern mit digitalen Signalen ist ein möglicher Ansatz zur direkten Schallwandlung von der digitalen in die akustische Domäne und Gegenstand aktueller Forschungen auf dem Gebiet der Lautsprechertechnologie. Dieses Prinzip ermöglicht nicht nur eine direkte Digital-Analog-Wandlung, sondern auch eine potentielle Effizienzsteigerung. So könnten ineffiziente analoge Lautsprecher in naher Zukunft durch digital angesteuerte Array-Lautsprecher ersetzt werden. In dieser Arbeit wird das Funktionsprinzip dieses Konzeptes vorgestellt und untersucht. Dabei werden verschiedene Ansteuerungsmethoden präsentiert und auf die Anforderungen und Probleme eingegangen. Im praktischen Teil wurde ein Array aus sieben Wandlern untersucht, welches mit 3-Bit PCM-Signalen angesteuert wurde. Dabei stand vor allem der Effizienzvergleich zwischen digitaler und analoger Ansteuerung im Fokus. Außerdem wurde auf die Rekonstruktionsqualität des digital-angesteuerten Arrays eingegangen, da bei der digitalen akustischen Rekonstruktion ein hoher Wert an harmonischen Verzerrungen auftritt. Da diese u.a. durch die Gangunterschiede zwischen den einzelnen Array-Elementen hervorgerufen werden, wurde eine Methode zur Kom- pensation des Zeitversatzes implementiert. Dadurch konnte eine Verbesserung der harmonischen Verzerrungen für einen bestimmten Hörort erzielt werden. Der Array-Lautsprecher wurde mit dem Simulationsprogramm COMSOL Multiphysics auf Basis von elektrodynamischen Wandlern simuliert. Untersucht wurde die harmonische Anregung bei Frequenzen von 500Hz, 1kHz und 10 kHz. In der hier getätigten Untersuchungen konnte gezeigt werden, dass es grundsätzlich möglich ist, eine direkte akustische Signalrekonstruktion mit der digitalen Ansteuerung von Array-Lautsprechern zu realisieren. Allerdings konnte die erwartete Effizienzsteigerung nicht erzielt werden. Die digitale Ansteuerung schnitt, im Vergleich zur Analogen, bei allen drei Anregungsfrequenzen zwischen 5 dB und 10 dB schlechter ab. Auch die Werte der harmonischen Verzerrungen sind selbst durch eine Korrektur der Laufzeiten, verglichen mit dem aktuellen Stand der konventionellen Lautsprecher, noch zu hoch. Es konnte gezeigt werden, dass sich durch eine Erhöhung der Auflösung eine Verbesserung der Rekontruktionsqualität einstellt. Der Ansatz eines digital angesteuerten Array- Lautsprechers könnte eine Alternative zu konventionellen Lautsprechern werden, wenn zukünftige Technologien die Ansteuerungsmethoden, Erhöhung der Array-Elementezahl und deren akustisches Verhalten optimieren.



Heydrich, Eric;
Konzeption und Implementierung einer Learning-Analytics-Komponente für das E-Assessment-System askMe!. - 54 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Das Ziel der vorliegenden Arbeit war es, eine Learning Analytics-Komponente für das E-Assessment System askMe! zu konzeptionieren und danach in das bestehende System zu implementieren. Dafür wurden gängige webbasierte Technologien verwendet um Daten zu erfassen, diese zu verarbeiten und dann für eine grafische Darstellung bereitzustellen. Für die Erfassung der Daten während des Testvorgangs werden Experience-API-Statements (xAPI) an einen Learning Record Store übertragen und dort gespeichert. Diese Daten werden dann von askMe! ausgelesen, verarbeitet und in einem kombinierten Objekt zusammengefasst, welches an eine View weitergegeben wird. Aus diesem Objekt werden die Daten für die Darstellung der Diagramme bezogen. In der View werden dann die Struktur und die Logik für die Anzeige der Diagramme definiert. Aus dem gegebenen Daten sollen mit Hilfe der Waikato Environment for Knowledge Analysis (Weka), einer Sammlung von Algorithmen für das maschinelles Lernen zur Umsetzung von Data Mining-Aufgaben, Vorhersagen über eventuelle Ergebnisse getroffen oder Klassifizierungen gemacht werden.



Löhner, Andreas;
Implementierung eines Verfahrens zur Überblendung zwischen Raumimpulsantworten zweier verschiedener Räume zur Verwendung in einem Binauralsynthesesystem. - 67 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Mit der Binauraltechnik sind wir in der Lage, die akustischen Eigenschaften eines Raumes, sowie die exakte Position von Schallquellen in diesem Raum aufzunehmen und einem Hörer realitätsgetreu wiederzugeben. Weiter eröffnet sich mit dem detaillierten akustischen Abbildungsmodell durch binauraler Raumimpulsantworten ((BRIR-binaural room impule response) die Möglichkeit, virtuell, beliebige Quellen, an beliebige Positionen relativ zum Hörer, in beliebige Räumen zu setzen. BRIRs sind kopfbezogene Raumimpulsantworten, getrennt für das linke und rechte Ohr. Bei hinreichender Genauigkeit des Modells entsteht eine akustische Bühne, die in Ihrem Erscheinungsbild der tatsächlichen Hörsituation in nichts nachsteht. Die nachfolgende Arbeit befasst sich zunächst mit einer kurzen Erklärung der Mechanismen des räumlichen Hörens. Das Hauptaugenmerk dieser Arbeit liegt in der Synthese von virtuellen Zwischenräumen zwischen zwei BRIRs. Im Gegensatz zu vorangegangenen Arbeiten, die sich schwerpunktmäßig mit der Interpolation verschiedener Schallquelle - Hörer Anordnungen befassten, liegt in dieser Arbeit der Fokus auf der Interpolation von Rauminformationen zwischen einer Start- und Ziel-BRIR. Das Ergebnis soll darin bestehen, dem Hörer eine interaktive Möglichkeit zu geben zwischen den raumakustischen Modellen zweier Räume, kodiert in den jeweiligen BRIRs für eine in beiden Räumen identische Schallquelle - Hörer Anordnung, nach Belieben zu wechseln. Zu diesem Zweck findet zuerst die Auswahl eines für diese Aufgabenstellung geeigneten Überblendverfahrens statt. Mit diesem Verfahren werden neue Zwischenräume synthetisiert, die anschließend in ein VST-Plugin, das bereits in früheren Versuchen Anwendung beim Wechsel zwischen verschiedenen Schallquelle - Hörer Anordnungen fand, integriert werden. Dieses Plugin ist in der Lage, in nahezu Echtzeit eine Faltung zwischen einem Stimulussignal und einer BRIR zu berechnen. Eine Simulation dieses Signals wird in dem Raum erzeugt, der in der BRIR kodiert ist. Weiterhin findet eine qualitative Analyse der synthetisierten Zwischen-BRIRs statt, die um einen kleinen Hörtest ergänzt wird, in dem der Wiedererkennungswert der originalen BRIRs im realen Aufnahmeraum in Relation zu den erzeugten Zwischenräumen untersucht wird.



Krüger, Tobias;
3D-Blickrichtungsschätzung. - 59 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Ziel und Thema der Arbeit ist es, ein bestehendes Verfahren zur Bestimmung der Kopfposition im Raum um ein Augenmodell zu erweitern. Durch die Kombination des Augenmodells mit einem Kopfmodell können die Informationen über Rotation und Lage des Kopfes dazu dienen, um genauere Blickrichtungen zu erzielen. In der Arbeit wird die Kopfpose mittels POSIT bestimmt, welches in der Lage ist, die Position jedes beliebigen Objektes im dreidimensionalen Raum zu bestimmten. Damit POSIT die Rotation und Translation eines Kopfes relativ zur Kamera berechnen kann, benötigt es ein Kopfmodell. Da das zu entwerfende System kalibrationsfrei arbeiten und trotzdem einen großen Anwendungsbereich bieten soll, empfiehlt sich das Anthropometrische Kopfmodell, was einen "Durchschnittskopf" repräsentiert. So kann die Pose eines in der Bildebene gelabelten Gesichtes mithilfe von POSIT und dem Anthropometrischen Kopfmodell bestimmt werden. Für das Augenmodell werden die in der Bildebene gelabelten Augenmerkmals-punkte mithilfe der der Projektionsmatrix und der vom POSIT ausgegebenen Transformationsmatrix zurück in das dreidimensionale Kopfmodell projiziert. Diese rückprojizierten Augenpunkte ersetzen die Augenpunkte des Anthropometrischen Kopfmodells. Damit die Gaze berechnet werden kann, benötigt das Augenmodell die 3D-Informationen von Augapfelmittelpunkt und Pupillenmittelpunkt sowie den Augenradius. Ersteres wird durch den geometrischen Flächenschwerpunkt bestimmt. Bei Tests basierend auf synthetisch erzeugten Daten konnte der entwickelte Ansatz überzeugen. Bei anschließenden praxisnahen Versuchen zeigten sich akzeptable Ergebnisse, der entwickelte Ansatz bedarf jedoch noch Anpassungen bzw. Verbesserungen, um Schwächen bei der Gaze-Bestimmung zu eliminieren.