Abschluss- und Projektarbeiten

Das Fachgebiet bietet zahlreiche Themen für Bachelor- und Masterarbeiten an. Aktuell ausgeschriebene Themen

Sie können sich auch mit einem eigenen Thema an unsere Mitarbeiter:innen wenden. Nachstehend sind im Fachgebiet abgeschlossene, betreute Abschlussarbeiten aufgelistet. In vielen Fällen sind die Themen immernoch relevant. Zögern Sie also nicht mit uns in Kontakt zu treten, wenn  Sie dort für Sie interessant Themen finden.

Abgeschlossene Masterarbeiten
Anzahl der Treffer: 129
Erstellt: Fri, 19 Apr 2024 23:03:40 +0200 in 0.0574 sec


Bönsel, Carsten;
Development and implementation of a method for automatic best-take detection in monophonic vocal and guitar recordings. - 138 S. : Ilmenau, Techn. Univ., Masterarbeit, 2015

Die vorliegende Forschungsarbeit ist ein erster Versuch, die Qualität einer musikalischen Darbietung bei Studioaufnahmen automatisch zu schätzen. Das primäre Ziel ist es, einen Algorithmus zur Detektion des besten Takes zu entwickeln. Die Aufgabenstellung ist auf monophone Tonfolgen von E-Gitarre und Gesang in U-Musik eingegrenzt. Analysierte musikalische Bereiche umfassen Rhythmus und Tonhöhe. Im Gegensatz zu bisherigen Arbeiten ist die tatsächlich gespielte Melodie unbekannt und kann daher für die Bewertung nicht einbezogen werden. Stattdessen stehen jeweils ein synchronisierter Klick-Track und ein Backing-Track als Referenz zur Verfügung. Vier professionelle Toningenieure dienten in einer Vorstudie als Interviewpartner. Darüber hinaus wurde für diese Studie ein spezieller Datensatz zusammengestellt, um den verwendeten Ansatz zu trainieren und zu evaluieren. Hierfür wurden zwei Gruppen von Musikern gebildet (jede aus fünf Gitarristen bzw. Sängern bestehend), um geeignete Audio-Sequenzen aufzunehmen und zu annotieren. Timing- und Intonations-Features werden von Tempogramm- und Chromagramm-Repräsentationen abgeleitet, bzw. aus den Informationen einer automatisch ausgeführten Melodie-Transkription berechnet. Die meisten implementierten Features nutzen entweder Quantisierungs-Kosten-Funktionen oder Histogramm-basierte Zusammenhänge. Verschiedene maschinelle Lernverfahren für die Klassifikation des besten Takes und das Bilden einer Rangliste werden für die finale musikalische Qualitäts-Prädiktion angewendet.



Spandel, Matthias;
Implementierung, Anpassung und Evaluierung eines Teilmodells des menschlichen Gehörs für die Anwendung in Cochlea-Implantaten. - 104 S. Ilmenau : Techn. Univ., Masterarbeit, 2014

Cochlea-Implantate (CI) sind elektronische Reizprothesen, die der teilweisen Wiederherstellung des Hörvermögens von Menschen mit hochgradiger Hörschädigung dienen. Ein Ziel der gegenwärtigen CI-Forschung ist es, das Hören in komplexen Geräuschkulissen und von Musik zu verbessern. Am Fraunhofer-Institut für Digitale Medientechnologie wurde zu diesem Zweck eine Signalverarbeitungsstrategie für Cochlea-Implantate namens SAM (Stimulation based on Auditory Modeling) entwickelt. Diese verwendet zur Nachbildung der cochleären Schallverarbeitung ein komplexes auditorisches Gehörmodell. Ein Teilmodell des auditorischen Gehörmodells beschreibt die Funktionsweise der Basilarmembran (BM), die für die Spektralanalyse des menschlichen Gehörs verantwortlich ist. Da das aktuell verwendete BM-Modell den rechenaufwendigsten Teil des Gesamtsystems darstellt, soll es durch ein einfacheres ersetzt werden. Im Rahmen dieser Arbeit wurde untersucht, ob die Rechenkomplexität der SAM-Strategie durch die Integration eines effizienteren auditorischen Teilmodells bei gleichzeitigem Erhalt der psychoakustischen Eigenschaften reduziert werden kann. Dazu wurde ein auditorisches Teilmodell nach Meddis und Lopez-Poveda implementiert, das die Schallverarbeitung des menschlichen Gehörs, beginnend beim Außenohr bis zur Verarbeitung durch die Basilarmembran, nachmodelliert. Hauptbestandteil des auditorischen Teilmodells ist eine sogenannte DRNL-Filterbank. Nach der Implementierung des DRNL-Filtermodells wurde dieses in die SAM-Strategie integriert und an das bestehende auditorische Teilmodell angeglichen. Durch Letzteres sollte eine Veränderung der Stimulationsmuster bei der Verwendung des DRNL-Filtermodells in der SAM-Strategie vermieden werden. Dazu erfolgte zunächst ein Vergleich der beiden auditorischen Teilmodelle anhand verschiedener Modellcharakteristiken. Hierbei wurden zum Teil große Unterschiede festgestellt, sodass eine Anpassung des neu integrierten DRNL-Filtermodells durchgeführt wurde. Die Anpassung erfolgte über die Modifikation von geeigneten Parametern der DRNL-Filter sowie durch selbst entwickelte und implementierte Methoden. Durch Evaluierungstests wurde nachgewiesen, dass die Rechenzeit der SAM-Strategie durch die Integration des DRNL-Filtermodells reduziert werden konnte und ein Erhalt der psychoakustischen Eigenschaften durch die Modellanpassung gewährleistet wird. Abschließend wurden Empfehlungen über weiterführende Untersuchungen gegeben und Arbeitsschritte aufgezeigt, durch die eine weitere Reduzierung der Rechenkomplexität der SAM-Strategie erreicht werden könnte.



Schubert, Markus;
Entwicklung eines Hörtests zur Prosodiewahrnehmnung als Diagnosetool in der Rehabilitation nach Versorgung mit einem Cochlea-Implantat. - 54 S. Ilmenau : Techn. Univ., Masterarbeit, 2014

In der vorliegenden Masterarbeit wird ein Hörtest für Träger von Cochleaimplantaten entwickelt. Mit diesem kann die Unterscheidungsschwelle von Tonhöhenunterschieden bestimmt werden. Den Probanden werden dabei vorher aufgezeichnete Sätze präsentiert, die im Test mit einem adaptiven Verfahren modifiziert werden. Die Implementierung des Hörtests erfolgt in C++ und bietet eine benutzerfreundliche grafische Oberfläche. So kann er in Zukunft in der Rehabilitation von CI-Patienten als Diagnosetool Anwendung finden oder zur Evaluation verschiedener Signalverarbeitungsstrategien von CI-Prozessoren dienen. In einem abschließenden Hörtest mit CI-Trägern wird der Test evaluiert.



Clauß, Tobias;
Entwicklung eines emotionsbasierten Lärmemissionstest zum Beispiel der Geräuschbewertung von hydraulischen Bauteilen. - 120 S. Ilmenau : Techn. Univ., Masterarbeit, 2014

In dieser Masterarbeit ist eine Erhebungsmethode entwickelt, mit welcher ein Vokabular zur Beschreibung der Wahrnehmung von Hydraulikgeräuschen generiert und evaluiert ist. Die permanente Lärmbelastung ist eine immer häufiger indizierte Ursache für viele Krankheiten. Eine gezielte Gestaltung und Regulierung von Schallen kann helfen, der Lärmbelästigung vorzubeugen. Für diese gezielte Kontrolle ist das Wissen um die subjektive Wahrnehmung von Schallen eine elementare Grundlage. Aus dieser Sicht heraus beschreibt die Masterarbeit eine exemplarische Entwicklung einer Erhebungsmethode zur Beschreibung der Wahrnehmung von Geräuschen. Durch Probandentests ist ein Vokabular zur emotionalen und wahrnehmungsbezogenen Beschreibung von Hydraulikgeräuschen generiert. Hierzu sind zunächst die Grundlagen der Wahrnehmungs- und Emotionsforschung, der aktuelle Stand der Technik sowie medientechnologsiche Systementwicklungsmethoden erarbeitet. Darüber hinaus sind die im Probandentest verwendeten Hydraulikgeräusche einer Analyse der psychoakustischen Einflussparameter unterzogen. Eine Korrelation des subjektiven Vokabulars zur Beschreibung dieser Geräusche mit der objektiven psychoakustischen Audioanalyse ist untersucht. Außerdem ist eine Korrelation der Probandenbewertungen mit den psychoakustischen Einflussparametern beleuchtet. Die Probandenbewertungen unterscheiden sich vor allen Dingen zwischen den einzelnen präsentierten Geräuschklassen. Auch mit der psychoakustischen Audioanalyse ist hier eine Differenzierung möglich. Abschließend sind sowohl die entwickelte Methode als auch das generierte Vokabular evaluiert. Um mit dieser Masterarbeit Anstoß zu weiteren Forschungsarbeiten geben zu können, ist zudem das Potential für weitere Forschungen aufgezeigt.



Reiter, Carlo;
Entwicklung und Evaluation von Verfahren zur Detektion von Videofehlern in Magnetbandaufzeichnungen. - 98 S. Ilmenau : Techn. Univ., Masterarbeit, 2014

Zur Aufzeichnung von Videomaterialien kommen seit vielen Jahrzehnten Magnetbänder zum Einsatz. Trotz der fortschreitenden Verwendung bandloser Workflows bleiben insbesondere digitale Magnetbänder noch einige Jahre in Verwendung. Im Broadcast-Bereich ist die Qualität der Videomaterialien ausschlaggebend für deren Verwendbarkeit und somit von hoher Bedeutung. Die hohe Menge an visuellen Materialien verlangt eine automatische und zuverlässige Qualitätskontrolle. Das Fraunhofer Institut für Digitale Medientechnologien entwickelt Komponenten zur Analyse von audiovisuellen Daten. Ein Schwerpunkt liegt dabei bei der Detektion von visuellen Fehlern, wie bspw. Kodierartefakte. In dieser Masterarbeit wird ein Algorithmus zur magnetbandspezifischen Blockingdetektion vorgeschlagen. Zunächst wird ein Überblick über visuelle Fehler gegeben, die von Magnetbändern stammen. Dazu werden zunächst die grundlegenden Prinzipien von Videomagnetbandsystemen beschrieben und beispielhaft Formate, sowie deren Bedeutung erläutert. Anschließend werden typische Fehler von analogen und digitalen Formaten, sowie deren Merkmale und technische Ursachen geschildert. Dabei wird ausführlich auf digitale Blockartefakte eingegangen. Weiterhin werden Projekte beschrieben, die sich mit der Detektion und Restauration von fehlerhaften Archivmaterialien auseinandersetzen. Zudem werden wissenschaftliche Verfahren betrachtet, die sich bereits mit der Detektion von fehlerhaftem Magnetbandmaterial beschäftigten und den aktuellen Stand der Forschung darstellen. Der im Rahmen dieser Arbeit entwickelte Algorithmus zur Detektion von Blocking ist an einem der Verfahren angelehnt. Das Prinzip, welches auf einer Erkennung von auffälligen Kanten im Raumbereich basiert, wird zunächst in einem Grobkonzept und anschließend im Detail erläutert. Die Methode wurde praktisch in MATLAB umgesetzt und anhand einer Evaluation beurteilt. Diese basiert auf Videoclips, deren fehlerhafte Kanten von Probanden annotiert wurden. Das dazu notwendige Werkzeug wurde ebenfalls im Rahmen dieser Arbeit entwickelt. Aus den Annotationsdaten wurde anschließend eine Grundwahrheit generiert. Die Testdaten werden einer Fehlerdetektion unterzogen und mit der Grundwahrheit verglichen. Ein kleiner Teil der Testdaten diente zur Ermittlung der Parameter. Die restlichen Daten wurden zur Evaluation verwendet. In der Auswertung werden die Ergebnisse erörtert und ihre Gültigkeit kritisch diskutiert, sowie zu lösende Probleme aufgezeigt.



Kuhnke, Felix Konstantin;
Implementation and evaluation of a real-time pitch range extension algorithm for cochlear implants. - 67 S. Ilmenau : Techn. Univ., Masterarbeit, 2014

In der heutigen Zeit ermöglichen es Cochlea-Implantate (CIs) den meisten ihrer tauben Träger an lautsprachlicher Kommunikation teilzunehmen. Trotz gutem Sprachverständnis ist die Fähigkeit zur Wahrnehmung von Tonhöhenänderungen und Tonhöhenunterschieden bei CI-Trägern stark begrenzt. Diese Tatsache bewirkt auch eine gestörte Wahrnehmung von Intonation und somit im weiteren Sinne auch von Prosodie. Diese Arbeit schlägt deshalb eine neue Methode vor, die Wahrnehmung von Intonation bei CI-Trägern zu verbessern. Der Grundgedanke ist es, einen Vorverarbeitungsalgorithmus zu entwerfen, welcher die Spannweite der Tonbewegungen in Sprachsignalen vergrößert. Um die prinzipielle Durchführbarkeit dieser Technik zu belegen, wurde der pitch range extension (PREX) Algorithmus entworfen. Dieser ermöglicht die Veränderung der Tonhöhe von Sprachsignalen bei sehr kleinen Latenzen. Basierend auf Regeln der Intonation, werden die Tonhöhenbewegungen des Signals automatisch verstärkt. In einem mit 23 CI-Trägern durchgeführten Hörtest, nach dem Prinzip "Frage oder Aussage", konnte der Algorithmus die Wahrnehmung von Intonation signifikant verbessern. Die Ergebnisse blieben dabei trotzdem unter denen einer normalhörenden Kontrollgruppe. Die Ergebnisse beweisen die Machbarkeit von sprachverändernden Vorverarbeitungsmethoden und zeigen neue Forschungsmöglichkeiten für CI-Signalverarbeitung und CI-Rehabilitationsmaßnamen auf.



Singh, Gyan Vardhan;
Psychoacoustic investigation on the auralization of spherical microphone array data using wave field synthesis. - 109 S. : Ilmenau, Techn. Univ., Masterarbeit, 2014

Mikrofonarrays sind geometrische Strukturen, die mit zwei oder mehr Mikrofonen an verschiedenen Positionen den Raum abtasten, um die räumlichen Eigenschaften eines Schallfeldes aufzuzeichnen. Insbesonders für 3-dimensionale Schallfeldanalysen eignen sich kugelförmige Mikrofonarraygeometrien. Die so aufgezeichneten Daten können auf einem Wiedergabesystem, dass die räumlichen Eigenschaften wiederzugeben vermag auralisiert, also hörbar gemacht werden. Dadurch kann man einem Hörer den Eindruck vermitteln, er befände sich in dem gemessenen Raum. Dies kann z.B. nach dem Verfahren der Wellenfeldsynthese (WFS) realisiert werden, bei der lautsprecherbasiert räumliche Schallfelder synthetisiert werden. Wie in jeder realen Messsituation wird die räumliche Antwort des Arrays durch verschiedene Fehlerquellen beeinflusst, wie zB räumliche Abtastfehler (Aliasing), Mikrofonrauschen, oder Positionierungsfehler in horizontaler und vertikaler Richtung. Derartige Fehler wurden bisher nur analytisch beschrieben, da aber bei Auralisationsanwendungen das menschliche Gehör das wichtigste Qualitätsmaß darstellt, ist es unabdingbar, Mikrofonarrays auch nach perzeptiven Gesichtspunkten zu untersuchen. Im Rahmen dieser Arbeit werden Kugelarrayschallfelder unter Freifeldbedingungen simuliert und über WFS auralisiert. Verschiedene Fehler werden dabei in die Simulationen mit einbezogen und mithilfe von Hörtests perzeptiv untersucht.



Morgenstern, Wieland;
Keyframe-Selektion zur Erhöhung der Erkennungsrate von Primaten in Videos. - 122 S. Ilmenau : Techn. Univ., Masterarbeit, 2014

Die Ergründung des Verhaltens von Tieren ist für viele Forschungsbereiche wie Artenerhaltung und Populationsüberwachung von hoher Bedeutung. Für eine umfassende Überwachung der Lebewesen werden häufig Videokameras eingesetzt. Die entstehenden Datenmengen können zur Entlastung des Menschen durch einen Computer analysiert werden und automatisch Informationen wie Spezies, Alter, Geschlecht und die Identität der einzelnen Tiere erkennen. Diese Arbeit setzt es sich zum Ziel, die Erkennungsrate eines bereits vorhandenen Systems zur Identifikation von Primatengesichtern in Videos zu erhöhen. Es wird ein System implementiert, das aus einer Reihe von Aufnahmen desselben Individuums (einem Facetrack, der aus mehreren bis vielen hundert Frames bestehen kann) die besten Aufnahmen (Keyframes) extrahiert, um diese zur Identifikation zu verwenden. Dabei werden verschiedene Module implementiert, die Kriterien für die Auswahl aus den Frames ermitteln: Beleuchtung, Kontrast, Schwärzeanteil, Unschärfe, sowie die verschiedenen Varianten zur Erkennung der Pose des abgebildeten Tieres. Als beste Methode zur Posenerkennung stellt sich eine Klassifikation mit einer Support Vector Machine auf Gabor-Features heraus. Aus den verschiedenen Parametern wird ein globaler Score berechnet, der zur Auswahl der Keyframes verwendet wird. Die Ergebnisse der Identifikation auf mehreren Key-frames können gewichtet miteinander verrechnet werden, um ein Gesamtergebnis zu erhalten. Gegenüber der bisherigen Variante, die Identifikation auf dem ersten Frame des Facetracks auszuführen, kann die Erkennungsrate deutlich gesteigert und unter bestimmten Umständen sogar verdoppelt werden.



Hellmich, Mathias;
Perzeptive Bewertung von Fehlereinflüssen bei der binauralen Auralisation von Kugelarraydaten unter Verwendung des Spatial Audio Quality Inventory - SAQI. - Ilmenau : ilmedia. - Online-Ressource (PDF-Datei: III, 94 S., 2,54 MB) : Ilmenau, Techn. Univ., Masterarbeit, 2014

Bei der Aufnahme von Schallfelder durch Kugelmikrofonarrays treten Messfehler auf. Diese Fehler können zum Beispiel räumliches Aliasing, Mikrofonrauschen und Positionierungsfehler sein. Bemerkbar machen sich diese Fehler als tieffrequentes Rauschen sowie Verzerrungen im hochfrequenten Bereich. Bei der Wiedergabe von räumlichen Schallfeldern, welche mittels Kugelmikrofonarrays aufgenommen werden können, wirken sich diese Fehler ebenso negativ auf die Auralisationsqualität aus. In dieser Arbeit sollen diese Fehler bei der binauralen Wiedergabe über Kopfhörer perzeptiv untersucht werden. Dazu werden zwei Hörtests durchgeführt. Ein Hörtest wurde konzipiert, um den Schwellwert der Wahrnehmung dieser Fehler zu bestimmen. Der zweite Hörtest, welcher auf der Repertory Grid Technik basiert, dient der Zuordnung von einzelnen Fehlern zu akustischen Merkmalen. Zur Beschreibung der Fehler wird das Spatial Audio Quality Inventory (SAQI) herangezogen, welches eine aktuelle Sammlung qualitätsbeschreibender Merkmale darstellt. Die verwendeten Merkmale aus SAQI beschreiben räumliche Eigenschaften und Artefakte wie beispielsweise eine Anhebung des tieffrequenten Bereichs oder eine metallische Klangfarbe. Eine Hauptkomponentenanalyse wurde durchgeführt um die Daten zu ordnen und zu bewerten. Damit ist es möglich, wichtige Merkmalsgruppen zu identifizieren und die perzeptiven Merkmale der Fehlereinflüsse zu bewerten.



http://www.db-thueringen.de/servlets/DocumentServlet?id=24144
Seideneck, Mario;
Implementierung eines Systems zur automatisierten Klangpositionierung auf Basis von 3D-Tracking-Systemen. - 111 S. : Ilmenau, Techn. Univ., Masterarbeit, 2014

Mit dieser Arbeit wird das am Fraunhofer IDMT entwickelte 3D-Audio-System SpatialSound Wave um die Anbindung von Trackingsystemen erweitert. Während der Darbietung von Live-Shows wie Musicals oder Theateraufführungen wird es immer wichtiger, dem Publikum ein dreidimensionales Klangerlebnis zu bieten. Bewegt sich ein Darsteller auf der Bühne von links oben nach rechts unten, so muss sich auch die Wiedergabe über das Beschallungssystem von links oben nach rechts unten bewegen. Dazu werden Werkzeuge zur Klangpositionierung verwendet. Ab einer gewissen Zahl an sich gleichzeitig bewegenden Schauspielern wird das manuelle Positionieren für den zuständigen Tontechniker jedoch nahezu unmöglich. Aus diesem Grund kommen Technologien zur automatischen Klangpositionierung zum Einsatz. Im Rahmen dieser Masterarbeit wird die Entwicklung und Implementierung einer Applikation beschrieben, welche die Integration solcher Trackingsysteme in SpatialSound Wave ermöglicht. Ausgehend von den Grundlagen des Trackings wird der aktuelle Stand der Technik im Bereich der 3D-Audio-Produktion analysiert und am Markt verfügbare Trackinglösungen vorgestellt. Auf Basis einer Situations- und Anforderungsanalyse ist zur Beschreibung der Einbindung in die bestehende Infrastruktur ein Nutzerkonzept entstanden. Das Resultat dieses Konzepts ist eine webbasierte Anwendung, welche unter Verwendung des Frameworks UI.FM prototypisch implementiert ist. Dieser Prototyp wird mittels geeigneter Methoden des Usability-Engineerings auf software-ergonomische Qualität evaluiert. Abschließend wird Stellung zu weiteren Entwicklungen an der realisierten Software bezogen und ein Ausblick auf mögliche Zukunftsszenarien des Trackings gegeben.