Abschluss- und Projektarbeiten

Das Fachgebiet bietet zahlreiche Themen für Bachelor- und Masterarbeiten an. Aktuell ausgeschriebene Themen

Sie können sich auch mit einem eigenen Thema an unsere Mitarbeiter:innen wenden. Nachstehend sind im Fachgebiet abgeschlossene, betreute Abschlussarbeiten aufgelistet. In vielen Fällen sind die Themen immernoch relevant. Zögern Sie also nicht mit uns in Kontakt zu treten, wenn  Sie dort für Sie interessant Themen finden.

Abgeschlossene Masterarbeiten
Anzahl der Treffer: 129
Erstellt: Mon, 22 Apr 2024 23:02:16 +0200 in 0.0520 sec


Knoop, Niklas;
Orientierung in einem virtuellen Raum mit beweglichem Avatar. - 93 Seiten
Technische Universität Ilmenau, Masterarbeit 2016

Das Erschaffen eines räumlich wirkenden Hörerlebnisses ist ein bedeutendes Forschungsziel, nicht nur aufgrund der aktuellen Weiterentwicklung und steigenden Verbreitung der VR-Technologie ("Virtual Reality"). Mit der Binauralsynthese ist es möglich, virtuelle Quellen beliebiger Distanz und Richtung zu erzeugen. Dabei werden binaurale Raumimpulsantworten (BRIRs) mit dem gewünschten Audiomaterial kombiniert. Als Resultat entsteht ein dreidimensionales Szenario, welches auch als "Virtual Auditory Environmen" (VAE) bezeichnet wird. Erweitert mit einem System zur Positionserkennung ("Tracking") kann eine Bewegung des Hörenden bzw. seines digitalen Avatars durch diesen simulierten Raum stattfinden. Diese Arbeit befasst sich mit der Untersuchung der Plausibilität in mehreren solcher positionsdynamischen VAEs. Zu diesem Zweck wurde ein eigenes System mithilfe der Programmiersprache Python entwickelt, welches über eine partitionierte Faltung die Binauralsynthese in Echtzeit durchführt. Die Bewegungen des Hörenden wurden in der VAE durch einen flüssigen Wechsel zwischen zahlreichen als BRIRs hinterlegte Rotations- und Translationspositionen imitiert. Die Position des Hörenden wurde über das HTC Vive Trackingsystem erfasst. Zur Untersuchung verschiedener Ansätze wurden die binauralen Raumimpulsantworten auf zwei Arten erstellt. Eine Variante beinhaltete die direkte Messung von BRIRs mit einem KEMAR Kunstkopfsystem. Die zweite Variante bestand in der Berechnung der BRIRs über das Simulationstool MCRoomSim. Weiterhin wurde ein Vergleich zwischen frontal und seitlich positionierten Quellen angestellt. Ein durchgeführter Hörtest hat gezeigt, dass die eigene Bewegung durch die erstellten Szenen vorwiegend als plausibel wahrgenommen wurde. Die Resultate der Plausibilität beinhalten jedoch starke interindividuelle Schwankungen.



Melo Rios, Jorge Arturo;
Evaluation of different transducer principles in digital loudspeakers. - 84 Seiten
Technische Universität Ilmenau, Masterarbeit 2016

Diese Arbeit beschäftigt sich mit der Direkten Schall Rekonstruktion (DSR) basierend auf digital-angesteuerten Arraylautsprechern (Digitalen Transducer Array Loudspeakern - DTALs). Mithilfe von Comsol-Simulationen, und basierend auf dem Stand der Technik werden unterschiedliche Eigenschaften des DTAL untersucht, wie die Wandler-Art, der Einfluss des Ansteuersignals, wie auch die Abtast-Frequenz. Dafür wurde ein möglichst idealer Wandler simuliert, der lediglich aus einer rechteckigen Fläche besteht, die dem Verlauf des Eingangssignals folgt und somit die Luft-Teilchen zum schwingen anregt. Effekte einer realen Membran, wie Masse oder Steifigkeit wurden geziehlt vernachlässigt. Die Ergebnisse zeigen, dass die digitale Ansteuerung des DTALS einen signifikanten Druckgewinn erziehlen kann, obwohl auch starke harmonische Verzerrungen im Signal auftreten. In praktischen Anwendungen scheint ein DTAL basierend auf CMOS-MEMS Wandlern der vielversprechendste Ansatz für eine optimale DSR zu sein.



Onofre Prada, Carlos Andres;
Investigations on auralization of spherical array data using wave field synthesis. - 105 Seiten
Technische Universität Ilmenau, Masterarbeit 2016

Die Auralisation von Daten eines kugelförmigen Mikrofonarrays hat in den letzten Jahren eine große Relevanz im Bereich der räumlichen Audio-Forschung entwickelt. Die Akustische Kamera (gfai Tech) ist ein kugelförmiges Mikrofonearray, das besonders für Lärm-Messungen konzeptiert wurde, für Auralisationsanwendungen aber ungünstige Eigenschaften aufweist. Die vorliegenden Masterarbeit zielt darauf ab, die Akustische Kamera für Auralisationsanwendungen zu analysieren und seine Leistung zu optimieren. Konkret soll die Akustische Kamera für die Simulation von Räumen mithilfe der Wellenfeldsynthese adaptiert werden. Insgesamt wurden drei Optimierungsansätze implementiert: Im ersten Ansatz wurden Sampling-Gewichte entsprechend der Mikrofonanordnung berechnet, während der Zweite Ansastz neue virtuelle Mikrofone Signale mithilfe von Interpolation zwischen benachbarten Samples erstellt, und drittens auf Basis von der Neuordnung der Sampling-Knotenpunkte nach Gaussian und Lebedev-Anordnungen. Insbesondere höhere Schallfeldordnungen im sphärischen Harmonischen Bereich sind von Interesse. Mithilfe von simulierten Schallfeldern wurden die entwickelten Ansätze technisch evaluiert und danach auf Basis von realen Messdaten in zwei Räumen mithilfe eines Hörtests hinsichtlich ihrer Qualität bewertet. Die Ergebnisse zeigen, dass die Robustheit der Akustischen Kamera für höhere Ordnungen optmiert werden konnte. Obwohl die Leistung des Arrays nach wie vor nicht-ideale Eigenschaften aufweist, konnte die Wiedergabequalität bei der WFS-Auralisation mithilfe der entwickelten Methoden im Vergleich zur Ausgangssituation verbessert werden.



Fiedler, Bernhard;
Konzeption und prototypische Umsetzung einer skalierbaren Audiosignalverarbeitung für eine objektbasierte Auralisation. - 102 Seiten
Technische Universität Ilmenau, Masterarbeit 2016

Mithilfe aktueller objektbasierter Tonwiedergabeverfahren können komplexe virtuelle Klangszenen reproduziert werden. Zur Auralisation virtuell synthetisierter oder gemessener realer Räume wurden bereits mehrere holoakustische Raumsimulationsverfahren am Fraunhofer IDMT entwickelt. In dieser Arbeit erfolgt eine detaillierte Analyse der bereits existierenden Raumsimulationskonzepte. Diese werden unter anderem anhand des Rechenaufwandes und der internen Signalverarbeitung verglichen. Basierend auf den gewonnenen Erkenntnissen wurde ein Anforderungskatalog erstellt. Im Rahmen der Arbeit wurde ein neues Konzept für die Auralisation komplexer Klangszenen entworfen. Die Signalverarbeitung zur Schallfeldzusammensetzung wird umfangreich dargelegt und um dynamische Verzögerungsanpassung erweitert. Diese ermöglicht die Beibehaltung des zeitlichen Gefüges der Raumimpulsantwortteile in Abhängigkeit des Direktschalls. Die Arbeit stellt einen Ansatz vor, wie die distanzabhängige Luftabsorption mit geringem Rechenaufwand in Echtzeit durch Biquad-Filter näherungsweise modelliert werden kann. Die dafür benötigten Parameter stammen aus einem eigens entwickelten Approximationsalgorithmus. Der entsprechend dem neuen Raumsimulationskonzept implementierte Softwareprototyp wird umfangreich auf erwartungsgemäße Funktionalität getestet. Die Arbeit stellt die Auswirkungen der dynamischen Verzögerungsanpassung vor. Weiterhin gibt ein Vergleichstest der Konzepte hinsichtlich des Rechenaufwandes Aufschluss über die Effizienz der Signalverarbeitung. Das neue Konzept weist unter aktuellen realistischen Testbedingungen eine geringere Rechenlast auf als verglichene Konzepte. Die Ergebnisse eines informell durchgeführten Hörtests geben Hinweise, dass die verglichenen Systeme einen ähnlichen Höreindruck hervorrufen. Der neue Softwareprototyp wurde tendenziell sogar besser gemäß der Plausibilität einer Klangszene bewertet. Neben der Möglichkeit, weitere Hörtests zum Vergleich unterschiedlicher Raumsimulationskonzepte durchzuführen, kann der implementierte Softwareprototyp als Basis für Produktions- und Demonstrationswerkzeuge für Tonschaffende genutzt werden.



Mittag, Christina;
Entwicklung und Evaluierung eines Verfahrens zur Synthese von binauralen Raumimpulsantworten basierend auf räumlich dünnbesetzten Messungen in realen Räumen. - 96 Seiten
Technische Universität Ilmenau, Masterarbeit 2016

In dieser Arbeit werden Verfahren vorgestellt, entwickelt und evaluiert, die die Synthese von binauralen Raumimpulsantworten (BRIRs) an beliebigen Positionen im Raum basierend auf räumlich dünnbesetzten Messungen realisieren. Hintergrund dieser Untersuchungen ist die Entwicklung eines Audiosystems, das einen realen Raum auralisiert, der mit auditorisch wahrnehmbaren Objekten angereichert ist. Durch diesen Raum soll sich der Hörer frei bewegen können, ohne dass störende Fehler bei der Wiedergabe und der Lokalisation der Objekte entstehen. Um den Aufwand zur Umsetzung des Systems zu verringern, soll die Anzahl der dafür benötigten, im realen Raum gemessenen BRIRs reduziert werden. Die zu diesem Zwecke entwickelten Syntheseverfahren nutzen die Messungen von ein bis drei Positionen im Raum und generieren mit Hilfe von Distanzanpassung und räumlicher Interpolation neue BRIRs an vorgegebenen Positionen. Durch Nutzung der synthetisierten BRIRs für die Auralisation kann eine räumliche Unterabtastung vermieden und die Anzahl der Messungen reduziert werden. Zur Evaluation der Syntheseverfahren werden BRIRs für verschiedene Testszenarien generiert, d.h. an verschiedenen Synthesepositionen und unter Verwendung von BRIRs unterschiedlicher Messpunkte. Die synthetisierten BRIRs werden im Hinblick auf ihre technische Eignung mit zuvor gemessenen BRIRs verglichen. Bei der Betrachtung des Verhältnisses von Direktschall- zu Nachhallenergie zeigen sich Unterschiede, die auf die gerichtete Abstrahlcharakteristik der Lautsprecher zurückzuführen sind. Eine Untersuchung der Energieabklingkurven ergibt geringe Unterschiede in den Nachhallzeiten sowie in den Deutlichkeits- und Klarheitsmaßen der BRIRs. Des Weiteren wird ein Hörtest durchgeführt, der die hervorgerufene räumliche Wahrnehmung der Syntheseergebnisse im Vergleich zu den gemessenen BRIRs untersucht. Die Syntheseverfahren liefern durchgehend eine zufriedenstellende bis sehr gute klangliche Qualität. Im Bezug auf die Externalität und die Anzahl der Vorne-Hinten-Vertauschungen und Quadrantenfehler ergeben sich vereinzelt signifikante Unterschiede der getesteten Systeme, die aber oftmals nur für bestimmte Schalleinfallswinkel auftreten. Als weiteres Ergebnis zeigt sich ein Zusammenhang zwischen der Qualität der Syntheseergebnisse und den untersuchten Kombinationen von Quell-, Synthese- und Messpositionen. Auf Grundlage der gewonnen Erkenntnisse werden Optimierungsvorschläge und Anwendungsempfehlungen für die Syntheseverfahren gegeben.



Kruh-Elendt, André;
Low complexity binaural rendering for scene based audio content. - 101 Seiten
Technische Universität Ilmenau, Masterarbeit 2016

MPEG-H 3D Audio ist der kürzlich eingeführte internationale Standard für die effiziente Übertragung von immersiven Audioinhalten an eine Vielzahl von Endgeräten. Der Standard unterstützt unter anderem das Higher Order Ambisonics (HOA) Soundformat für die Reproduktion über Lautsprecher sowie binaurale Technologie zum Abspielen über Kopfhörer. Im Kontext mobiler Endgeräte, in dem die Nutzung von Kopfhörern allgegenwärtig und die Energieversorgung in der Regel begrenzt ist, sind effiziente Algorithmen für die Binauralsynthese erforderlich. Ausgehend von den im MPEG-H 3D Audio beschriebenen HOA Decoder und Verfahren zur Binauralsynthese im Zeitbereich, präsentiert diese Arbeit einen alternativen Ansatz zur Binauralisierung von HOA Inhalten, der einen geringeren Rechenaufwand erfordert. Eine Softwareimplementierung für den vorgeschlagenen Algorithmus wurde realisiert und dieser anschließend mit dem aktuellen Binauralrenderer von MPEG-H 3D Audio verglichen. Eine erkennbare Einsparung in der Anzahl benötigter Rechenoperationen wurde erreicht und der subjektive Hörtest zeigte keinen signifikanten Unterschied für die verglichenen räumlichen Audio-Qualitätsmerkmale. Obwohl eine genauere Analyse des vorgeschlagenen Verfahrens notwendig ist, um eine abschließende Beurteilung zu treffen, lässt sich ein Vorteil für Anwendungsszenarien mit begrenzter Energiekapazität erkennen. Eine einfache Integration in den bestehenden Rahmen von MPEG-H 3D Audio ist gewährleistet.



Gerhardt, Christoph;
Selektive Verschlüsselung von Gesichtern in Videos unter Verwendung des H.264-Standards. - 136 Seiten
Technische Universität Ilmenau, Masterarbeit 2016

Überwachungskameras werden heutzutage immer häufiger an unterschiedlichen Orten eingesetzt, um für ein höheres Sicherheitsgefühl zu sorgen. Dabei leidet allerdings die Privatsphäre der aufgenommenen Personen. Um dieses Problem zu vermeiden existieren unter anderem Ansätze zur selektiven Verschlüsselung von Videodaten. Solche Verfahren ermöglichen es, einen Teil des Videos zu verschlüsseln während der Rest frei zugänglich und für jeden sichtbar bleibt. Das Ziel dieser Arbeit ist es, ein vollständiges System zur selektiven Verschlüsselung von Videodaten zu entwickeln und zu implementieren. Das beschriebene System basiert dabei auf dem weit verbreiteten H.264-Standard und besteht aus verschiedenen unabhängigen Komponenten. Durch die Modularität der Komponenten ist es möglich, diese für spätere Verwendungen anzupassen oder sie komplett durch weiterentwickelte Komponenten auszutauschen. Das System ermöglicht es, den Videostrom bereits während der Encodierung unter Verwendung verschiedener Blockschlüssel kryptografisch sicher zu verschlüsseln. Außerdem bietet es die Möglichkeit lediglich einzelne Teile des Videos und sogar Gesichter individuell zu entschlüsseln.



Weiss, Benjamin;
Automatische Detektion von Audiosignalstörungen unter Berücksichtigung ihrer psychoakustischen Relevanz. - 89 Seiten
Technische Universität Ilmenau, Masterarbeit 2016

Die zunehmende Masse an digitalen Audiodaten macht eine automatische Detektion von Fehlern immer wichtiger. Eine manuelle Auswertung ist zeitaufwändig und deshalb teuer. In der vorliegenden Masterarbeit wird ein Algorithmus zur Detektion von Klickstörungen in der Qualitätskontrolle entwickelt, optimiert und evaluiert. Der entwickelte Algorithmus basiert auf dem bewährten modellbasierten Ansatz. Das verwendete Modell ist das bekannte AR-Modell. Mit Hilfe des AR-Modells wird durch geeignete Wichtung der vorhergehenden Samples der aktuelle Samplewert geschätzt. Klickstörungen lassen sich durch dieses Modell nicht gut abbilden und machen sich dadurch als starke Ausreißer im Fehler zwischen tatsächlichem Signal und geschätztem Signal bemerkbar. Der RLS Algorithmus zeigte bei der Untersuchung die besten Eigenschaften zur Berechnung des Fehlersignals. Bei der Ausreißerdetektion ist der Huber-k-Schätzer als geeignete Methode ermittelt worden. Nach der Optimierung der restlichen Parameter ergibt sich ein F_0.5-Maß von über 0.8 bei einem SNR von weniger als 30 dB. Die Evaluation des Algorithmus wird unter Berücksichtigung der psychoakustischen Relevanz durchgeführt. Da erkannte Fehler nachträglich immer noch händisch überprüft und entfernt werden müssen, führt jede falsch-positiv Detektion zu zusätzlichen unnötigen Kosten. Aus diesem Grund sollen zwar vorhandene, aber nicht hörbare Klicks, idealerweise vom Algorithmus nicht als Klickstörung detektiert werden. Hierzu wird ein Hörversuch durchgeführt, um sowohl die Wahrnehmungsgrenze als auch die Toleranzgrenze für Klickstörungen zu ermitteln. Abhängig von der Signalart (Sprache, E-Musik, U-Musik) liegt die Wahrnehmungsgrenze im Bereich zwischen 40 dB und 50 dB und die Toleranzgrenze jeweils ungefähr 5 dB tiefer.



Shahabi Ghahfarokhi, Samar;
On the influence of visual feedback on the externalization of the percieved sound sources. - 102 Seiten
Technische Universität Ilmenau, Masterarbeit 2016

Um räumliches Hören herzustellen, welches Zuhörern hohe Wahrnehmungsempfindungen bietet, eignet die Binauralwiedergabe sich als Ansatz. Richtigkeit von Synthese in Binauralsystemen fordert individuelle Messungen für Binaural Room Impulse Responses. Plus, um authentische Raumillusion zu liefern, müssen Kopfhörer mittels adäquater Filter individuell entzerrt werden. Die Wahrnehmung von Schallrichtungen und die Externalisierung von Klangbildern ist hingegen eine multisensorische Aufgabe, die sowohl Hör- als auch Sehvermögen einbezieht. Audiovisuelle Interaktion wurde bereits zutiefst untersucht. Die Externalisierung als Wahrnehmung eines Schallereignisses außerhalb des Kopfes ist stark verbunden mit Merkmalen wie Plausibilität, im Sinne davon, dass der Mangel an Plausibilität die menschlichen Sinne daran hindert, dass das präsentierte audiovisuelle Ereignis als wahr anerkennen und ein unplausibles Ereignis wird eventuell ins Kopfinnere verstellt. Das Ziel dieser Dissertation ist, das Problem anzusprechen, ob die Winkelabweichung zwischen Schall- und Sehreizen die Externalisierung des Klangbildes beeinflussen. Bisher haben ungenügende Untersuchungen dieses Problem in Betracht gezogen.



Vaidya, Vyasraj;
Development and evaluation of methods for classification of acoustic scenes. - 90 S. : Ilmenau, Techn. Univ., Masterarbeit, 2015

Die vorliegende Masterarbeit befasst sich mit der automatischen Klassifizierung und Analyse von akustischen Szenen. Der Datensatz von urbanen Klängen (Urban Sounds), der auf Freesound powered projects verfügbar ist, wird als Klangquelle verwendet. Die Datenbank Urban Sounds DB besteht aus 1302 Klängen, die in 10 Kategorien eingeordnet werden zum Beispiel air conditioner und street music. Die Datenbank setzt sich aus Liedern unterschiedlicher Länge zusammen. Zuerst wird ein Beispiel-Set mit kürzeren Liedlängen generiert. Eine Überprüfung des Datenansatzes wird durchgeführt, damit die Duplikate entfernt werden. Folgend wird der Extraktor vom Institut verwendet, um eine Datei für jeden Song zu erzeugen. Mit Anwendung der Datei-Lesegeräte verfügbar im Institute wird eine Feature Matrix für jedes Lied generiert. Diese Feature-Matrix hilft die Analyse der Songs, da sie die inhärente Information des Songs enthält. Diese Information wird in Arrays umgewandelt und für die Verarbeitung verwendet. Bei der Klassifizierung der akustischen Szenen ist die Anzahl der Merkmale proportional zu der Genauigkeit der Klassifikation. Deshalb werden alle niedrige Merkmale, die in einem Song vorhanden sind, entnommen. Die Cepstral-Koeffizienten bei Eigenschaft erfassen nur die globalen spektralen Signal Angaben. Die Cepstralkoeffizienten die detaillierte und subtil Veränderungen in Spektrum zu analysieren versagen, weil sie im Laufe der Zeit ändert. Demzufolge wird ein neues Feature, das nicht in dem Extraktor vorhanden ist, nämlich das Modulation Feature, entworfen. Die Modulation Features erfassen inhärente Eigenschaften unterschiedlicher akustischen Szenen und sind als robuster angesehen. Da das Modulation Feature eine alternative Methode zur Beschreibung der Signalfrequenzen ist, können die Modulationsspektren in verschiedenen technischen Anwendungen eingesetzt werden. Eine Klassifizierung mit dem Feature-Set bestehend aus dem Standard-Feature von der extraktor, die Modulation-Funktion und den Cepstral-Merkmale durchgeführt wird. Die Experimente werden durchgeführt, um die besten Klassifikationsschemata für Szenen zu verstehen. Klassifizierung des reduzierten Datensatzes und die 8K-Datensatzes durchgeführt. Die Klassifizierung mit Urban-Sound 8K unter Verwendung des gute Ergebnisse erzielt. Die Implementaion wurde in Python durchgeführt.