Abschluss- und Projektarbeiten

Das Fachgebiet bietet zahlreiche Themen für Bachelorarbeiten an. Aktuell ausgeschriebene Themen

Sie können sich auch mit einem eigenen Thema an unsere Mitarbeiter:innen wenden. Nachstehend sind im Fachgebiet abgeschlossene, betreute Abschlussarbeiten aufgelistet. In vielen Fällen sind die Themen immernoch relevant. Zögern Sie also nicht mit uns in Kontakt zu treten, wenn  Sie dort für Sie interessant Themen finden.

 
Abgeschlossene Bachelorarbeiten
Anzahl der Treffer: 127
Erstellt: Thu, 25 Apr 2024 23:07:41 +0200 in 0.5524 sec


Schwarze, Sebastian;
Entwicklung eines Modells zur Anwendung der räumlichen auditorischen Maskierung auf Spatial Room Impulse Responses. - Ilmenau. - 50 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2023

Für die auditorische Wiedergabe von realen Räumen in Augmented- oder Mixed-Reality Anwendungen werden die akustischen Eigenschaften des Raumes, in dem sich der Anwender befindet, benötigt. Um solche komplexen Daten in Echtzeit rendern zu können, müssen diese vereinfacht und die Datenmenge reduziert werden. In dieser Arbeit wird ein Modell vorgestellt, dass die räumlich auditorischen Maskierung von frühen Reflexionen in Abhängigkeit der Einfallsrichtung und Pegel des Schallfeldes von gemessenen Spatial Room Impulse Response berechnet und die Datenmenge reduziert, ohne dabei die wahrgenommenen, akustischen Informationen des Raumes zu verlieren. Die Hauptfunktionen des Modells sind (i) Analyse von gemessenen Spatial Room Impulse Responses und Ermittlung der Einfallsrichtung der Energie des Schallfeldes, (ii) Detektion von Reflexionen in diesem Schallfeld, (iii) Berechnung der auditorischen Maskierung der frühen Reflexionen, (iv) Entfernen der irrelevanten Reflexionen für die akustische Wahrnehmung des Raumes und (v) Binauralisierung der reduzierten Spatial Room Impulse Response. Dabei basieren die Funktionen (i) und (v) auf der Arbeit von Sakari Tervo et al. «Spatial Decomposition Method for Room Impulse Responses» und (ii) bis (iv) auf der Arbeit von Brinkmann et al. «Towards encoding perceptually salient early reflections for parametric spatial audio rendering». In dieser Arbeit wurde eine Verbindung zwischen den beiden Modellen hergestellt, sodass gemessene Spatial Room Impulse Responses analysiert werden und frühe Reflexionen nach Wunsch entfernt werden können. Ebenso wurde in der Evaluation festgestellt, bis zu welchem Grad eine Reduzierung der frühen Reflexionen möglich ist, ohne hörbare Unterschiede festzustellen und welche akustischen Parameter durch die Entfernung der Reflexionen beeinflusst werden.



Krätzschmar, Marcel;
Ortung von Schallquellen mit Mikrofonarrays in Drohnenszenario. - Ilmenau. - 61 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2023

Seit über einem Jahrzehnt wird daran geforscht, akustische Sensoren unter dem Einfluss von Drohnenschall für eine Schallortung nutzbar zu machen. Gerade im zivilen Bereich stoßen sogenannte Multikopter-Drohnen auf immer größere Beliebtheit, da sie für eine Vielzahl von Anwendungen Gebrauch finden. Die Mehrheit dieser Nutzungsmöglichkeiten stützt sich dabei auf bildgebende Sensorik, doch auch ein Einsatz schallmessender Verfahren kann in gewissen Situationen einen Vorteil bieten. So könnten sich beispielsweise in Notsituationen befindliche Personen unter Schutt befinden und somit eine direkte Sichtlinie verhindern. Gegenstand dieser Arbeit soll deshalb die Lokalisierung akustischer Quellen in einem Drohnenszenario sein. Hierfür werden in der Regel sogenannte Mikrofonarrays verwendet, die es mithilfe digitaler Signalverarbeitungsverfahren ermöglichen, den Schall aus gewählten Richtungen zu empfangen und ungewollte Einfallswinkel zu unterdrücken. Die für die Direction-of-Arrival Schätzung genutzten Algorithmen sollen im Fokus dieser Forschungsarbeit liegen. Die Mikrofone werden im genannten Kontext zwangsläufig von den starken Störeinflüssen der Drohne beeinträchtigt. Aufgabe der Signalverarbeitung in Kombination mit dem gewählten Mikrofonarray ist es, diese bestmöglich zu unterdrücken, um eine fehlerfreie Ortung zu gewährleisten. In dieser Arbeit wird ein aktueller Algorithmus mithilfe der Programmiersprache Python implementiert und in einem realistischen Anwendungsszenario messtechnisch evaluiert. Die Performance der gewählten Methode wird für mehrere Geräusche unter verschiedenen Bedingungen mit zwei Mikrofonarrays ermittelt. Es zeigt sich, dass eine Lokalisierung unter Drohnenschall generell möglich, jedoch stark abhängig von den Messbedingungen ist. Breitbandige Signale, wie beispielsweise das einer Kettensäge, konnten mit einem Signal-zu-Rausch Abstand von -20 dB selbst bei maximaler Beschleunigung der Drohne noch geortet werden. Spektral gebündeltere Schallereignisse, wie ein menschlicher Schrei, zeigten sich hingegen als problematisch bei der Ermittlung des Einfallswinkels.



Wahrnehmungsbewertung verschiedener akustischer Merkmale von Schallquellen mithilfe von Pupillometrie. - Ilmenau. - 65 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2023

Das aktuelle Hauptziel der Audioforschung im Bereich Virtual-Reality und Augmented-Reality ist es, virtuelle Schallquellen und Räume möglichst real wirken zu lassen. Eine weit verbreitete Methode, um zu beurteilen, wie Audioszenen von einem Nutzer wahrgenommen werden, sind Hörtests. In diesen bewertet der Proband meist anhand eines Fragebogens das Gehörte. Da diese Art der Wahrnehmungsbewertung jedoch nicht immer zuverlässig ist, da sie nicht in Echtzeit stattfindet, soll eine bessere Methode durch Biosignalmessung - Pupillometrie - untersucht werden. Bei kognitiver Belastung kann eine geringe Erweiterung der Pupille festgestellt werden. Es gibt bereits einige Pupillometriestudien im auditiven Bereich, derzeit gibt es jedoch nur wenige Erkenntnisse darüber, wie die Pupillometrie für die Wahrnehmungsbewertung der Raumakustik und der entsprechenden Merkmale eingesetzt werden kann. Ziel dieser Arbeit ist es, hierfür ein Verständnis zu erlangen. Zu diesem Zweck wurde ein Tool für einen Hörtest entwickelt, welches ein Audiosetup mit einer Eyetrackingbrille verbindet. Im Rahmen einer Studie wurde untersucht, wie akustische Stimuli, die sich durch Parameter wie Lautstärke, Position oder Nachhall unterscheiden, mithilfe der biologischen Reaktion erfasst werden können. Allein durch die Studie dieser Arbeit lässt sich jedoch nicht beurteilen, ob die Pupillenmessung Fragebögen ersetzen kann. Allerdings ist bereits erkennbar, dass die Pupillometrie zur Wahrnehmungsbewertung und für die Erkennung von "Just Noticeable Differences" ungeeignet zu sein scheint, da die Dilationen zum einen nur sehr gering wären und zum anderen keine klaren Rückschlüsse auf die Ursache der Erweiterung geführt werden können. Um die Daten besser bewerten zu können, ist eine ausführlichere Studie nötig, in welcher die Fehler dieser berücksichtigt werden. Diese Arbeit zeigt, dass das entwickelte Tool funktionsfähig ist und als Basis für weitere Untersuchungen genutzt werden kann. Um möglichst real wirkende Schallquellen und Räume zu erschaffen, ist sie allein als Messgröße vermutlich nicht ausreichend. In Kombination mit Fragebögen oder anderen Biosignalen in Hörtests könnte sie jedoch Hilfsmittel dafür sein, um zuverlässige und aussagekräftige Ergebnisse zu liefern.



Edelmann, Niklas;
Schallführungsdesign für Piezo-Buzzer. - Ilmenau. - 94 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2023

Die vorliegende Bachelorarbeit befasst sich mit der Simulation von Piezobuzzern unterschiedlichen Typs gemeinsam mit der verwendeten Schallführung und Ansteuerungsschaltung. Das Ziel dieser Arbeit ist es, Piezobuzzer mit oder ohne Feedbackelektrode zu simulieren, darauf aufbauend eine auf maximalen Schalldruckpegel optimierte Schallführung zu entwerfen und letztendlich zu untersuchen, wie gut oft benutzte Methoden zur Schalldruckpegelmaximierung von Piezobuzzern geeignet sind. Dafür werden elektromechanische und elektroakustische Ersatzschaltbilder vorgestellt, deren Parameter berechnet und im Anschluss die Simulationen mit vorher durchgeführten Messungen verglichen. Anschließend wird auf Grundlage dieser Parameter eine Schallführung optimiert und deren Einfluss auf die elektrischen, mechanischen und akustischen Eigenschaften des Buzzers untersucht. Es wird weiterhin ein Ansatz vorgestellt, um den Schall möglichst effizient aus einem Gehäuse zu leiten, falls der Piezobuzzer nicht direkt an der Gehäuseoberseite angebracht werden kann. Ferner soll die beliebte und somit oft genutzte Hartley-Ansteuerungsschaltung auf ihre Eignung zum Betrieb eines Buzzers im Bereich des maximalen Schalldruckpegels untersucht werden. Die Ergebnisse zeigen Simulationsmodelle der zwei gängigsten Buzzertypen, welche mit Messungen validiert werden. Auf Grundlage des Optimierungsskriptes wird eine auf maximalen Schalldruck optimierte Schallführung berechnet und der Einfluss von Schallführung und Ansteuerungsschaltung auf die Eigenschaften des Buzzers untersucht. Weiterhin wird erläutert, wieso die verwendete Hartley-Ansteuerungsschaltung für den Betrieb eines Piezobuzzers mit Feedbackelektrode im Bereich des maximalen Schalldruckpegels nicht geeignet ist. Um die Testumgebung zu vervollständigen und die Arbeit mit den Python-Skripten zu erleichtern, wird ein Graphical User Interface für die Schätzung und Optimierung, sowie eine ausführliche Benutzeroberfläche im Simulationsprogramm LTspice erstellt.



Untersuchung von Model-Fusion-Algorithmen für föderierte Audiodatenklassifikation. - Ilmenau. - 93 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2023

Föderiertes Lernen ist ein neuer Ansatz im Bereich des maschinellen Lernens, der den Datenschutz gewährleistet, indem mehrere Geräte gemeinsam ein Modell erlernen, ohne lokale Daten auszutauschen. In dieser Arbeit werden verschiedene Fusionsalgorithmen zur Kombination von Modellen, die auf unterschiedlichen Geräten trainiert wurden, in einem einzigen globalen Modell untersucht. Dabei werden fünf Fusionsalgorithmen im Rahmen einer Datenklassifizierungsaufgabe bewertet: Federated Averaging (FedAvg), Federated Proximal (FedProx), Inverse Distance Aggregation (IDA), q-Fair Federated Averaging (qFedAvg), und Temporally Weighted Federated Averaging (TWFedAvg). Die Experimente berücksichtigen unterschiedliche Verteilungen von Kundendaten und verschiedene Grade von vergifteten Datendistributionen. Die Ergebnisse zeigen, dass FedAvg bei verschiedenen Datenverteilungen gute Leistungen erzielt, jedoch Schwierigkeiten hat, Probleme im Zusammenhang mit vergifteten Daten zu lösen. FedProx behandelt effektiv Probleme der Datenheterogenität und Systemheterogenität. IDA zeigt eine stabile Modellkonvergenz und hohe globale Modellgenauigkeit. qFedAvg verbessert die Leistung der schlechten performenden Geräte, sorgt für ein faireres Modell und kann unterschiedliche vergiftete Datendistributionen bewältigen. TWFedAvg ist sehr empfindlich gegenüber dem Rechenaufwand beim lokalen Lernen und weist eine schlechte Leistung in den Experimenten auf.



Braun, Florian;
Impact of privacy enhancement technologies for speech content on machine learning applications. - Ilmenau. - 50 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2023

Da jedes Jahr mehr Vorschriften zum Thema Datenschutz erlassen werden und die Popularität moderner Ansätze des maschinellen Lernens (ML) in den meisten Bereichen rapide zunimmt, ist es von entscheidender Bedeutung, Lösungen zum Schutz der Privatsphäre und insbesondere der Privatsphäre von Sprachinhalten zu entwickeln, ohne die Leistung von maschinellen Lernverfahren mit berechtigtem Interesse stark zu beeinträchtigen. Ebenso wichtig ist es, das "richtige Werkzeug für die Aufgabe" zu wählen, d. h. die für eine bestimmte Situation am besten geeignete Privacy Enhancement Technology (PET). In dieser Arbeit schlagen wir ein neuartiges Evaluierungsprotokoll vor, mit dem der Einfluss von PET auf ein maschinelles Lernverfahren bewertet werden kann, während gleichzeitig die Verbesserungen der Privatsphäre sowohl in Bezug auf die Verschleierung von Inhalten als auch auf die Anonymisierung von Sprechern miteinbezogen werden. Um die Gültigkeit dieses Protokolls zu bewerten und zu zeigen, testeten wir zwei maschinelle Lernmodelle in Verbindung mit drei PET-Algorithmen. Anhand des vorgeschlagenen Protokolls konnten wir die Stärken und Schwächen der untersuchten PET-Algorithmen genau ermitteln und eine klare Empfehlung für verschiedene Anwendungsfälle aussprechen.



Ziener, Christian;
Untersuchung von Mikrofonsystemen zur Anwendung an Drohnenplattformen. - Ilmenau. - 93 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2023

Drohnensysteme übernehmen bereits heute eine Vielzahl an Aufgaben auf unterschiedlichen Gebieten. Das Problem der zur Zeit eingesetzten Drohnensysteme ist deren nahezu ausschließlicher Einsatz zur Bildgebung, so verhindern z.B. nicht transparente Objekte eine Sichtung. Akustische Sensoren sind bisher noch nicht etabliert, da die Eigen- und Windgeräusche des Drohnensystems die Aufnahmen stören.Das Ziel dieser Arbeit ist daher die Untersuchung verschiedener Mikrofonsysteme an Drohnenplattformen. Der Fokus liegt hierbei auf der Erzeugung einer geeigneten Richtcharakteristik des Mikrofonarrays, um die Drohnen- und Windgeräusche möglichst stark zu unterdrücken. Zunächst werden die Anforderungen des Betriebs von einem Mikrofonarray und einem Beamforming-Algorithmus an einer Drohnenplattform erläutert. Ein mögliches Anwendungsszenario der Waldbrandfrüherkennung mit Drohne und Mikrofonsystem bildet hierbei einen Schwerpunkt. Das Mikrofonsystem soll eine möglichst gerichtetete Empfindlichkeit für Geräusche senkrecht unter dem Drohnenkorpus erzeugen, ohne den sicheren Betrieb der Drohne zu gefährden. Darauf aufbauend erfolgt die Auswahl eines uniformen Rechteck-, Ring-, archimedischen Spiral- und eines nicht-uniformen Rechteckarrays in Kombination mit einem Delay-and-Sum Beamformer für eine nähere Untersuchung. Die ausgewählten Mikrofonsysteme werden simuliert, realisiert und untersucht auf deren Fähigkeit, seitliche Störgeräusche unterdrücken zu können. Das archimedische Spiralarray erreicht hierbei einen größeren Signal-Rausch-Abstand als das nicht-uniforme Rechteckarray. Aus diesem Grund wird nur eine Anpassung des archimedischen Spiralarrays vorgenommen. Im Anschluss daran erfolgt die Messung der azimutalen Richtcharakteristiken der prototypischen Mikrofonsysteme. Das uniforme Rechteck- und Ringarray zeigen im Gegensatz zu den Ergebnissen der Simulation eine stärkere Richtwirkung nach vorn als nach hinten und eine niedrigere Empfindlichkeit zu den Seiten. Abschließend werden die Prototypen unterhalb einer betriebenen Drohne evaluiert. Diese Arbeit zeigt, dass ein uniformes Rechteck-, Ring- und archimedisches Spiralarray in Kombination mit einem Delay-and-Sum Beamformer die Geräusche einer Drohne im Leerlaufbetrieb tendenziell ausreichend zur Aufnahme von Bodenbrandgeräuschen unterdrücken können.



Hesse, Christoph;
Emulieren eines Kondensatormikrofons durch MEMS-Mikrofone. - Ilmenau. - 70 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2022

In dieser Arbeit wird die Emulation eines Kondensatormikrofons durch ein Array aus MEMS-Mikrofonen untersucht und teilweise durchgeführt. Verschiedene Vorbetrachtungen zu den Eigenschaften eines MEMS-Arrays, wie Amplitudengang, Signal-zu-Rausch-Verhältnis und Richtcharakteristik finden statt. Es wird mittels eines Python Skripts ein FIR-Filter zur Anpassung der Amplitudengänge entworfen. Ein einzelnes MEMS-Mikrofon und ein zu emulierendes Kondensatormikrofon werden in einem reflexionsarmen Raum vermessen. Diese Daten dienen als Eingabe beziehungsweise als Referenz f̈ ur die Ausgabewerte des FIR-Filters. Des Weiteren werden verschiedene Beampattern von grundlegenden Array-Geometrien emuliert.



Popp, Paul;
Extrapolation of microphone array recordings for arbitrary positions in the room. - Ilmenau. - 65 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2022

Im Laufe des letzten Jahrzehnts hat das Interesse an virtueller bzw. erweiterter Realität (VR / AR) stark zugenommen. Für ein immersives Erlebnis ist es notwendig, virtuelle Schallquellen an beliebige Positionen im Raum platzieren zu können. Eine Möglichkeit zur Auralisierung von virtuellen Quellen ist es, Signale mit binauralen Raumimpulsantworten (BRIRs) zu falten und diese über Kopfhörer wiederzugeben. Die Aufnahme von BRIRs mit einem Kunstkopf zur Wiedergabe mit sechs Freiheitsgraden (6-DoF) über Kopfhörer führt zu einem hohen Aufwand, da für unterschiedlichste Kopfdrehungen und Positionen im Raum BRIRs gemessen werden müssen. Außerdem lassen sich vertikale Drehungen des Kopfes nur schwer damit umsetzen. Eine Möglichkeit, den Messaufwand zu reduzieren und Änderungen der Elevation zuzulassen, ist die Spatial Decomposition Method (SDM). Damit muss an jeder Position lediglich eine Messung durchgeführt werden. In der Vergangenheit wurde von Füg ein Algorithmus entwickelt, der Impulsantworten (IRs) so manipuliert, dass die Distanzwahrnehmung verändert wird. Ziel dieser Arbeit ist es, diesen Algorithmus auf die SDM zu übertragen und zu erweitern, sodass Entfernungsänderungen auch für elevierte Quellen möglich sind. Dadurch muss nur noch eine Messung mit der SDM durchgeführt werden, um BRIRs für den gesamten Raum zu synthetisieren. Der entwickelte Algorithmus manipuliert systematisch die Anfangszeitlücke, die Direction-Of-Arrival Matrix und die Energie der IR. Die Evaluation erfolgt mithilfe von distanzabhängigen Raumakustikparametern sowie durch einen informellen subjektiven Wahrnehmungstest. Die Auswertung der Raumakustikparameter zeigt, dass gute Ergebnisse für Quellen erzielt werden, welche oberhalb oder in der Ebene des Empfängers liegen. Für Quellen unterhalb des Empfängers entstehen starke Abweichungen bei der Direct-to-Reverberant-Ratio (DRR). Hinsichtlich der subjektiven Wahrnehmung bleiben die Ergebnisse hinter den Erwartungen zurück. Die Richtungs- und Entfernungswahrnehmung der Synthese weicht nicht stark von den Messungen ab, aber die Klangfarbe der Synthese ist sehr deutlich verändert. Die Übertragung von Fügs Manipulationsalgorithmus auf die SDM ist nur teilweise gelungen bzw. untauglich für einen praktischen Einsatz. Anhand von weiteren zukünftigen Untersuchungen für andere Räume soll die Leistungsfähigkeit des Algorithmus verbessert werden.



Untersuchung zur Charakterisierung nichtlinearer Verzerrungen mittels verschiedener Messprozeduren. - Ilmenau. - 74 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2022

Für die Qualitätsbewertung von Audiosystemen werden häufig nichtlineare Verzerrungen genutzt. Diese können mit einer Vielzahl von Methoden bestimmt werden. Die Auswahl der richtigen Messmethode ist ein grundlegendes Problem beim Vermessen von Systemen. Aus diesem Grund vergleicht die vorliegende Arbeit verschiedene Messmethoden zur Charakterisierung von nichtlinearen Verzerrungen. Für den Vergleich werden Methoden zur Bestimmung von THD, IMD, NCD und MTND betrachtet. Hierzu werden mehrere Messungen an verschiedenen Audiosystemen durchgeführt. Zudem wird die Reaktion der Messmethoden auf Parameterveränderungen in einem künstlichen System untersucht. In der Evaluation werden die Vor- und Nachteile der einzelnen Methoden aufgezeigt. Hierzu wird auch das Verhalten der Methoden bei schmalbandigen Verzerrungen und bei "Off-Axis"-Messungen betrachtet. Zudem werden die Verzerrungensangaben von Herstellern kritisch diskutiert. Zum Schluss wird eine Empfehlung für die Anwendungsgebiete der Methoden bzw. Kennzahlen gegeben.



Stelzenmüller, Max Erich;
Untersuchung zum Lautstärkeverhalten gerichteter Schallquellen in objektbasierter Auralisation. - Ilmenau. - 90 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2022

Die Richtwirkung ist eine wichtige akustische Eigenschaft von Schallquellen. Diese kann in objektbasierten 3D-Audiowiedergabesystemen durch verschiedene Methoden reproduziert werden. Diese Arbeit untersucht das Lautstärkeverhalten virtueller gerichteter Schallquellen bei deren Rotation im kopfhörerbasierten 3D-Audiowiedergabesystem VIPRA, welches auf der Wellenfeldsynthese basiert. Die Reproduktion der Richtwirkung erfolgt in der VIPRA-Portalmethode durch eine Lautstärkeinterpolation zwischen Punktschallquellen. Auf Basis der vorhandenen Implementierung wird eine angepasste Berechnungsmethode erarbeitet und implementiert. Diese hat das Ziel, den Lautstärkeverlauf bei Rotation zu homogenisieren. Zur Evaluation der Methoden werden reale Schallerzeuger mit einem Mikrofonarray aufgenommen und in das System eingebunden. Anschließend werden die Methoden anhand Klangfärbung, Reproduktion der Richtcharakteristik und dem Lautstärkeverlauf bei Rotation verglichen. In einem informellen Hörtest wird die minimale Wiedergabeauflösung der neuen Implementierung untersucht. Die Untersuchungen zeigen, dass die neue Implementierung die bisher auftretenden Sprünge im Lautstärkeverlauf minimiert. Dadurch wird eine bessere Reproduktion der Richtcharakteristik ermöglicht. Der Hörtest gibt Hinweise darauf, dass virtuelle gerichtete Schallquellen, unabhängig von der Richtungsauflösung der Wiedergabe, als natürlich wahrgenommen werden können. Die minimale Richtungsauflösung hängt von der Art der Schallquelle sowie der Anwendung ab. Die VIPRA-Portalmethode sollte in weiterführenden Forschungsarbeiten mit anderen Verfahren zur Reproduktion der Richtwirkung verglichen werden. Diese Vergleiche sollten sowohl analytisch als auch in formellen Hörtests durchgeführt werden.



Patt, Steven;
Evaluation des Standes der Technik zum transparent Schalten von In-Ear-Kopfhörern. - Ilmenau. - 89 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2021

Moderne Kopfhörer und Hearables können immer mehr Funktionen erfüllen, die dem Träger mehr Komfort oder Unterstützung im Alltag bieten sollen. Bei offenen oder halboffenen Kopfhörern wird zum Beispiel der von außen auftretende Schall mit Active Noise Cancellation unterdrückt. Bei geschlossenen Kopfhörern ist aber genau dieser Schall manchmal erwünscht, um wichtige Signale von außen, trotz der geschlossenen Bauweise, wahrnehmen zu können. Diese Funktion, Schall durch die Kopfhörer wahrzunehmen, wird durch sogenannte Hear-Through Algorithmen ermöglicht. Der Fokus dieser Arbeit liegt darauf, einen Überblick über den aktuellen Stand der Technik zu In-Ear Hearables mit Hear-Through Funktionalität zu geben, wie diese konstruiert sein sollten und wie Übertragungsfunktionen zwischen den Mikrofonpositionen und dem Trommelfell definiert werden. Aufgrund der geringen Distanz zwischen dem Lautsprecher und den Mikrofon eines Hearables können vermehrt Rückkopplungen auftreten. Drei Rückkopplungsfilterverfahren werden vorgestellt, von denen zwei, die Prediction Error Methode und ein differentielles Mikrofon Array, auf ihren Einfluss auf die räumliche Wahrnehmung mittels einer Simulation untersucht werden. Diese verändern das auditive Ereignis unterschiedlich stark und können somit die auditive Richtungs- und Umgebungswahrnehmung negativ beeinflussen.



Meyer, Dominik;
Einfluss des Kopfhörermodells auf reale und virtuelle Schallquellen in Augmented Acoustics Anwendungen. - Ilmenau. - 37 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2020

In dieser Arbeit wird der Einfluss des Kopfhörermodells auf reale und virtuelle Schallquellen in Augmented Acoustics Anwendungen untersucht. Dazu wurden binaurale Impulsantwortmessungen mit einem Kunstkopf durchgeführt. Acht Modelle wurden physikalisch und perzeptiv untersucht. Die physikalische Analyse zeigt die Eigenschaften des Kopfhörers und ihre Auswirkungen auf das reale Schallfeld. Auch der Effekt der Neupositionierung wurde berücksichtigt. Um den Einfluss auf das externe Schallfeld perzeptiv zu untersuchen, wurde ein Multi-Stimulus Test mit versteckter Referenz- und Anker mit 15 Testpersonen durchgeführt. Die Ergebnisse zeigen, dass verschiedene Arten von Kopfhörern unterschiedliche Auswirkungen auf reale und virtuelle Schallquellen haben und dass die Neupositionierung Variationen im Frequenzspektrum verursacht.



Doll, Oliver;
Extraktion akustischer Umgebungsmerkmale aus binauralen Audiostreams. - Ilmenau. - 64 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2020

Um die Position einer Person in einem Raum zu ermitteln, werden CNNs und binauralen Daten verwendet. Ein funktionierendes Lokalisationssystem auf Basis binauraler Daten kann einexternes Trackingsystem ergänzen. In einem systematischem Testverfahren werden zwei Ansätze verglichen. Ein Ansatz baut den interauralen Merkmalen IPD und ILD auf, während der zweite Ansatz auf den reinen binauralen Aufnahmen aufbaut. Bei dem Testverfahren wird das Netzwerk schrittweise um Schichten erweitert und einige Parameter getestet. Um die Positionder Person zu bestimmen, wird die DOA und die Distanz zur Quelle geschätzt. Zusätzlichwird der aktive Lautsprecher klassifiziert, der als Bezugspunkt dient, um die Position im Raumzu bestimmen. Für diese Aufgabe wird ein Datensatz aufgenommen, der vier verschiedene Lautsprecherpositionen beinhaltet. Bei den Aufnahmen wird keine Beschränkung der DOA vorgenommen und die Distanz variiert im Bereich zwischen 0,5 m und 4,0 m. Aufgrund der COVID-19-Pandemie konnte die Datensatzaufnahme nicht beendet werden. Die Ergebnisse zeigen, dass der vorgestellte Ansatz keine verwertbaren Ergebnisse liefert und wesentlicher Verbesserung bedarf. Das systematische Testverfahren konnte aufgrund mangelnder Ergebnisse nicht bewertet werden. Während des Testverfahrens konnte die Genauigkeit auf dem Testdatensatz kaum gesteigert werden. Auf Basis der wenigen Ergebnisse lässt sich vermuten, dass sich die interauralen Merkmale besser für die DOA-Bestimmung eignen und die reinenbinauralen Audiodaten sich besser für die Distanzbestimmung eignen.



Menz, William;
Vergleich von Ansätzen zur akustischen Anomalie Erkennung auf Basis vorhandener Testdatensätze. - Ilmenau. - 56 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2020

Audioanalysen sollen in verschiedenen Industriezweigen Überwachungen von Produktionsprozessen und die Überprüfung der fertigen Bauteile vollziehen. Ein Ansatz ist es, mit Luft als Übertragungsmedium des Schalls zu arbeiten und Luftschallaufnahmen zu generieren, welche anschließend für die Überprüfung von der Produkt- oder Produktionsprozessqualität genutzt werden können. Neben einer zuverlässigen Überprüfung wird die Verwendung maschineller Unterstützungsverfahren angestrebt. Diese Verfahren sind dazu konzipiert, Anomalien in den Audiodaten zu erkennen. Dies geschieht in der vorliegenden Arbeit mit Hilfe von neuronalen Netzen. In der Anomalieerkennung wird angestrebt, mit möglichst wenig anormalen Daten zu arbeiten. da diese in der Erzeugung sehr aufwendig und teuer sind. Diese Herausforderung kann durch sogenannte Autoencoder (AE) bewältigt werden, da sie Daten in die wichtigsten Bestandteile zerlegen und anschließend rekonstruieren. Wird angenommen, dass normale und anormale Daten unterschiedliche Bestandteile haben und das Netz darauf trainiert wird die normalen Daten zu rekonstruieren, so ergibt sich eine schlechtere Rekonstruktion anormaler Daten. Es wurden unterschiedliche Ansätze und Varianten von Autoencodern. anhand eines vorhandenen Testdatensatzes, welcher aus Luftschallaufnahmen besteht, getestet. Dies geschieht, um festzustellen, welcher Ansatz eine vielversprechende Unterstützung in der Industrie sein könnte. Weiterhin wird der Einfluss der Datenvorverarbeitung auf die Ergebnisse der AE betrachtet. Dies wird durch mehrfaches Trainieren der AE auf unterschiedlich vorverarbeitete Daten erreicht. Die Ergebnisse dieser Arbeit zeigen, dass der Variational-Ansatz (VAE) die niedrigsten Werte liefert. Der Shared-Weights-Ansatz (SWAE) erzielte am häufigsten die höchsten Werte, dicht gefolgt vom Simple-Ansatz (SAE). Somit sind der SWAE und der SAE vielversprechend für den Einsatz in der Industrie. Bei der Vorverarbeitung stellte sich heraus, dass die "Fast Fourier Transform" Größe und die dazugehörige Hopsize, sowie die Concat-Anzahl der verwendeten Frames einen erheblichen Einfluss auf das Ergebnis haben und somit für jeden Anwendungszweck neu angepasst werden sollten. In weiterführenden Arbeiten könnten der Convolutional- sowie der Stacked-Denoising-Ansatz in einen Vergleich einbezogen werden, da diese in der Arbeit nicht betrachtet wurden.



Kirchhoff, Kilian;
Entwicklung eines Verfahrens zur parallelen Verwendung eines elektrodynamischen Schallwandlers als Schallquelle und Schallempfänger. - Ilmenau. - 66 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2020

Die vorliegende Arbeit beschäftigt sich mit der Fragestellung, inwiefern ein elektrodynamischer Schallwandler simultan als Schallquelle und Schallempfänger nutzbar ist. Es werden zunächst Testmessungen zur gleichzeitigen Nutzung vorgenommen. Dies dient der Findung geeigneter Messparameter und der Entwicklung eines Messaufbaus. Es folgt die Vorstellung eines Verfahrens mit entsprechender Hardwarekonfiguration sowie die Durchführung akustischer Messungen. Die Daten werden mittels digitaler Signalverarbeitung ausgewertet und anschließend evaluiert. In dieser Arbeit wird gezeigt, dass eine parallele Verwendung eines elektrodynamischen Wandlers als Quelle und Empfänger mit dem vorgestellten Verfahren in Grenzen möglich ist. Außerdem wird eine Aussage über die Qualität dieses Verfahrens bei unterschiedlichen Wandlern gegeben. Im Anschluss wird ein Verfahren auf Hardwarebasis gegeben und anhand eines Aufbaus sowie zugehöriger Simulation erläutert. Im Ausblick wird auf notwendige zukünftige Forschung eingegangen.



Häußler, Jonathan;
Automatische Erkennung der Raumgröße und -geometrie auf Basis binauraler Signale. - Ilmenau. - 51 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Die Analyse der geometrischen Eigenschaften eines Raumes anhand von akustischen Aufnahmen ist für verschiedenste Anwendungen interessant. In dieser Arbeit wird untersucht, in wie weit sich Künstliche Neuronale Netze (KNNs) für eine solche Analyse eignen. Zuerst wird ein Überblick über Konzepte und Entwicklungen in der KNN-Forschung gegeben, anschließend wird das Erstellen und die Verarbeitung des verwendeten Datensatzes erläutert. Abschließend werden die Netzstrukturen der untersuchten KNNs sowie die Experimente beschrieben, die in dieser Arbeit durchgeführt wurden und die Ergebnisse ausgewertet.



Entwicklung eines Simulationsmodells zur akustischen Lautsprechervermessung eines Mehrwege-Lautsprechersystems. - Ilmenau. - 63 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Die vorliegende Arbeit beschäftigt sich mit der Entwicklung eines Simulationsmodells bzw. Prädiktionsmodells, welches den Amplitudenfrequenzgang eines Mehrwege-Lautsprechersytems im akustischen Fernfeld basierend auf den im Nahfeld gemessenen Amplitudenfrequenzgängen der einzelnen Lautsprecherkomponenten prädiziert. Hierfür wurden vier Mehrwege-Lautsprechersysteme in unterschiedlichen Abständen akustisch vermessen. Es wurden verschiedene Prädiktionsansätze untersucht und auf die Nahfeldmessungen angewendet. Die Prädiktionsergebnisse wurden mit real gemessenen Frequenzgängen verglichen und somit evaluiert. Es konnte gezeigt werden, dass die Prädiktion für einen Frequenzbereich von 20 Hz bis 3 kHz möglich ist und bei den drei untersuchten Standlautsprechern im Durchschnitt nur um 0,5 dB von der Realmessung abweicht. Hierbei wurde der Ansatz nach Struck und Temme um eine Korrekturfunktion erweitert. Der untersuchte Kompaktlautsprecher Smart Soundbox 3 zeigte eine durchschnittliche Abweichung der Prädiktion von der Realmessung von 2,8 dB. Für Frequenzen oberhalb von 3 kHz ist eine Prädiktion auf Basis nach Struck und Temme aufgrund des Zusammenhangs zwischen Wellenlänge und Schallwandabmessungen nicht möglich. Ebenfalls wird in dieser Arbeit gezeigt das eine Prädiktion des Hochtonbereichs mithilfe des logarithmischen Abstandsgesetzes aufgrund der Limitierung im Grenzbereich des Abstandsgesetzes nicht möglich ist.



Surdu, Ileana-Tatiana;
Evaluation of the perceptual mixing time for dynamic binaural synthesis in small rooms for interactive position changes. - Ilmenau. - 63 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Das Ziel der heutigen Audiotechnologien ist es, die menschliche Fähigkeit des 3D-Hörens nachzubilden. Für so einen Prozess werden leistungsfähige Mittel für die Signalaufnahme, -verarbeitung und -wiedergabe benötigt. Die oben genannten Prozesse können mit Hilfe der Binauralsynthese durchgeführt werden. Das Schlüsselelement des Verfahrens ist die binaurale Raumimpulsantwort(BRIR). Die BRIR ist eine spezifische Art von Impulsantwort die enthält Informationen zu dem Raum als auch zu dem Empfänger. Für die finale virtuelle Audioszene wird die BRIR mit einem echofreien, mono Audiosignal gefaltet. Je nach der ermöglichten Bewegungsfreiheit für den Nutzer, die benötigte Datenmenge erhöht sich dementsprechend. Eine Datenkompressionmöglichkeit ergibt sich aus dem Verlust der Raumorientierung in einem diffusen Schallfeld. Der Zeitpunkt zwischen den frühen und späten Reflexionen wird als "Mixing Time" bezeichnet. Ein genereller Mixing-Time-Wert für den gesamten Raum würde zu dem Ersetzen von späten BRIR Anteilen mit einer Konstante führen. Eine optimale Zusammenstellung von BRIR-Komponenten wird zu einer effizienten und unschädlichen Datenminimierung führen. Das Ziel der vorliegenden Arbeit besteht darin, zu untersuchen, ab welcher Mixing-Time und unter welchen Umständen die Rauminformationen des diffusen Anteils einer binauralen Raumimpulsantwort (BRIR) vernachlässigbar werden. Hierzu wurden die diffusen Anteile der BRIRs nach verschiedenen Mixing-Time-Werten untereinander ersetzt, während der Direktschall sowie eventuelle frühe Reflexionen nicht verändert wurden. Als Datengrundlage wurden BRIRs aus zwei unterschiedlichen Raumpositionsmessungen verwendet, angeregt von einer Schallquelle platziert jeweils in zwei verschiedene Positionen. Zur Evaluierung wurde ein Hörtest mit einer statischen Binauralsynthese durchgeführt mit erfahrenen Probanden. Eine globale Analyse der Ergebnisse zeigt eine deutliche Abhängigkeit zwischen der räumliche Orientierung und der relativen Positionierung von Sender und Empfänger. Für die Probanden war eine Raumorientierung für große Entfernungen trotz später Konkatenationszeiten möglich. Die BRIR-Kombination unterschiedlicher Empfänger- und Schallquelleposition zeigte sich als nicht effizient für eine mögliche Datenkompression. Für die Nachhallphase wurde eine Anfangszeit von mindestens 75 ms als notwendig ermittelt.



Müller, Clemens;
Entwicklung und Evaluierung von Methoden zur Synthese von binauralen Raumimpulsantworten zur Abbildung neuer Quellpositionen. - Ilmenau. - 58 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

In dieser Bachelorarbeit sollen Methoden zur Synthese von binauralen Raumimpulsantworten mit neuen Quellpositionen entwickelt und evaluiert werden. Als Grundlage wurde die Arbeit von Christina Mittag verwendet. Sie hatte 2012 drei Algorithmen zur Synthese von binauralen Raumimpulsantworten mit neuen Hörerpositionen entwickelt und evaluiert. Diese werden so angepasst, dass eine Synthese neuer Quellpositionen möglich ist. Für die Erstellung und Bewertung der neuen Algorithmen werden binaurale Raumimpulsantworten von sechs kreisförmig angeordneten Lautsprechern verwendet. Diese Aufnahmen entstanden während eines früheren Medienprojekts im Medienlabor 2 der Technischen Universität Ilmenau. Die Evaluation erfolgt zuerst anhand der technischen Kriterien Nachhallzeit (T60), Direktschallenergie-zu-Nachhallenergie Verhältnis (DRR), Deutlichkeitsmaß (C50) und Klarheitsmaß (C80). Anschließend wird die perzeptive Evaluation mithilfe eines Hörtest durchgeführt und ausgewertet, um die Ergebnisse der beiden Evaluationen vergleichen zu können. Zu diesem Zweck wird ein Hörtest durchgeführt in dem die Probanden gebeten werden Externalität der Synthese sowie die allg. Unterschiede, die Distanzunterschiede und die Richtungsunterschiede zwischen der Referenz und der Synthese zu bewerten. Nach dem Vergleich beider Evaluationen lässt sich sagen, dass die Synthese aus einer Messung in bestimmten Grenzen annähernd fehlerfrei verläuft. Dieselbe Aussage lässt sich auch für die Synthese aus mehreren interpolierten Messungen treffen.



Stolz, Georg;
Untersuchung zu den meteorologischen Einflüssen auf die Schallmesstechnik. - Ilmenau. - 54 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Die Bekämpfung von Lärm ist ein wichtiger Teil des Umweltschutzes. Um Lärm effektiv zu mindern, ist es wichtig zu wissen, wo er entsteht und wie er sich durch die Luft ausbreitet. Im ersten Teil dieser Arbeit werden daher die meteorologischen Einflüsse auf die Schallausbreitung wie Wind, Temperatur und Luftfeuchte erörtert und Verfahren zur qualitativen und quantitativen Bestimmung dieser Einflüsse vorgestellt. Um den Schallpegel in Abhängigkeit von der Schalleinfallsrichtung zu ermitteln wird außerdem ein Beamforming-Algorithmus für drei in einem gleichseitigen Dreieck angeordnete Mikrofone ausgearbeitet. Basierend auf diesen Grundlagen werden Programme zur Berechnung des Absorptionskoeffizienten der Luft und zur Bestimmung der qualitativen Bedingungen für die Schallausbreitung unter der Einbeziehung meteorologischer Daten entwickelt. Der Beamformer wird ebenfalls implementiert und getestet.



Möller, Fabian;
Design eines Ohrhörer-Gehäuses für MEMS-Lautsprecher. - Ilmenau. - 66 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Die vorliegende Arbeit befasst sich mit der Simulation von miniaturisierten Schallführungen mit Hilfe von elektroakustischen Ersatzschaltbildern. Ziel der Simulationen ist es einen In-Ear-Kopfhörer-Gehäuseentwurf für einen piezoelektrischen MEMSLautsprecher zu entwickeln, der die Resonanzfrequenz desMEMS-Lautsprechers dämpft und somit den notwendigen Einsatz digitaler Filter reduziert. Dafür werden verschiedene miniaturisierte Schallführungskonzepte einzeln betrachtet und analysiert und auf Basis dieser Erkenntnisse ein In-Ear-Kopfhörer-Modell erstellt. Dieses Modell wird den Anforderungen der Problemstellung gerecht und bietet dabei noch die Möglichkeit von kompakten Gehäuseabmessungen. Abschließend wurde eine Evaluierung durchgeführt um darauf aufbauend einen Ausblick auf weitere Schallführungskonzepte und eine höhere Simulationsgenauigkeit geben zu können.



Seipel, Marius;
Entwicklung und Evaluierung von Messmethoden zur In-Situ Bestimmung der Raumakustik und der Gewinnung von binauralen Raumimpulsantworten. - Ilmenau. - 71 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Das Ziel der auditiven Augmented Reality ist es, eine hochgradig immersive und auditorisch plausible Illusion zu schaffen, die virtuelle Audioobjekte und Szenarien mit der realen akustischen Umgebung kombiniert. Für diesen Anwendungsfall ist es notwendig, die Akustik des aktuellen Raumes zu schätzen. Eine Diskrepanz zwischen realer und simulierter Akustik wird vom Hörer leicht erkannt und führt wahrscheinlich zu einer Im-Kopf-Lokalisation oder einer unrealistischen akustischen Umhüllung der virtuellen Schallquellen. Diese Arbeit untersucht State-of-the-Art-Algorithmen zur blinden Nachhallzeitschätzung, die häufig für Sprachverbesserungsalgorithmen oder in Enthallungsanwendungen verwendet werden, und wendet sie auf binaurale Ohrsignale an. Das Ergebnis dieser Algorithmen kann verwendet werden, um den am besten geeigneten Raum aus einer Raumdatenbank auszuwählen. Eine Raumdatenbank könnte beispielsweise gemessne oder simulierte binaurale Raumimpulsantworten beinhalten, die direkt zur Realisierung einer binauralen Reproduktion verwendet werden können. Erste Auswertungen zeigen vielversprechende Ergebnisse bei geringem Rechenaufwand. Weitere Strategien zur Verbesserung der verwendeten Methode werden vorgeschlagen, um eine genauere Nachhallzeitschätzung zu ermöglichen.



Seyfferth, Constantin;
Untersuchung zur Verwendung von Lautsprechern als Mikrofon. - Ilmenau. - 62 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Die vorliegende Arbeit beschäftigt sich mit der Untersuchung eines piezoelektrischen MEMS-Lautsprechers hinsichtlich seiner Eignung als Mikrofon. Um die Eigenschaften des Wandlers anhand gängiger Mikrofonkriterien zu charakterisieren wurde eine Messschaltung konzipiert, sowie akustische Messungen durchgeführt. Die Messergebnisse wurden evaluiert und mittels digitalen Signalverarbeitungsprozessen entzerrt. Es konnte gezeigt werden, dass die Verwendung des Lautsprechers als Mikrofon möglich ist und aufgrund zufriedenstellender akustischer Eigenschaften Flexibilität im Bereich der Verstärkung und Signalverarbeitung bietet. Abschließend wurde ein Ansatz zur gleichzeitigen Verwendung als Lautsprecher und Mikrofon vorgestellt.



Mauder, Danny;
Erstellung eines Modells zur Prädiktion des von elektrodynamischen Ohrhörern erzeugten Schalldrucks. - Ilmenau. - 61 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Die vorliegende Arbeit beschreibt die Entwicklung eines generalisierten Modells zur präzisen Vorhersage des von elektrodynamischen In-Ear-Kopfhörern erzeugten Schalldrucks. Dazu wurde ein auf maschinellem Lernen basierendes Modell mit Daten aus elektroakustischen Messungen von In-Ear-Kopfhörern trainiert. Verschiedene Ansätze zur Entwicklung dieses Modells wurden verfolgt, beschrieben und evaluiert. Anschließend wurden etwaige Einschränkungen diskutiert und mögliche Verbesserungsansätze beschrieben. Es konnte gezeigt werden, dass die Entwicklung eines generalisierten Modells mithilfe von Methoden des maschinellen Lernens prinzipiell möglich erscheint, wenngleich die Prädiktionsgenauigkeit des Modells Optimierungspotential aufweist.



Kirner, Jakob;
Detektion von Leckagen und Undichtigkeiten durch Luftschallanalyse unter Einbeziehung von Methoden des Maschinellen Lernens. - Ilmenau. - 61 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Die Nutzung von Druckluft als Energieträger ist Bestandteil vieler Industriezweige. Zuverlässige Wartungsmethoden für gasführende Infrastruktur sorgen dabei für Sicherheit und Kosteneinsparungen. Einige Verfahren der Dichtigkeitsmessung basieren auf der Messung von Schallemissionen. Im Bereich der luftschallbasierten Leckagendetektion setzt man unter anderem auf das bloße Gehör von geschultem Personal oder auf Verfahren wie die Ultraschallmethode. In dieser Arbeit wird die Möglichkeit einer luftschallbasierten Leckagendetektion im hörbaren Bereich unter Einbeziehung von künstlicher Intelligenz untersucht. Dabei werden Geräusche aus einer künstlichen Leckage an einer pneumatischen Vorrichtung aufgenommen, vorverarbeitet und von einem neuronale Netzwerk analysiert.



Küller, Jan;
Simulationen von MEMS-Lautsprechern mit der Finiten-Elemente-Methode (FEM). - Ilmenau. - 72 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Die vorliegende Bachelorarbeit entwickelt ein Simulationsmodell eines Lautsprecherprototyps auf MEMS-Basis anhand numerischer Simulationsverfahren. Das Ziel dieser Forschung ist eine umfangreiche Simulation und Analyse des Lautsprechers mittels Finiter Elemente Methode (FEM). Dabei wird das elektromechanische und akustische Verhalten untersucht. Ein vorhandenes Geometriemodell dient als Modellgrundlage für die FEM-Software. Zunächst wird das elektromechanische Verhalten im Vakuum analysiert. Anschließend wird das akustische Verhalten im linearen Arbeitsbereich und schließlich im nichtlinearen Arbeitsbereich simuliert. Ferner werden die Einflüsse verschiedener Simulationsmethoden und Randbedienungen geprüft. Vorangegangene Messungen bewerkstelligen die Evaluation der Simulationsergebnisse.Die Ergebnisse zeigen ein präzises Simulationsmodell eines effizienten Lautsprechers auf MEMS-Basis, das mit Messungen übereinstimmt. Dabei kann das Modell auf andere Designs des MEMS-Lautsprechers übertragen werden. Diese Grundlage ermöglicht es, künftige Designänderungen effizient und mit hoher Genauigkeit virtuell zu analysieren.



Flemming, Sebastian;
Konzeption und Implementierung eines integrierten Prototyps für Content-Tracking und Duplikatsdetektion in A/V Archiven. - Ilmenau. - 58 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2018

Im Fraunhofer-Institut für Digitale Medientechnologie (IDMT) wurden mehrere Komponenten zur Identifizierung perzeptuell identischer Video- und Audiosegmente entwickelt. Das Ziel dieser Bachelorarbeit war es, ein Konzept für ein System zu entwickeln, das die Kombination der Ergebnisse dieser Komponenten ermöglicht, und es prototypisch zu implementieren. Unter anderem sollen damit A/V-Archive in die Lage versetzt werden, die Wiederverwendung von A/V-Segmenten effizient zu analysieren, Redundanzen zu vermeiden und Metadaten automatisch zu prüfen bzw. zu propagieren. Hinführend werden dafür zunächst grundlegende Problemstellungen und Konzepte, speziell die der Komponentenergebnisse, der sogenannten "Matches", geklärt und ein konkreter Vorschlag für das Gesamtsystem dargelegt. Nach einer Begrenzung des Fokus auf die Bestandteile "Matcher-Storage-System", welches für die Komplettverwaltung des Systems verantwortlich ist, und "Match-Datenbank", welche die Ergebniswerte enthält, wird eine detaillierte Analyse der Anforderungen an diese Komponenten durchgeführt. Im anschließenden Teil der Bachelorarbeit erfolgt eine allgemeine Betrachtung von Datenbanksystemen und eine Auflistung vorhandener Datenbankkonzepte. Angeschlossen daran werden unter Zuhilfenahme der Analyseerkenntnisse mehrere Ansätze für mögliche Match-Speichermodelle präsentiert und bewertet, ehe sich für ein Modell und ein passendes Datenbanksystem entschieden wird. Abschließend wird ein Konzept dargelegt, dass die gestellten Anforderungen weitestgehend erfüllen kann, und ein einfacher Prototyp vorgestellt.



Ribecky, Sebastian;
Implementation eines Ambisonics-Wiedergabemoduls und Überprüfung von Möglichkeiten der Vergrößerung der Hörzone bei der Wiedergabe von Ambisonics-Aufnahmen. - Ilmenau. - 64 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2018

Ambisonics ist ein Verfahren zur Aufnahmen und Wiedergabe räumlicher Audioszenen, welches Wiedergabeverfahren darauf abzielt, ein Schallfeld zu rekonstruieren. Dies erfolgt durch Projektion der Schallfeldsignale in eine Menge Kugelflächenfunktionen, und diese mittels einer mathematischen Lösung in ein gegebenes Wiedergabesystem decodiert. Daher enthalten die Übertragungssignale eine Lautsprecher-unabhängige Darstellung des Schallfelds, anstelle von einzelnen Kanalsignalen für jeden Lautsprecher (kanalbasierte Systeme). Dies bietet viele Vorteile, insbesondere für Lautsprecher-Wiedergabesysteme, bei denen die Flexibilität der Lautsprecherplatzierung ein Schlüsselrolle spielt. In den letzten Jahren ist das Interesse an dieser Technik stark gestiegen. Der Hauptgrund dafür sind die Fortschritte, die bei den Signalverarbeitungstechnologien gemacht wurden, die in der Realisierung leistungsfähiger und zugänglicher Werkzeuge für Ambisonics-Dekodierung resultiert haben. Die Wiedergabe von Ambisonics-Signalen über Lautsprecher hat aber ein großes Nachteil. Der Bereich ("Sweet Spot"), in dem das aufgenommene Schallfeld korrekt wiedergegeben wird ist sehr klein. In dieser Bachelorarbeit wird ein Ambisonics-Wiedergabesystem konzipiert und in ein Signalverarbeitungs-Framework des Fraunhofer-Instituts für Digitale Medientechnologie integriert. Dieses System ist in der Lage, Ambisonics-Aufnahmen erster Ordnung in einem regulären Lautsprecherarray wiederzugeben. Dafür werden die Schallfeldsignale in Echtzeit dekodiert. Durch Kombination dieses Systems mit der ebenfalls am Fraunhofer IDMT entwickelten "Spatial Sound Wave"-Technologie werden die Fähigkeiten des Systems erweitert, so dass es in einer Vielzahl von Lautsprecheranordnungen eingesetzt werden kann. In einem Hörtest werden die Möglichkeiten zur Vergrößerung des Hörbereichs untersucht. Dies geschieht durch Messen und Vergleichen der Hörzonen, die durch das entwickelte Ambisonics-System mit und ohne Spatial Sound Wave-Technologie erzeugt werden. Die Ergebnisse zeigen, dass die Vergrößerung des Hörbereiches nur sehr gering ausfällt. Aufgrund der gewonnenen Erkenntnisse werden zukünftige Entwicklungs- und Forschungsempfehlungen zur Erzielung größerer Hörzone gegeben.



Hock, Kevin;
Untersuchung zur Aufnahme raumakustischer Diffusschallanteile unter Verwendung weniger Mikrofone für eine räumliche Auralisation. - Ilmenau. - 92 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2018

Dank wellenfeldbasierter Tonwiedergabesysteme ist es möglich, komplexe auditive Szenen zu reproduzieren. Die Auralisation ist hierzu ein Verfahren zur Simulation realer oder virtueller Räume. Diese Arbeit zeigt die erforderlichen Phasen der Auralisation auf und führt in die bisherig angewandten Aufnahme- und Verarbeitungsprozesse ein. Basierend auf diesen Erkenntnissen wird Spatial Impulse Response Rendering als ein alternatives Verfahren zur Messung realer Räume und anschließender Signalverarbeitung zur Filtergenerierung detailliert erläutert. Spatial Impulse Response Rendering wurde dabei auf dessen Eignung für die objektbasierte Auralisation untersucht. Der Fokus liegt hierbei auf einer plausiblen Reproduktion des Diffusschalls unter Verwendung möglichst weniger Mikrofone während der Messungen. Dabei wurden verschiedene Mikrofonanordnungen auf deren Eignung untersucht. Die Evaluation der Messverfahren legt nahe, dass die Messung mit einem B-Format-Mikrofon die besten Ergebnisse bei Bestimmung der Diffusität von Schallfeldkomponenten aufweist. Die Durchführung eines informellen Hörtests gibt Hinweise, dass eine Reproduktion des Filtersets aus der Messung des B-Format-Mikrofons perzeptiv natürlicher empfunden wird. Der Hörtest zeigte auch, dass es tendenziell mit den Filtersets der beiden anderen Messmethoden ebenso möglich ist, natürlich wahrgenommenen Diffusschallrekonstruktionen zu ermöglichen. Die Ergebnisse der Arbeit sollten in formell durchgeführten Hörtests und Messungen weiterer Räume unterschiedlicher Geometrie und Nachhallzeit validiert werden. Ebenso sind Verbesserungen der nicht-koinzidenten Mikrofonanordnungen anhand dargestellter Anforderungen möglich, um deren Filter und somit Reproduktion zu optimieren.



Li, Zhenyu;
Localization with rotating microphone arrays. - Ilmenau. - 54 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2018

Die räumliche Ortung von Schallquellen ist Gegenstand der Untersuchung. Mit ihr werden mehrere Anwendungsbereiche wie Sprachverbesserung und Schätzung der Direction of Arrival (DOA) für Multiple-Input, Multiple-Output (MIMO) Systeme in der Kommunikationstechnik erschlossen. Die Arbeit richtet die Aufmerksamkeit auf die Verwendung mehrerer Sensoren, die als Mikrofonarray konfiguriert werden. Bisher wurden erste Versuche zur Messung von Lautsprecherpositionen mittels Mikrofonarrays unternommen, aber diese Versuche erwiesen sich in der Praxis als nicht präzise genug. Ein neuer Ansatz zur Lokalisierung einer Schallquelle durch rotierende Mikrofonarrays beruht auf dem Dopplereffekt und wurde in [1] eingeführt. In dieser Thesis wird eine innovative Methode für ein rotierendes Mikrofonarray mathematisch dargestellt und in einer Raumumgebung mit modellierten akustischen Reflektionen numerisch simuliert. Die Leistungsfähigkeit dieser Methode wird in Bezug auf die Genauigkeit der Lokalisierung beurteilt. Darüber hinaus werden eine Reihe von Einflussfaktoren wie Drehgeschwindigkeit, Arraygröße, Lautsprecherabstände, Raumakustik, Abtastraten, Signal-Rausch-Verhältnis (SNR) und relative Schallquellenanordnung zum Mikrofonarray untersucht. [1] Klefenz F, Sporer T. Apparatus, method and computer program for localizing a sound source: U.S. Patent 8,649,529[P]. 2014-2-11.



Blau, Michael;
Implementierungsmöglichkeiten für Wiedergabesysteme mit dynamischer Binauralsynthese. - Ilmenau. - 39 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2018

Die dynamische Binauralsynthese ermöglicht die Wiedergabe von Audiosignalen über Kopfhörer, bei der ein authentischer, räumlicher Höreindruck entsteht. Für die Anpassung der Signale an Ausrichtung und Position des Hörers ist eine aufwändige Signalverarbeitung in Echtzeit notwendig. Hallfreie Eingangssignale werden mit wechselnden Impulsantworten, die die Übertragungsstrecke von der Quelle zum Ohr in einer virtuellen Umgebung repräsentieren, gefaltet. In dieser Arbeit werden unterschiedliche Faltungsalgorithmen bezüglich ihrer Eignung für die dynamische Binauralsynthese untersucht und optimiert. Dabei werden Impulsantwortlänge, Latenz, benötigte Rechenleistung und Dauer der Übernahme neuer Impulsantworten in Relation gestellt. Damit die Randbedingungen formuliert und die zu optimierenden Größen gewichtet werden können, wird neben den theoretischen Überlegungen ein unmittelbarer Bezug zu echtzeitfähigen Signalverarbeitungssystemen hergestellt. Für das Ziel - den Entwurf einer ressourcenschonenden Implementierung - werden daher die Funktionsweisen und Eigenschaften von Digitalen Signalprozessoren (DSPs) und Field Programmable Gate Arrays (FPGAs) berücksichtigt. Für eine mögliche Implementierung und zur Abschätzung technischer Spezifikationen wurde ein Testsystem zur Audiosignalverarbeitung auf FPGA-Basis aufgebaut.



Köhler, Mona;
Weakly supervised object detection. - Ilmenau. - 78 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2018

In den letzten Jahren wurden mithilfe neuronaler Netze große Fortschritte im Bereich der Bildklassifikation und der Objektdetektion erzielt. Die Aufgabe eines Objektdetektors ist es in Bildern die Position und die Größe verschiedener Objekte (z.B. Gesichter, Fahrzeuge, Tiere oder Personen) zu ermitteln. Für das Training der aktuell besten Detektoren werden dabei Annotationen aller Objektinstanzen benötigt. Die Annotation der Bilder stellt sich als sehr zeit- und arbeitsaufwendig heraus. Um dieses Problem zu umgehen, wird versucht mit schwach annotierten Bildern zu arbeiten. Das heißt als Annotation ist lediglich die Information vorhanden, welche Objektklassen sich auf dem Bild befinden und welche nicht. Im Rahmen dieser Arbeit werden zwei, auf neuronalen Netzen basierende, schwach überwachte Objektdetektoren nachimplementiert, trainiert und auf Testbilder angewandt. Darauf folgend werden die entstehenden Detektionen als Annotation für zwei stark überwachte Objektdetektoren verwendet. Die stark überwachten Objektdetektoren werden zum Vergleich zusätzlich auf den Ground-Truth-Annotationen trainiert. Zur Evaluation werden drei verschiedene Datensätze verwendet. Anschließend werden mögliche Fehlerquellen, Probleme und Verbesserungspotentiale diskutiert. Die Ergebnisse zeigen, dass die schwach überwachte Objektdetektion im Vergleich zu stark überwachten Objektdetektoren noch deutlich schlechtere Detektionen hervorbringt. Trotzdem kann sie als Hilfsmittel eingesetzt werden, um beispielsweise den Annotationsaufwand zu senken.



Stippler, Carmen;
Evaluierung und Anpassung von Algorithmen zum Matching von Key-Frames. - Ilmenau. - 113 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2018

Die technische Analyse der Inhalte von Fernsehbeiträgen spielt eine wichtige Rolle für die Verwaltung, Archivierung und Zuordnung des Videomaterials. Für die Zuweisung von Sequenzen eines Videos zu ihrem Originalmaterial innerhalb einer Datenbank wird in dieser Arbeit das Key-Frame-Matching betrachtet. Dafür wird ein Video durch seine repräsentativen Schlüsselbilder, sogenannte Key-Frames dargestellt. Die Key-Frames der betreffenden Originaldatei stimmen jedoch nicht immer mit den Key-Frames der Videosequenz überein, zum Beispiel (z. B.) da in dem zusammengestellten Beitrag Bildmanipulationen durchgeführt wurden. Aus diesem Grund muss der Vergleich anhand spezifischer Beschreibungen der Key-Frames erfolgen. Ziel dieser Arbeit ist der Vergleich von Methoden zur kompakten Repräsentation eines Bildes. Unter Berücksichtigung des Zeit- und Speicheraufwandes werden die Methoden hinsichtlich der korrekten Zuordnung ähnlicher Bilder untersucht. Hierfür erstellt die Autorin eine Datenbank und entnimmt zufällig Bilder. Diese werden in Orientierung an Fernsehbeiträgen aus dem Nachrichtengenre durch zwei Bauchbinden oder eine Variante von Cropping manipuliert. Anschließend erfolgt eine Prüfung der mit einer Methode ermittelten ähnlichsten Bilder, ob diese das jeweilige Originalbild beinhalten. Um die Methoden zu verbessern, werden auf Grundlage verschiedener Quellen Anpassungen und Erweiterungen getestet. Aus den Ergebnissen werden Empfehlungen hinsichtlich der Methoden mit der besten Performance inklusive der damit verbundenen Einschränkungen bezüglich Zeit- und Speicherbedarf geschlussfolgert.



Pachatz, Nicolas;
Untersuchungen zur Relevanz raumakustischer Parameter bei Anpassung eines Binauralsynthesesystems an die Raumakustik des Abhörraumes. - Ilmenau. - 53 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2017

In dieser Arbeit werden mehrere Algorithmen vorgestellt und entwickelt, um bei binauraler Wiedergabe mittels Kopfhörer die Distanzwahrnehmung von akustisch divergenten Räumen zu verbessern. Hierbei besteht das Problem, dass der Zuhörer erwartet, die gleiche Akustik des Raumes in dem er sich befindet, auch über Kopfhörer zu hören. Ist dies nicht der Fall, kommt es zum Raumdivergenzeffekt, der bei Wiedergabe mittels Binauralsynthese die externale Wahrnehmung verschlechtert. Das Ziel dieser Arbeit ist es, die raumakustischen Parameter zu finden, welche für die verschlechterte Lokalisierung und Externalisierung binauraler Signale bei Raumdivergenz verantwortlich sind. Die Algorithmen synthetisieren dabei aus zwei gemessenen binauralen Raumimpulsantworten (BRIRs) neue Datensätze. Es werden insgesamt drei Methoden implementiert. Das erste Verfahren basiert auf einer Angleichung des Verhältnisses zwischen Direktschall- und Nachhallenergie. Das Zweite widmet sich der Angleichung der Initialzeitlücke, die durch unterschiedliche Abstände von Schallquelle zur Hörposition entsteht. Im dritten Verfahren werden mittels Dynamic Time Warping (DTW) die frühen Reflexionen der BRIRs interpoliert. Diese Verfahren werden auf unterschiedliche Entfernungen und Positionen von zwei Räumen angewendet. Als Räumlichkeiten dienten dabei ein halliger und ein trockener Raum, also mit starker akustischer Divergenz. Die Evaluierung erfolgt mittels eines Hörtests, in dem die Lokalisierung und Externalisierung der binaural-synthetisierten Schallquellen untersucht wird. Die Auswertung des Hörtests befasst sich mit der Eignung der Algorithmen für eine verbesserte räumliche Wahrnehmung mittels Binauralsynthese über Kopfhörer.



Dietrich, Stefan;
Untersuchungen zur räumlichen auditiven Wahrnehmung bei Verwendung eines Knochenleitungshörers. - Ilmenau. - 43 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2017

Das knochenübertragene Hören kann eine nützliche Alternative für Menschen mit Schädigung des Außen- oder Mittelohrs darstellen. Das zu Grunde liegende Prinzip hierbei ist es, Schallwellen unter Nutzung eines mechanischen Schwingers durch den Schädel zu leiten. Dies versetzt den Schädel und somit die darin liegende Cochlea in einen Schwingungszustand, welcher den Eigenschaften des Signals entspricht. So kann die gesamte Signalverarbeitungskette vom Außenohr bis zur Cochlea überbrückt werden. Da dieser Vorgang aber nicht dem natürlichen Hörerlebnis entspricht, ändert sich dieses für den Nutzer eines solchen Geräts. Es ist anzunehmen, dass selbst eine monaurale Erregung beide Cochleae erregt, da die Vibration von einer Seite aus durch den Schädel wandert und die gegenüberliegende Seite in abgeschwächter Form erreicht. Die Auswirkungen dieses Übersprechens sind zweierlei. Zum einen summieren sich die beiden Anregungen und führen zu einer Erhöhung der wahrgenommenen Lautheit und zum anderen entsteht ein diffuseres Schallbild. Die vorliegende Arbeit untersucht die Eigenschaften des räumlichen Hörens und die wahrgenommene Lautheit bei Knochenleitung. Zu diesem Zweck wurde ein Hörtest durchgeführt, wobei ein neuartiger Knochenleiterhörer auf Basis piezoelektronischer Aktoren und normal hörende Probanden zum Einsatz kamen. Der erste Teil des Tests bestand in der Aufnahme von Kurven gleicher Lautheit für Knochenleitung bei binauralen Signalen. Der zweite Teil beinhaltet einen direkten Vergleich der wahrgenommenen Lautheit in einem offenen Schallfeld und bei Knochenhören. Dies gestattet eine objektive Beurteilung der Lautheitsempfindung, welche nicht mit den gleichen Größen wie im offenen Schallfeld gemessen werden kann. Die Ergebnisse des ersten Teils legen nahe, dass der zuvor erwähnte Effekt des Übersprechens auftritt und die auditive Wahrnehmung beeinflussen kann. Aufgrund der großen Varianz unter den Ergebnissen der einzelnen Probanden, ist es allerdings schwer eine eindeutige Tendenz auszumachen. Bemerkenswerter ist ein steiler Abfall der Kurven aller räumlichen Parameter für Frequenzen oberhalb der 6 kHz, was eine besonders feine Wahrnehmung in diesem Bereich impliziert. Diese Annahme wird durch den zweiten Versuchsteil unterstützt, in welchem die wahrgenommene Lautheit bei hohen Frequenzen stets die, der Referenzsignale über Luftschall übersteigt.



Merten, Nils;
Distanzwahrnehmung in virtuellen auditiven Umgebungen mit dynamischem Avatar. - Ilmenau. - 57 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2017

Die menschliche Fähigkeit, Distanzen anhand des Gehörsinns zu bestimmen ist abhängig von diversen Faktoren. Es ist bereits erwiesen, dass Bewegungen während des Hörens in einer genaueren Distanzempfindung resultieren. Das Ziel der vorliegenden Bachelorarbeit ist es, die Auswirkungen von Hörerbewegung in einer virtuellen Hörumgebung zu analysieren. Hierzu wird ein Überblick über die Mechanismen der auditiven Distanzwahrnehmung und der technischen Möglichkeiten zur Erzeugung virtueller Hörumgebungen gegeben. Anschließend wird auf der Grundlage dieses Wissens ein Experiment entwickelt, welches die Auswirkungen von Translation auf das Distanzempfinden untersucht. Es wird eine stark verbesserte Entfernungsschätzung für dynamisch gehörte, nahe Quellen festgestellt. Während mit steigender Erfahrung der Hörer ein Adaptionsprozess mit positivem Einfluss auf die Genauigkeit zu beobachten ist, erlaubt die auditive Bewegungsparallaxe in einigen Fällen auch ohne Erfahrung ein Maß an Genauigkeit, welches dem von Hörtests in realen Umgebungen nahe kommt.



Pfeiffer, Manuela;
Kopfmodellbasierte Blickrichtungsschätzung. - Ilmenau. - 39 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2017

Das Ziel dieser Bachelorarbeit ist es, ein Verfahren zur kopfmodellbasierten Blickrichtungsschätzung, das auf synthetischen Daten basiert, in die Praxis zu überführen und zu testen. Dafür werden als erstes die Grundlagen von Auge, Projektion und 3D-Transformation erläutert. Als zweites werden aktuelle Techniken im Bereich der Cornea-Reflexion und des modellbasierten Gaze-Tracking aufgelistet. Daraufhin wird der Algorithmus zur Blickrichtungsschätzung erklärt, der auf einem 3D-Kopfmodell basiert. Anhand dessen kann mit dem POSIT-Algorithmus aus den 2D-Bildpunkten die Lage des Kopfes geschätzt werden. Anschließend wird mittels Projektion der Pupillenpunkt und daraus der Blickvektor bestimmt. Darauf wird der Versuchsaufbau und -durchführung erklärt. Es folgt eine Auswertung der aufgenommenen Videodaten, hinsichtlich Genauigkeit und Präzision. Diese Werte werden abschließend analysiert und mit dem Stand der Technik verglichen und diskutiert.



Brömme, Niclas;
Energiebilanzbetrachtung von digitalen Array-Lautsprechern. - Ilmenau. - 71 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2017

Die vorliegende Arbeit beschäftigt sich mit einer energetischen Betrachtung eines digital angesteuerten Array-Lautsprechers. Diese Lautsprechertechnologie bietet die Möglichkeit der direkten Schallwandlung von digitalen Signalen in die akustische Domäne. Die digitale Lautsprecheransteuerung könnte eine energetisch effizientere Alternative zu der konventionellen analogen Ansteuerung darstellen. In der vorliegenden Arbeit wird das Konzept der digitalen Lautsprecheransteuerung mittels PCM-Signalen dargelegt. Dabei wird auf das Funktionsprinzip digitaler Arrays eingegangen. Die Untersuchungsgegenstände dieser Arbeit stellen die Wirkleistung, der erzeugte Schalldruckpegel sowie die Ein- und Ausgangsenergie eines Array-Elements dar. In einer FEM-Simulationssoftware wurde eine ideale starre Kolbenmembran als Schallwandler implementiert. Dieser Wandler wurde mit einem digitalen PCM-Signal und einem analogen Sinussignal bei den Untersuchungsfrequenzen 100 Hz, 1 kHz und 10 kHz angesteuert und untersucht. Dabei wurde bei den digitalen Eingangssignalen die Flankensteilheit der rechteckförmigen Ansteuerung variiert. In Form einer Bilanzbetrachtung konnte gezeigt werden, dass der Wandler bei digitaler Ansteuerung bei allen Untersuchungsparametern energetisch effizienter arbeitet, als bei der analogen Ansteuerung. Dies bestätigten sowohl die gemessenen Schalldruckpegel, als auch das Verhältnis von Ein- und Ausgangsenergie. Ein Zusammenhang zwischen dieser Effizienzsteigerung und der Wirkleistung konnte nicht gefunden werden. Jedoch wurde ein deutlicher Effizienzgewinn ab einer bestimmten Flankensteilheit ermittelt.



Häger, Daniel;
Konzeption und Implementierung von Komponenten zur Ablage, Annotation und Suche von Medieninhalten in einem nicht vertrauenswürdigen Server-Umfeld. - Ilmenau. - 70 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2017

Im Rahmen dieser Arbeit werden Komponenten zur sicheren Speicherung von Mediendaten in einem unsicheren Serverumfeld konzipiert. Diese sollen ohne wesentliche Abstriche der Sicherheit die flexible Nutzung der Medieninhalte und der ihnen zugeordneten Metadaten ermöglichen. Die Verwendung existierender Speicherdienste wird dabei ergänzt um clientseitige Verschlüsselung und weitere sinnvolle Funktionalitäten wie Tagging, Suche und Annotation. Einige Komponenten wurden prototypisch implementiert und validiert. Bei der Konzeption wurde besonderer Wert auf die zukünftige Erweiterbarkeit gelegt.



Häuser, Franz;
Entwicklung eines Applikation-Frameworks für die Lärmmessung & Lärmbewertung. - 62 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

In dieser Bachelorarbeit wird ein Mess-Framework in Form einer Web-Applikation für Smart-Devices entwickelt, welche die subjektive Bewertung von Umgebungsgeräuschen in Verbindung mit der Erhebung von Metadaten wie Standort, Datum und Uhrzeit ermöglicht. Lärm schädigt Mensch und Tier. Für eine erfolgreiche Prävention ist das Verstehen der subjektiven Wahrnehmung von Geräuschen von zentraler Bedeutung. Die Betrachtung subjektiver Bewertungen in Verbindung mit objektiven Messungen ermöglicht es eventuell Prognosen zu objektiv gemessenen Schallereignissen über die subjektive Bewertung anzustellen. In dieser Bachelorarbeit wird mit diesem Ansatz ein Werkzeug entwickelt, welches eine solche subjektive Bewertung ermöglicht. Um den korrelativen Zusammenhang zukünftig überprüfen zu können wird ebenfalls Standort und Zeit der Aufnahme festgehalten. Zunächst werden Grundlagen der auditiven Wahrnehmung, der Lärmwahrnehmung, psychoakustischer Parameter sowie der Stand der Technik recherchiert. Es folgt die Konzeption der Applikation und ihrer einzelnen Module sowie die Umsetzung dieser.



Steger, Robert;
Weiterentwicklung und Evaluation von Verfahren zur Detektion visueller Fehler an kontrastreichen Kanten. - 119 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Diese Arbeit beschäftigt sich mit der Weiterentwicklung von Detektionsverfahren für visuelle Fehler, die in Bildern und Videos an kontrastreichen Kanten auftreten. Sowohl in der Literatur als auch in bereits existierenden Verfahren kam es vor, dass die Fehler Halo und Ringing verwechselt, bzw. als ein Fehler betrachtet wurden. Da sich die Fehler jedoch in Erscheinungsbild und Ursache voneinander unterscheiden, ist es im Zuge einer erfolgreichen Detektion nötig, sie voneinander zu trennen. Die beiden Artefakte wurden zunächst hinsichtlich ihrer Eigenschaften und damit Gemeinsamkeiten und Unterschiede analysiert. Zu diesem Zweck wurden die beiden Fehler hinsichtlich ihres Erscheinungsbildes und ihrer Ursachen untersucht und sowohl in Theorie als auch in Praxis miteinander verglichen. Analysiert wurden die Codecs H.262, H.264, H.265, JPEG und JPEG2000. Um das Ringing untersuchen zu können, ohne dass es von anderen Fehlern überlagert wird, wurde ein Verfahren zur künstlichen Generierung von Ringing in seiner Reinform entwickelt. Halo kann mithilfe von Schärfungsoperatoren erzeugt werden. Des Weiteren wurde für jeden Fehler ein spezifischer Detektionsalgorithmus konzipiert und implementiert, der in der Lage ist, den Fehler mithilfe einer pixelbasierten Detektionsmethode zu erkennen. Die Algorithmen bestehen aus zwei Teilen. Zuerst werden die Kanten heraus gefiltert, an denen die Fehler auftreten können, und anschließend wird das Artefakt anhand seines individuellen Musters gesucht. Diese Algorithmen wurden hinsichtlich ihrer erfolgreichen Detektion mithilfe von Probandentests evaluiert, und die Ergebnisse wurden mit bereits existierenden Verfahren zur Ringingdetektion abgeglichen, um zu ermitteln, ob eine Weiterentwicklung erfolgreich war. Herausgefunden wurde, dass sich die Codecs in der Praxis hinsichtlich des zu erwartenden Ringings stark unterscheiden. Für Bildcodecs kann die Detektion deutlich bessere Werte liefern als sein Vorgänger. Die Detektion von Videocodecs erweist sich als schwierig, weshalb auch die Ergebnisse des Algorithmus ungenügend sind. Der erste Teil, die Filterung der relevanten Kanten, liefert für beide Fehler gute Ergebnisse, der zweite Teil, die Detektion des Musters, ist in der Praxis allerdings nur für Halo anwendbar.



Schaller, Lukas;
Entwicklung und Evaluation von Verfahren zur Klassifikation von akustischen Szenen. - 59 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Die vorliegende Bachelorarbeit befasst sich mit dem Thema der automatischen Klassifizierung und Analyse von akustischen Szenen. Geräusche aus der Umwelt und dem innerstädtischen Bereich sollen mithilfe von geeigneten Methoden beschrieben und anschließend klassifiziert werden. Als Grundlage für alle im Rahmen dieser Arbeit durchgeführten Experimente, dient der öffentlich zugänglichen Datensatz Urban-Sound8k der New York University, welcher über 8000 kurze Audioaufnahmen von zehn verschiedenen Szenenklassen bereitstellt. Im Mittelpunkt der Arbeit steht die Zusammenstellung eines geeigneten Merkmalsraums zur Beschreibung spektraler und temporaler Eigenschaften der Szenen. Dafür wurden einige vielversprechende, aktuell verwendete Merkmale nachimplementiert. Diese werden einzeln und in Kombination mit anderen Audiomerkmalen evaluiert, um das am besten funktionierende System zu ermitteln. Anschließend wird versucht, mithilfe einer Filterung von stillen Signalblöcken und der Wahl eines geeigneten Klassifikationsverfahren die Ergebnisse zu optimieren.



Krämmer, Christopher;
Entwicklung und Evaluation von Verfahren zur Detektion von Banding-Artefakten in Videodaten. - 68 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Im Rahmen der vorliegenden Abschlussarbeit wird Banding, ein Bildfehler welcher bei der Quantisierung von Pixelwerten oder bei der blockweisen Transformation entsteht, genauer untersucht. Bestehende Ansätze zur Detektion werden aufgegriffen und mit dem Ziel der möglichst präzisen Lokalisierung der Band-Artefakte verbessert. Um die verschiedenen Algorithmen miteinander zu vergleichen, erfolgt eine Evaluation unter der Berücksichtigung grundlegender Eigenschaften der visuellen Wahrnehmung des Menschen. Als Ausgangsmaterial dienen speziell für die Evaluation von Banding entworfene Testbilder, deren Referenzdaten durch ein Modell erzeugt werden.



Zapf, Dominik;
Polyphonic pitch detection with deep learning techniques. - 60 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

In dieser Arbeit wurde ein System zur polyphonen Tonhöhenerkennung entwickelt, das Techniken des Deep Learnings nutzt, d.h. künstliche neuronale Netzwerke und Mengen von Audiodaten mit vorhandener Annotation der Tonhöhen. Verwendet wurde ein Feedforward Neural Network, dessen Parameter und Architektur durch Experimente bestimmt wurde. Zusätzlich wurden Methoden angewandt, die in anderen Arbeiten bereits zu einer Verbesserung der Tonhöhenerkennung führen konnten. Dies waren künstliche Datenvergrößerung durch Pitch Shifting, das Verwenden von Dropout zur Regularisierung und das Verwenden einer logarithmischen Frequenzachse. Trainiert und getestet wurden in unterschiedlichen Kombinationen auf dem Su-Datensatz des MIREX, dem MAPS-Datensatz und einem Datensatz namens SMT\_GUITAR, bestehend aus Gitarrenaufnahmen, aufgenommen am Fraunhofer IDMT. Es konnten gute Ergebnisse für das SMT\_GUITAR-Datenset erzielt werden, während die Ergebnisse für das MAPS-Datenset und das Su-Datenset deutlich schlechter ausfielen. Mit Pitch Shifting konnten die Ergebnisse beim Su-Datenset verbessert werden. Dropout führte zu deutlich schlechteren Ergebnissen und das Logarithmieren der Frequenzachse führte zu keinem nennenswerten Unterschied. Auch ein Rekurrentes Neuronales Netzwerk wurde getestet in Form eines LSTM-Netzwerks (Long Short Term Memory). Dabei fielen die Erkennungsgenauigkeiten sehr niedrig aus. Verglichen wurden die Ergebnisse mit denen des MIREX. Während die Präzision mit den eingeschickten Ergebnissen mithalten konnte, fiel das Recall hinter den meisten Methoden zurück.



Götz, Georg;
Untersuchung zum Einfluss von Head-Tracking auf die Externalisierung von Hörereignissen bei Divergenz zwischen synthetisierter Szene und Abhörraum unter Verwendung eines binauralen Kopfhörersystems. - 72 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Mit Hilfe der Binauralsynthese ist es möglich, eine auditive Szene zu reproduzieren und dabei einen authentischen räumlichen Höreindruck zu gewährleisten. Durch das Personalisieren des Systems und die Verwendung von Head-Tracking zum Ausgleich der Kopfbewegung des Rezipienten in Form einer dynamischen Binauralsynthese, ist eine nahezu exakte Annäherung an eine natürliche Hörsituation trotz Kopfhörerwiedergabe möglich. Falls die wiederzugebende Szene perzeptiv vom Abhörraum abweicht (Raumdivergenz), kommt es allerdings zu Beeinträchtigungen des räumlichen Höreindrucks. Die Externalisierung von Hörereignissen wird gestört und es kommt häufiger zur Im-Kopf-Lokalisation. Bisherige Forschungsergebnisse zeigen, dass durch eine dynamischen Binauralsynthese Vorne-Hinten-Vertauschungen aufgelöst werden können. Der Einfluss von Head-Tracking auf die Externalisierung von Hörereignissen ist allerdings noch nicht eindeutig geklärt. In dieser Arbeit wurde deshalb der Einfluss von Head-Tracking auf die Externalisierung von Hörereignissen mit einem binauralen Kopfhörersystem untersucht. Dabei wurde sowohl eine konvergente als auch eine divergente Abhörsituation betrachtet. Ein Hörtest wurde mit dem kommerziellen Binauralsynthesesystem Smyth Realiser A8 durchgeführt. Es konnte gezeigt werden, dass die Verwendung von Head-Tracking während einer Kopfdrehung die externalisierte Wahrnehmung für ausgewählte Schalleinfallsrichtungen verbessern kann. Der Effekt der Raumdivergenz konnte dabei allerdings nicht vollständig aufgelöst werden. Der gewonnene Datensatz legt nahe, dass Adaptionseffekte bei der Verwendung von Head-Tracking während einer Kopfbewegung eine Rolle spielen. Weiterhin wurde beobachtet, dass die Kopfdrehung für verschiedene Probanden unterschiedliche Einflüsse auf die Externalisierung hatte.



Hagedorn, Josua;
Untersuchungen zur Effzienz digital angesteuerter Lautsprecher-Arrays. - 87 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Die Ansteuerung von Array-Lautsprechern mit digitalen Signalen ist ein möglicher Ansatz zur direkten Schallwandlung von der digitalen in die akustische Domäne und Gegenstand aktueller Forschungen auf dem Gebiet der Lautsprechertechnologie. Dieses Prinzip ermöglicht nicht nur eine direkte Digital-Analog-Wandlung, sondern auch eine potentielle Effizienzsteigerung. So könnten ineffiziente analoge Lautsprecher in naher Zukunft durch digital angesteuerte Array-Lautsprecher ersetzt werden. In dieser Arbeit wird das Funktionsprinzip dieses Konzeptes vorgestellt und untersucht. Dabei werden verschiedene Ansteuerungsmethoden präsentiert und auf die Anforderungen und Probleme eingegangen. Im praktischen Teil wurde ein Array aus sieben Wandlern untersucht, welches mit 3-Bit PCM-Signalen angesteuert wurde. Dabei stand vor allem der Effizienzvergleich zwischen digitaler und analoger Ansteuerung im Fokus. Außerdem wurde auf die Rekonstruktionsqualität des digital-angesteuerten Arrays eingegangen, da bei der digitalen akustischen Rekonstruktion ein hoher Wert an harmonischen Verzerrungen auftritt. Da diese u.a. durch die Gangunterschiede zwischen den einzelnen Array-Elementen hervorgerufen werden, wurde eine Methode zur Kom- pensation des Zeitversatzes implementiert. Dadurch konnte eine Verbesserung der harmonischen Verzerrungen für einen bestimmten Hörort erzielt werden. Der Array-Lautsprecher wurde mit dem Simulationsprogramm COMSOL Multiphysics auf Basis von elektrodynamischen Wandlern simuliert. Untersucht wurde die harmonische Anregung bei Frequenzen von 500Hz, 1kHz und 10 kHz. In der hier getätigten Untersuchungen konnte gezeigt werden, dass es grundsätzlich möglich ist, eine direkte akustische Signalrekonstruktion mit der digitalen Ansteuerung von Array-Lautsprechern zu realisieren. Allerdings konnte die erwartete Effizienzsteigerung nicht erzielt werden. Die digitale Ansteuerung schnitt, im Vergleich zur Analogen, bei allen drei Anregungsfrequenzen zwischen 5 dB und 10 dB schlechter ab. Auch die Werte der harmonischen Verzerrungen sind selbst durch eine Korrektur der Laufzeiten, verglichen mit dem aktuellen Stand der konventionellen Lautsprecher, noch zu hoch. Es konnte gezeigt werden, dass sich durch eine Erhöhung der Auflösung eine Verbesserung der Rekontruktionsqualität einstellt. Der Ansatz eines digital angesteuerten Array- Lautsprechers könnte eine Alternative zu konventionellen Lautsprechern werden, wenn zukünftige Technologien die Ansteuerungsmethoden, Erhöhung der Array-Elementezahl und deren akustisches Verhalten optimieren.



Heydrich, Eric;
Konzeption und Implementierung einer Learning-Analytics-Komponente für das E-Assessment-System askMe!. - 54 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Das Ziel der vorliegenden Arbeit war es, eine Learning Analytics-Komponente für das E-Assessment System askMe! zu konzeptionieren und danach in das bestehende System zu implementieren. Dafür wurden gängige webbasierte Technologien verwendet um Daten zu erfassen, diese zu verarbeiten und dann für eine grafische Darstellung bereitzustellen. Für die Erfassung der Daten während des Testvorgangs werden Experience-API-Statements (xAPI) an einen Learning Record Store übertragen und dort gespeichert. Diese Daten werden dann von askMe! ausgelesen, verarbeitet und in einem kombinierten Objekt zusammengefasst, welches an eine View weitergegeben wird. Aus diesem Objekt werden die Daten für die Darstellung der Diagramme bezogen. In der View werden dann die Struktur und die Logik für die Anzeige der Diagramme definiert. Aus dem gegebenen Daten sollen mit Hilfe der Waikato Environment for Knowledge Analysis (Weka), einer Sammlung von Algorithmen für das maschinelles Lernen zur Umsetzung von Data Mining-Aufgaben, Vorhersagen über eventuelle Ergebnisse getroffen oder Klassifizierungen gemacht werden.



Löhner, Andreas;
Implementierung eines Verfahrens zur Überblendung zwischen Raumimpulsantworten zweier verschiedener Räume zur Verwendung in einem Binauralsynthesesystem. - 67 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Mit der Binauraltechnik sind wir in der Lage, die akustischen Eigenschaften eines Raumes, sowie die exakte Position von Schallquellen in diesem Raum aufzunehmen und einem Hörer realitätsgetreu wiederzugeben. Weiter eröffnet sich mit dem detaillierten akustischen Abbildungsmodell durch binauraler Raumimpulsantworten ((BRIR-binaural room impule response) die Möglichkeit, virtuell, beliebige Quellen, an beliebige Positionen relativ zum Hörer, in beliebige Räumen zu setzen. BRIRs sind kopfbezogene Raumimpulsantworten, getrennt für das linke und rechte Ohr. Bei hinreichender Genauigkeit des Modells entsteht eine akustische Bühne, die in Ihrem Erscheinungsbild der tatsächlichen Hörsituation in nichts nachsteht. Die nachfolgende Arbeit befasst sich zunächst mit einer kurzen Erklärung der Mechanismen des räumlichen Hörens. Das Hauptaugenmerk dieser Arbeit liegt in der Synthese von virtuellen Zwischenräumen zwischen zwei BRIRs. Im Gegensatz zu vorangegangenen Arbeiten, die sich schwerpunktmäßig mit der Interpolation verschiedener Schallquelle - Hörer Anordnungen befassten, liegt in dieser Arbeit der Fokus auf der Interpolation von Rauminformationen zwischen einer Start- und Ziel-BRIR. Das Ergebnis soll darin bestehen, dem Hörer eine interaktive Möglichkeit zu geben zwischen den raumakustischen Modellen zweier Räume, kodiert in den jeweiligen BRIRs für eine in beiden Räumen identische Schallquelle - Hörer Anordnung, nach Belieben zu wechseln. Zu diesem Zweck findet zuerst die Auswahl eines für diese Aufgabenstellung geeigneten Überblendverfahrens statt. Mit diesem Verfahren werden neue Zwischenräume synthetisiert, die anschließend in ein VST-Plugin, das bereits in früheren Versuchen Anwendung beim Wechsel zwischen verschiedenen Schallquelle - Hörer Anordnungen fand, integriert werden. Dieses Plugin ist in der Lage, in nahezu Echtzeit eine Faltung zwischen einem Stimulussignal und einer BRIR zu berechnen. Eine Simulation dieses Signals wird in dem Raum erzeugt, der in der BRIR kodiert ist. Weiterhin findet eine qualitative Analyse der synthetisierten Zwischen-BRIRs statt, die um einen kleinen Hörtest ergänzt wird, in dem der Wiedererkennungswert der originalen BRIRs im realen Aufnahmeraum in Relation zu den erzeugten Zwischenräumen untersucht wird.



Krüger, Tobias;
3D-Blickrichtungsschätzung. - 59 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Ziel und Thema der Arbeit ist es, ein bestehendes Verfahren zur Bestimmung der Kopfposition im Raum um ein Augenmodell zu erweitern. Durch die Kombination des Augenmodells mit einem Kopfmodell können die Informationen über Rotation und Lage des Kopfes dazu dienen, um genauere Blickrichtungen zu erzielen. In der Arbeit wird die Kopfpose mittels POSIT bestimmt, welches in der Lage ist, die Position jedes beliebigen Objektes im dreidimensionalen Raum zu bestimmten. Damit POSIT die Rotation und Translation eines Kopfes relativ zur Kamera berechnen kann, benötigt es ein Kopfmodell. Da das zu entwerfende System kalibrationsfrei arbeiten und trotzdem einen großen Anwendungsbereich bieten soll, empfiehlt sich das Anthropometrische Kopfmodell, was einen "Durchschnittskopf" repräsentiert. So kann die Pose eines in der Bildebene gelabelten Gesichtes mithilfe von POSIT und dem Anthropometrischen Kopfmodell bestimmt werden. Für das Augenmodell werden die in der Bildebene gelabelten Augenmerkmals-punkte mithilfe der der Projektionsmatrix und der vom POSIT ausgegebenen Transformationsmatrix zurück in das dreidimensionale Kopfmodell projiziert. Diese rückprojizierten Augenpunkte ersetzen die Augenpunkte des Anthropometrischen Kopfmodells. Damit die Gaze berechnet werden kann, benötigt das Augenmodell die 3D-Informationen von Augapfelmittelpunkt und Pupillenmittelpunkt sowie den Augenradius. Ersteres wird durch den geometrischen Flächenschwerpunkt bestimmt. Bei Tests basierend auf synthetisch erzeugten Daten konnte der entwickelte Ansatz überzeugen. Bei anschließenden praxisnahen Versuchen zeigten sich akzeptable Ergebnisse, der entwickelte Ansatz bedarf jedoch noch Anpassungen bzw. Verbesserungen, um Schwächen bei der Gaze-Bestimmung zu eliminieren.



Harms, Henning;
Implementierung einer Methode zur Evaluierung von Mehr-Zonen-Beschallung. - 66 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Personal Sound Zones sind Bereiche, in denen Audiosignale wahrgenommen werden können, die nur für diesen bestimmten Bereich vorgesehen sind. Das Fraunhofer-Institut für Digitale Medientechnologie IDMT hat ein Lautsprecherarray entwickelt, mit dem solche Sound Zones erzeugt werden können. Dabei werden Audiosignale mit Hilfe von beamforming in unterschiedliche Richtungen abgestrahlt. Ziel dieser Bachelorarbeit ist es, diese so erstellten Sound Zones in Bezug auf Interferenzen, d.h. Übersprechen der Signale, zu evaluieren. Dies geschieht mit Hilfe von Probandentests, in denen zunächst akzeptable Lautstärken eingestellt werden, die in einem weiteren Test in Bezug auf dirstraction (dt. Ablenkung) bewertet werden. Dabei geht es darum, wie sehr ein Signal, das von außerhalb der Zone kommt, in der sich der Proband befindet, von dem Signal ablenkt, welches für die Zone bestimmt ist. Die Auswertung ergibt im Allgemeinen, dass die Bewertung umso besser ausfällt, je leiser das Störsignal ist. Allerdings werden Signale, bei denen teilweise Frequenzen abgeschnitten sind, in manchen Fällen sogar besser bewertet als unbeschnittene Signale, die leiser sind. Auf Grundlage der gewonnenen Erkenntnisse werden weiterführende Fragestellungen und Tests aufgezeigt.



Hempel, Jessica;
Detektion von Credits in Videos. - 92 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Diese Bachelorarbeit beschreibt die Entwicklung eines Systems zur Detektion von Credits in Videos. Dabei werden die eingebetteten Texte mithilfe einer kombinierten Verwendung des Artihmetischen Mittelwert- und Medianfilters mit der Sobel- und Canny-Kantendetektion ermittelt. Zur Identifikation von Textbewegungen kommt das Blockmatching-Verfahren zum Einsatz, mit dem die Textblöcke über die Dauer ihres Auftretens verfolgt werden. Das ermöglicht es den Rechenaufwand erheblich zu reduzieren, da es nicht länger notwendig ist den Textdetektionsschritt für jedes einzelne Frame durchzuführen. Ausgewählte morphologische Operationen und statistische Verfahren dienen zur Eliminierung von Fehlern und verbessern das Ergebnis. Neben einem umfangreichen Grundlagenteil, der für das System wichtige Verfahren erläutert, wird der Stand der Forschung im Bereich der Textdetektion beschrieben. Mithilfe einer Analyse der in Filmen und Serien auftretenden Credits werden Erkenntnisse über notwendige Anforderungen an den zu implementierenden Algorithmus gewonnen. Weiterhin werden Textmerkmale definiert durch deren Verwendung Textbereiche von anderen Objekten im Bild unterschieden werden können. Anschließend wird der entwickelte Algorithmus zur Detektion der Credits vorgestellt und implementiert. Den Abschluss der Arbeit stellt eine Evaluation des Algorithmus dar, bei dem seine Genauigkeit und Treffsicherheit ermittelt und die Ergebnisse diskutiert werden.



Preuße, Sebastian;
Entwicklung eines Algorithmus zur segmentweisen Klassifikation von Instrumentenfamilien. - 47 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Die vorliegende Bachelorarbeit befasst sich mit der automatischen Segmentierung von Audiodaten. Anhand von Ergebnissen einer Instrumentenklassifikation sollen Segmente aggregiert werden, die bezüglich ihrer Instrumentenklasse homogen sind, d.h. jedes Segment enthält genau eine Klasse bzw. ein aktives Instrument. Dazu soll untersucht werden, inwieweit sich standardisierte Clusterverfahren dafür eignen, Daten dieser Art zu segmentieren. Um valide Aussagen treffen zu können werden auf der Basis eines erstellten Klassikdatensatzes Referenzdaten annotiert und anschließend mit den automatisch bestimmten Segmenten verglichen. Zur Bewertung der Ergebnisse werden gängige Evaluationsmaße der Audiosegmentierung genutzt. Nach der Untersuchung fünf ausgewählter Verfahren sollen Tendenzen hinsichtlich besonderer Eignung einiger Algorithmen erkannt werden. Abschließend werden Freiheitsgrade dieser Verfahren bestimmt, deren Änderung experimentell auf ihre Fähigkeit hinsichtlich einer Verbesserung der Segmentierung untersucht wird.



Schultheis, Ruth;
Analyse und Definition einer geeigneten Testumgebung zur Qualitätsbeurteilung mit einem autostereoskopischen Display. - 66 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Durch eine enorme Entwicklung in der 3D-Displaytechnik ist die Verfügbarkeit von unterschiedlichen Displays auf dem Markt angestiegen. Zum einem gibt es stereoskopische Displays, bei denen eine spezielle 3D-Brille benötigt wird, und zum anderem autostereoskopischen Displays, die ohne Hilfsmittel auskommen. Es ist fraglich, welche Displaytechnik eine gute Qualität aufweist und einen zufriedenstellenden 3D-Eindruck beim Zuschauer hinterlässt. Die vorliegende Arbeit stellt eine Testumgebung zur subjektiven Qualitätsbeurteilung mit einem autostereoskopischen Display vor, welche mittels einer Probandengruppe erprobt wurde. Dazu wird zuvor auf die stereoskopische Wahrnehmung, die verwendete Displaytechnik und die 3D-Videoqualität eingegangen. Anschließend werden bestehende Möglichkeiten zur Qualitätsbeurteilung und die Forschungsfrage der Testumgebung vorgestellt. Gefolgt vom Ablauf der Testumgebung und Ergebnisse der Durchführung.



http://www.gbv.de/dms/ilmenau/abs/857355260schul.txt
Ma, Hong;
Entwicklung einer Evaluierungsmethodik zur Bewertung der Position von bewegten Schallquellen. - 72 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Heutzutage gibt es zwei Möglichkeiten, um die Position eines Hörereignisses im Raum zu erkennen. Es gibt die egozentrische Methode, welche besagt, dass ein Referenzpunkt innerhalb des Kopfes des Hörers simuliert wird. Die zweite Methode ist die exozentrische Methode. Bei dieser Methode wird im Raum projiziert, dass ein Testsignal in einer planaren Zeigetechnik realisiert wird. In dieser Bachelorarbeit wird die Entwicklung eines Hörtestdesigns zur intuitiven Eingabe der wahrgenommenen Schallquellenbewegungen mit Programmrealisierung durch HTML beschrieben. Das Programm bezieht sich auf einen Hörtest mit unterschiedlichen Hörsamples. Weiterhin wird eine Evaluierungsmethodik zur Bewertung der Position von bewegten Schallquellen dargestellt. Die Auswertung der Hörversuche wird in dieser Arbeit aufgezeigt.



http://www.gbv.de/dms/ilmenau/abs/857324144ma.txt
Schwarzmüller, Bastian;
Untersuchung zur Verwendung eines Miniatur-Beamforming-Arrays zur räumlichen Wiedergabe kanalbasierter Audioinhalte. - 60 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

In dieser Bachelorarbeit wird ein Beamforming Array untersucht, das in Verbindung eines Algorithmus des Fraunhofer IDMT eine erheblich kleinere Bauform als üblich zulässt. Die Untersuchung bezieht sich dabei auf die räumliche Wiedergabe stereofoner Musikstücke. Dazu wurden verschiedene Verfahren entwickelt und getestet.



Peter, Julia;
Qualität von räumlicher Musikwiedergabe in Abhängigkeit des Wiedergaberaumes. - 81 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Diese Arbeit beschäftigt sich mit dem Einfluss von Raumgrößen und Raumeigenschaften des Wiedergaberaumes auf das Qualitätsempfinden von binauraler Musikwiedergabe. Zusätzlich wird dabei ein Blick auf die Externalisierung gelegt und versucht, Präferenzen und Zusammenhänge bezüglich einzelner Musikgenres zu ermitteln. Um dies zu untersuchen, wurde ein Probandentest in divergenten Räumen durchgeführt. In ihm sollte die wahrgenommene Qualität von verschiedenen Musikstücken, gefalten mit unterschiedlichen binauralen Raumimpulsantworten, untereinander verglichen und bewertet werden, sowie deren Externalisierung. Verwendet wurden dazu einkanalige Raumimpulsantworten und binaurale Raumimpulsantworten aus Räumen mit verschiedenen Größen und Halleigenschaften. Als Ergebnis zeigte sich, dass für die einzelnen Stücke der reale Wiedergaberaum weniger Einfluss auf die Bewertung hat, als angenommen. Außerdem wirken sich auf die Qualitätsbewertung der Kontext in Form von Inhalt und Art der Wiedergabe und das Musikgenre bei der Wiedergabe mehr mit aus als erwartet. Dies stellte sich sowohl in Interviews, die mit den Probanden nach den Bewertungen geführt wurden, als auch in den Ergebnissen aus den verschiedenen Bewertungsverfahren heraus. Schließlich konnte für die binaurale Musikwiedergabe festgestellt werden, dass für die Hörer bevorzugte Raumeigenschaften und -größen für die Wiedergabe mehr von inhaltlichem Kontext und wiedergegebenem Genre abhängen und dass es dabei weniger Zusammenhang mit dem realen Wiedergaberaum gibt. Derartige Auswirkungen ergaben sich auch für die wahrgenommene Externalisierung. Bei den Hörern spielt hier sehr stark ihre Vorstellung mit ein und der sichtbare Wiedergaberaum wird zum Teil gänzlich ausgeblendet. Als Präferenz bezüglich der Musikgenres resultierte, dass Binauralität gerade für klassische und instrumentale Musikstücke stark bevorzugt wird, weniger aber für modernere Musik. Dahingehend bleibt nun Raum für weitere Arbeiten auf diesem Gebiet und noch umfangreichere Tests.



Zerlik, Anna Maria;
Einfluss selbst ausgelöster Geräusche bei der Orientierung in einer virtuellen auditiven Szene. - 66 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Virtuelle auditive Umgebungen, bei denen virtuelle Hörer durch eine ausschließlich auditive Darbietung durch eine Szene bewegt werden, finden immer häufiger Anwendung. Die Wahrnehmung der eigenen Raumposition ist jedoch nicht einfach. In dieser Arbeit wird untersucht, ob selbstausgelöste Geräusche wie die eigene Stimme oder Schrittgeräusche die Orientierung in einer virtuellen auditiven Szene verbessern können. Zunächst werden die Grundlagen des räumlichen Hörens beim Menschen, der Schallausbreitung in Räumen und mögliche Raumsimulationsverfahren vorgestellt. Nach der Recherche und der Voruntersuchung mit In-Ear-Mikrofonen in einem realen Raum wurde sich für die Untersuchung der Orientierung mit der eigenen Stimme entschieden. Mit einem Raumsimulationsprogramm, das ein Schubox-Modell verwendet, werden orale binaurale Raumimpulsantworten für verschiedene Raumpositionen berechnet, die später in einem mit mehreren Übungsphasen konzipierten Hörversuch mit der eigenen Stimme des Probanden in Echtzeit gefaltet werden. Die Ergebnisse des Hörversuchs zeigen, dass eine Orientierung anhand der eigenen Stimme möglich ist.



Hiltscher, Christian;
Untersuchung zur automatischen Analyse von objektbasierten Tonszenen. - 47 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Die objektbasierte Tonwiedergabe bringt dem Zuhörer ein völlig neues Hörerlebnis durch individuelles personalisieren von Tonszenen. Jede Schallquelle eines Filmes oder eines Musikstückes ist dabei ein Audioobjekt. Jedes dieser Objekte lässt sich individuell anpassen. Zum Beispiel kann man beim Hören von Musik einzelne Instrumente lauter oder leiser stellen oder auch ganz ausschalten. Bisher wurden bei der kanalbasierten Tonproduktion, fertige Signale für jeden Lautsprecher generiert und gespeichert. Bei der objektbasierten Tonproduktion speichert man Audioobjekte bestehend aus einem Audiosignal und Metadaten in einer Datei ab. Die Metadaten beinhalten Eigenschaften der Schallobjekte und können über die Zeit variieren. Beim Abspielen erfolgt ein synchroner Stream dieser Daten an einen Audiorenderer, der die Lautsprechersignale live berechnet. Dadurch ergeben sich neue Möglichkeiten für Toningenieure. Das Fraunhofer Institut für Digitale Medientechnologie bietet ein Produktions- und Wiedergabesystem für objektbasierte 3D-Tonszenen namens "SpatialSound Wave". Im Rahmen dieser Bachelorarbeit entstand eine prototypische Softwarebibliothek, welche Meta- und Audiodaten einer Tonszene einliest, analysiert und anschließend visuell darstellt. Somit ist es einem Toningenieur möglich, sich einen Überblick über eine vorliegende Szene zu verschaffen und eventuell auftretende Fehler zu diagnostizieren. In dieser Arbeit werden Funktionen des Programms vorgestellt und anschließend auf eine Auswahl an Szenen angewendet. Bei den Untersuchungen der Szenen zeigten sich Auffälligkeiten, welche dabei helfen könnten, den Wiedergabealgorithmus des Renderers zu optimieren und den benötigten Speicherplatz von Tonszenen zu komprimieren. Durch gewonnene Erkenntnisse werden zum Schluss Ideen für die Weiterentwicklung der Softwarebibliothek gegeben.



http://www.gbv.de/dms/ilmenau/abs/847776794hilts.txt
Kästner, Michael;
Erstellung einer Applikation für die Langzeitmessung von Lärm. - 60 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Mit dieser Bachelorarbeit ist eine Applikation entwickelt, welche es ermöglicht, objektiv gemessene Lärmparameter mit subjektiven Einschätzungen zu korrelieren. Viele Menschen erkranken durch eine zunehmende Lärmbelastung. Die gesundheitsschädliche Wirkung mancher Schallgrößen ist zwar bekannt, es gibt jedoch Größen, deren Einflüsse auf die menschliche Gesundheit weitestgehend unklar sind. Die Erkennung und Beschreibung dieser Größen kann voraussichtlich dabei helfen, die Wahrnehmung und Wirkung von Schall (im Besonderen: Lärm) auf den Menschen besser zu verstehen. Diese Bachelorarbeit beschreibt die Konzeption und erste prototypische Entwicklung einer Applikation, welche eine Erfassung dieser Größen ermöglicht. Zudem bietet die Applikation die Möglichkeit, subjektive Schallbewertungen zu erfassen. Somit ermöglicht die Applikation eine Korrelation der objektiven Schallgrößen mit der menschlichen Wahrnehmung. Hierzu sind zuerst akustische Grundlagen sowie der aktuelle Stand der Technik aufgezeigt. Es ist erarbeitet, welchen Anforderungen die Applikation entsprechen soll und die praktische Umsetzung dargestellt.



Rolapp, Georg;
Wahrnehmung der eigenen Hörposition im Raum nach einer Bewegung. - 85 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Die vorliegende Bachelorarbeit befasst sich mit der Fragestellung, ob es durch rein akustische Informationen möglich ist, die eigene Position in einem Raum zu ermitteln. In einer früheren Arbeit wurde dies bereits für Aufnahmen ohne Bewegung untersucht. Ziel der gegenwärtigen Arbeit war die Überprüfung der Verbesserungsmöglichkeiten der Positionserkennung durch Bewegungen während der Aufnahme im Raum. Es wurde ein Überblick über die physikalischen Grundlagen der Schallausbreitung von der Quelle bis zum Hörer, ihrer Wahrnehmung und Lokalisierung gegeben. Zu Beginn wurden Aufnahmen mit In-Ear-Mikrofonen in einem Raum ohne und mit Translations- und Rotationsbewegungen durchgeführt. Aus diesen Aufnahmen wurde ein Hörtest für die Positionserkennung in einer virtuellen akustischen Umgebung angefertigt. Die erhobenen Daten dieses Hörtests und der anschließend durchgeführten Leitfrageninterviews wurden analysiert und interpretiert.



Graeber, Hagen;
Development and evaluation of filters in order to compensate a surface on back side integrated micro-loudspeakers of a mobile device. - 85 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2016

Die Wiedergabe von Audioinhalten über die Lautsprecher von mobilen Geräten, wie Smartphones und Tablets, unterliegt einer Vielzahl von klangbeeinträchtigenden Einschränkungen und Bedingungen. Oft werden die Lautsprecher in die Geräterückseite verbaut und auf spezifische Wiedergabebedingungen abgestimmt. Wird das Gerät auf einer Oberfläche platziert, verändern sich diese Wiedergabebedingungen und damit auch der Klang. Ursache hierfür sind unter anderem Reflexions- und Körperschalleffekte. Subjektiv ist besonders eine Veränderung der Klangfarbe wahrnehmbar. Ziel der Arbeit ist es, die hervorgerufene Klangveränderung zu analysieren und zu vermindern. Dafür wurde ein Verfahren entwickelt, das den Klang auf eine gegebene statische Wiedergabebedingung anpasst. Dieser Algorithmus besteht aus digitalen Filtern, die auf der Grundlage einer gerätespezifischen Messanalyse entwickelt wurden. Die Filter wurden in einem Hörtest direkt am Gerät in der Wiedergabebedingung evaluiert. Dabei wurde herausgefunden, dass die Filter den hörbaren Oberflächeneinfluss deutlich reduzieren.



http://www.gbv.de/dms/ilmenau/abs/847294609graeb.txt
Gräfe, Robert;
Automatische Analyse und Klassifizierung von Audiodaten anhand von Tonartverläufen. - 60 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2015

Die vorliegende Bachelorarbeit befasst sich mit dem Thema der automatischen Analyse von Audiodaten. Anhand lokaler Tonartänderungen soll eine Segmentierung von Musiksignalen realisiert werden. Darüber hinaus soll untersucht werden, ob sich Tonartverläufe als Kriterium zur stilistischen Klassifizierung der Audiodaten eignen. Dabei wird die tonale Segmentierung zunächst separat und anschließend auch in Verbindung mit der stilistischen Klassifizierung betrachtet. Zur Umsetzung der automatischen Segmentierung wird ein Merkmal zur Beschreibung des lokalen tonalen Inhaltes von Musiksignalen vorgestellt. Anschließend werden drei verschiedene Verfahren zur automatischen Detektion von Segmentgrenzen mit Hilfe eines Datensatzes aus 30 Pop-Songs evaluiert und verglichen. Für die stilistische Klassifizierung werden Merkmale zur Beschreibung der Art und Häufigkeit auftretender Modulationen in einem Musikstück eingeührt. Diese Merkmale werden einzeln, in Kombination und ergänzt durch weitere Audiofeatures zu zwei Szenarien einer stilistischen Klassifizierung herangezogen: (1) zur historischen Einordnung klassischer Kompositionen in die vier Epochen Barock, Klassik, Romantik und Moderne; (2) zur Identifizierung abendändischer Komponisten. Dafür wird im ersten Szenario ein Datensatz aus 1600 Kompositionen (400 Werke pro Epoche) zur Evaluierung verwendet. Das zweite Szenario wird auf einem Datensatz aus insgesamt 1100 Musikstücken von elf verschiedenen Komponisten (100 Werke pro Komponist) evaluiert.



Gabb, Timo;
Untersuchungen zum Einsatz von Schallführungen bei MEMS-Lautsprechern. - 67 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2015

Die Nachfrage nach Mobilgeräten wie Smartphones oder Tablets mit einem flachen Gehäuse sowie der wachsende Anspruch an die akustische Leistungsfähigkeit dieser Geräte erfordern den Einsatz neuer Lautsprechertechnologien. Aus dem Bereich der Elektroakustik ist bereits bekannt, dass sich das Abstrahlverhalten eines Lautsprechers durch konstruktive Maßnahmen der Schallführung beeinflussen bzw. verbessern lässt. Die vorliegende Arbeit befasst sich mit der Frage, ob sich diese Formen der Schallführung soweit miniaturisieren lassen, dass sie in Verbindung mit Lautsprechern auf Basis mikroelektromechanischer Systeme verwendet werden können. Zu diesem Zweck wurde die Auswirkung der Miniaturisierung auf das Resonanzverhalten von Helmholtz-Resonatoren sowie auch auf das Abstrahlverhalten von Schalltrichtern untersucht. Die Simulationsergebnisse haben gezeigt, dass mit zunehmender Verkleinerung des nach Herrmann von Helmholtz benannten Resonators, die Berechnungsvorschrift zur Ermittlung der Resonanzfrequenz stark von den Simulationsergebnissen abweicht und daher nicht mehr verwendet werden kann. Diese Abweichung lässt sich durch die Effekte an Grenzschichten erklären, welche auch die Effizienz miniaturisierter Resonatoren stark beeinflussen. Eine Verwendung miniaturisierter Resonatoren in Verbindung mit diesen Kleinstlautsprechern ist dennoch möglich. Die Berechnungs- und Simulationsergebnisse haben darüber hinaus gezeigt, dass der Einsatz von Schalltrichtern für diese Lautsprecher aufgrund der kleinen Membranfläche prinzipiell auch möglich ist. Für die Ausnutzung der erwarteten leistungssteigernden Effekte des Schalltrichters sind jedoch Abmessungen des Trichters nötig, die eine Umsetzung in Verbindung mit diesen Lautsprechern aus praktischer Sicht beinahe unmöglich machen.



Brand, Konstantin;
Entwicklung eines Verfahrens zur automatischen Transkription von Walking Bass-Linien aus kommerziellen Jazzaufnahmen. - 57 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2015

Durch die rasante Entwicklung der digitalen Medien, vor allem von digitalem Audiomaterial, wird derzeit an innovativen Technologien für Music Information Retrieval (MIR) geforscht. Im Feld der automatischen Transkription ist es das Ziel dieser Arbeit, ein spezielles Verfahren der Bass-Transkription aus Chroma-Features, mit Einschränkung auf den Walking Bass, zu erstellen. Dabei sollen unterschiedliche Vor- und Nachverarbeitungsschritte sowie Chromaverfahren genutzt und verglichen werden. Im ersten Teil werden ein Tiefpass-Filter und ein Harmonic/Percussion-Filter implementiert und auf verschiedene Chromaverfahren wie Non-negative Least Squares (NNLS), Chroma Pitch (CP), Chroma Log Pitch (CLP), Chroma Energy Normalized Statistics (CENS), oder Chroma DCT-Reduced Log Pitch (CRP) angewendet. Es wird untersucht inwieweit sich diese Methoden für eine Bass-Transkription eignen und welche das beste Ergebnis liefert. Dabei zeigt sich, dass das NNLS-Verfahren in Kombination mit einem Tiefpass-Filter die beste Erkennungsrate von 72 % erzielt, wobei dies einem Verfahren aus dem Stand der Technik entspricht. Ein Harmonic/Percussion-Filter zeigte keinen positiven Einfluss auf die Erkennungsrate. Im zweiten Teil wird durch eine Implementierung des Viterbi-Algorithmus der wahrscheinlichste Melodieverlauf, aufgrund einer statistischen Analyse der Intervallsprünge von Walking Bass-Linien bestimmt. Dabei wird als Grundlage das beste Verfahren des vorherigen Abschnitts genutzt, um eine Optimierung zu erzielen. Es stellt sich jedoch heraus, dass mit diesem Verfahren keine Verbesserung festzustellen ist. Zuletzt werden bei den Chromaverfahren die Fenstergrößen die für die Berechnungen ausschlaggebend sind variiert. Hierbei wird untersucht, welche Parameter für eine Bass-Transkription geeignet sind. Es zeigt sich, dass sich eine Blockgröße von 8192 Samples (0.18 sec) und eine Hopsize von 512 (0.01 sec) bis 2048 Samples (0.05 sec) sich ideal für eine Bass-Transkription eignen.



Boley, Tobias;
Identifikation relevanter Parameter zur Orientierung in einer virtuellen auditiven Szene. - 62 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2015

Diese Bachelorarbeit untersucht eine Methode, mittels derer, eine virtuelle akustische Umgebung erstellt werden kann (virtual acoustic environment - VAE). Diese wird mit In Ear Mikrofonen erzeugt, während einer Bewegung im Raum. Es soll geprüft werden, wie detailliert dieses Vorgehen in der Akustik simuliert werden muss, um den Hörer eine auditive Orientierung zu ermöglichen. Dazu wurde an der TU Ilmenau ein geeigneter Seminarraum gewählt, in welchem die Bewegungsabläufe, für den Hörer, aufgezeichnet wurden. Durch ein variieren der Lautsprecherpositionen und das verwenden verschiedener Geräusche, wurden unterschiedliche binaurale Aufnahmen, angefertigt. In einem anschließendem Hörtest, wurde anhand von drei Aufgaben, die VAE untersucht. Hierbei wurden, in einer quantitativen Befragung, die Eindrücke der Hörer erfasst. Des Weiteren wurden die auditiven Parameter, welche die Erzeugung der VAE beeinflussten, untersucht. Es stellte sich heraus, dass die individuelle Kopfform der Aufnahmeperson, die Orientierung der Hörer am deutlichsten beeinträchtigte. Ebenfalls wurde dadurch das Empfinden, sich in einer VAE aufzuhalten, vermindert. Durch Einsetzen von visuellen Information über den Raum, konnte dem Hörer eine verbesserte Orientierung ermöglicht werden. In einem ersten Versuch, konnte mit der in dieser Arbeit beschriebenen Vorgehensweise, bereits einige Erkenntnis, über VAEs gewonnen werden.



Kuntze, Mathias;
Detektion von Tieren mittels Deformable Part-Based Models. - 99 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2015

Der rasante Fortschritt der technischen Entwicklung findet immer mehr Anwendung in der Erforschung von Tieren und deren Spezies. Zoologen gelingt es zunehmend eine enorme Menge an Daten zu sammeln. Um Bewegungsmuster und Populationsgrößen zu analysieren werden unter anderen in vielen Gebieten Fotofallen aufgestellt. Diese erzeugen eine große Menge an Bildern, die verarbeitet werden muss. In der heutigen Zeit werden diese Aufnahmen manuell sortiert und annotiert. Diese Arbeit beschäftigt sich mit Algorithmen, die diese Verarbeitung ersetzen sollen. Dabei sollen Tiere automatisch in Bildern erkannt werden. Es wird zunächst auf aktuelle Forschungen eingegangen. Im Speziellen wird der zur Personendetektion entwickelte Detektor Histograms of Oriented Gradients (HOG) von Dalal und Triggs vorgestellt. In dieser Arbeit wird darauf eingegangen, inwiefern sich Deformable Part-Based Models (DPM) von Felzenszwalb et al. für dieses Einsatzgebiet eignen. Sie basieren ebenfalls auf den Merkmalen des HOG - Verfahrens und nutzen eine lose Anordnung von mehreren Modellen zur Detektion. Die anschließende Evaluierung umfasst den Vergleich des von Felzenszwalb et al. implementierten DPM Detektors und deren Erweiterung um formale Grammatiken (DPM + Grammer). Die Grammatikvorschriften wurden um für den Anwendungsfall der Tierdetektion angepassten Variationen erweitert. Zur Klassifizierung findet eine Support Vector Machine (SVM) Anwendung. Als Referenz wird eine in OpenCV entwickelte Variante des HOG Detektors verwendet. Es wurde ein Datensatz aus Bildern mit verschiedenen Tierspezies als Motiv angelegt. Basis ist hier eine vorsortierte Bilderdatenbank des "Snapshot Serengeti" - Projektes von Zooniverse.org. Alle Tiere wurden im Laufe dieser Arbeit annotiert und mit Metadaten hinterlegt. In der Evaluation werden zunächst die Detektoren mit verschiedenen Datensätzen trainiert und anschließend auf andere Datensätze angewendet. Dabei wird in verschiedene Tiergruppen und Schwierigkeitsstufen der Datensätze unterschieden. In dieser Arbeit wurde ein Evaluations Framework entwickelt. Damit ist es möglich mehrere verschiedenen Algorithmen zur Detektion miteinander zu vergleichen. Das Verfahren DPM und die Erweiterung um formale Grammatiken erzielten vielversprechende Ergebnisse. Die eigens für diese Arbeit entwickelten Grammatikvorschriften erzeugten kaum verwertbaren Ergebnisse.



Greif, Jakob;
Untersuchung zur Verhinderung von Richtungseindrücken bei der Wahrnehmung diffuser Schallfelder in Multikanal-Lautsprechersystemen. - 83 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2015

In Systemen zur Wiedergabe von Audiomaterial spielt die Simulation räumlichen Klangs eine bedeutende Rolle. Moderne mehrkanalige Wiedergabesysteme, wie das "Spatial Sound Wave" System des Fraunhofer Instituts, versuchen räumliche Schallfelder plausibel darzustellen. Im Zuge dessen wird großer Aufwand betrieben, auch raumakustische Merkmale klanglich und räumlich realistisch nachzubilden. In dieser Arbeit wird die Methode der Dekorrelation untersucht, um den Nachhallanteil einer Raumsimulation in einem mehrkanaligen autsprechersystem zu realisieren. Dazu wurde ein System aus Funktionen entwickelt, welches es ermöglicht mit einem Eingangssignal eine Vielzahl spezifisch dekorrelierter Ausgangssignale zu generieren. Diese wurden genutzt, um mit mehreren, symmetrisch angeordneten Lautsprechern ein diffuses Schallfeld zu erzeugen. In einem Probandentest wurde die Qualität der Schallumhüllung durch das so erzeugte diffuse Schallfeld evaluiert. Es wurde die Lautsprecheranzahl des Setups, die Kopfbewegung der Probanden, der Korrelationsgrad der Lautsprechersignale sowie die Hörerposition in die Evaluation eingebunden. Die Auswertung der Ergebnisse bestätigt die Annahme, dass starke Dekorrelation allgemein bessere Ergebnisse für die Schallumhüllung liefert. Ebenso wird die Annahme gefestigt, dass Lautsprechersetups mit vielen Lautsprechern besser für die Wiedergabe diffuser Schallfehler geeignet sind, als kleinere mit weniger Lautsprechern. Die Ergebnisse lassen außerdem darauf schließen, dass Kopfbewegungen das Hörereignis in rein diffusen Schallfeldern, welche mit Hilfe von Dekorrelation erzeugt wurden, beeinflusst. Es wurde ebenfalls festgestellt, dass die Auswirkungen der Dekorrelation stark von den Eigenschaften der Testsignale abhängt, was weitere Fragen für das Filterdesign aufwirft.



Jurgeit, Kai-Peter;
Qualitätsanalyse von Kugelarrayauralisationen basierend auf Open Profiling of Quality. - 84 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2015

Im Forschungsgebiet der virtuellen Akustik versucht man den steigenden Anforderungen für ein immersives räumliches Hörerlebnis mit neuen Technologien der Schallfeldsynthese entgegenzukommmen. Die Auralisation von akustischen Raumdaten, die mit einem sphärischen Mikrofonarray aufgezeichnet wurden, ist Gegenstand aktueller Forschung und bietet ein Verfahren zur Reproduktion dreidimensionaler Schallfelder mithilfe von Kugelflächenfunktionen. Ziel dieser Arbeit ist die Qualitätsanalyse von Kugelarrayauralisationen. Sie ermöglichen es den richtungsabhängigen Charakter virtueller akustischer Räume authentisch abzubilden. Die Qualität der Auralisation hängt jedoch von den gewählten technischen Parametern ab. Im Rahmen der Untersuchungen wurden Testsignale mit realen und simulierten Kugelarraymessdaten gefiltert und binaural auralisiert. In einem Hörtest wurde der Einfluss der Genauigkeit bei der Schallfeldreproduktion auf die Qualitätswahrnehmung evaluiert, um daraus Anforderungen an die Genauigkeit der Schallfeldabtastung ableiten zu können. Grundlage für das Hörtestdesign bildet die Methode Open Profiling of Quality (OPQ). Sie kombiniert eine quantitative Evaluierung der wahrgenommenen Gesamtqualität und die deskriptive, sensorische Profilbildung zur Erhebung individueller Qualitätsfaktoren. OPQ ermöglicht über die allgemeine Beurteilung der Gesamtqualität hinaus, ein tieferes Verständnis der Qualitätswahrnehmung. Aus den Ergebnissen dieser Arbeit geht hervor, dass die Anforderungen an die Genauigkeit in Bezug auf die gewählte Ordnung einer statischen Kugelarrayauralisation für eine hohe Qualitätswahrnehmung vergleichsweise gering sind. Außerdem zeigte sich, dass OPQ sich gut zur Qualitätsevaluierung binauraler Auralisationen durch naive Probanden eignet. Jedoch sollte die Anwendung der Methode besser in einem audiovisuellen Kontext stattfinden, da sich die Untersuchung sehr ähnlicher, unimodaler Signale als problematisch erweist.



Schneiderwind, Christian;
Die Wahrnehmung der Abweichung früher Reflexionen eines virtuellen auditiven Raumes von der realen Umgebung. - 55 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2015

Die vorliegende Arbeit beschäftigt sich mit dem Einfluss früher Reflexionen auf die Wahrnehmung von binauralem Audiomaterial. Es soll untersucht werden, inwiefern sich eine Abweichung von dem natürlichen Reflexionsmuster auf die empfundene Externalität auswirkt. In diesem Zusammenhang wurden Messungen von binauralen Raumimpulsantworten in einem Seminarraum der TU Ilmenau durchgeführt. Durch unterschiedliche Anordnung von Kunstkopf und Lautsprechern wurde Einfluss auf die Ausprägung der frühen Reflexionen in den Impulsantworten genommen. In einem anschließenden Hörtest wurden die Probanden angewiesen, die virtuelle Schallquelle der Hörbeispiele im Raum zu lokalisieren. Dabei zeigte sich, dass Hörbeispiele, bei denen das Reflexionsmuster nicht mit dem Original übereinstimmt dazu tendieren, weniger extern empfunden zu werden. Signifikante Unterschiede konnten jedoch nicht festgestellt werden. Es scheint, dass der Mensch eine gewisse Toleranz gegenüber einer Abweichung im Reflexionsmuster besitzt, wenn es darum geht, ob ein Hörbeispiel extern wahrgenommen oder "im Kopf" lokalisiert wird.



Ritter, Robin;
Virtuelle Räume für plausible Binauralwiedergabe. - 58 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2015

Die Bachelorarbeit befasst sich mit der Fragestellung nach einer Abhängigkeit zwischen dem Raum, in dem sich ein Hörer befindet und dem, der auf den Kopfhörern abgebildet wird. Da der Hörer eine ganz bestimmte Vorstellung vom Klang eines Raumes hat, liegt die Vermutung nahe, dass eine Abweichung dieser Vorstellung zu einem unrealistischen Klangeindruck führt. Inwieweit sich dieser Fakt auf die Plausibilität der Binauralwiedergabe auswirkt, soll in dieser Arbeit untersucht werden. Hierbei liegt die Betrachtung ausschließlich auf der Manipulation der Nachhallzeit von original gemessenen binauralen Raumimpulsantworten, um ein genaues Verständnis für den Zusammenhang zwischen diesem Parameter und der Externalität einer Binauralwiedergabe zu bekommen. Die erlangten Ergebnisse stützen sich auf einen Hörversuch, der im Rahmen dieser Arbeit durchgeführt wurde.



Knoop, Niklas;
Der Einfluss visueller Eindrücke auf die auditive Raumwahrnehmung. - 76 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2015

Das Hören von Audiomaterial über Kopfhörer hat eine große Bedeutung im Alltag vieler Menschen. Während bei einem Lautsprecher der physische Abstand zum Hörenden dafür sorgt, dass eine Distanz auch auditiv wahrgenommen wird, bleibt bei einem Kopfhörer das Hörereignis im Kopfbereich beschränkt. Die binaurale Synthese ist jedoch eine Möglichkeit, dieses fehlende Raumgefühl dennoch zu implementieren. Allerdings müssten durch die häufige mobile Nutzung von Kopfhörersystemen unzählige binaurale Raumimpulsantworten (BRIRs) angefertigt werden, um entsprechend auf wechselnde Räumlichkeiten reagieren zu können. Um diese Anzahl zu reduzieren, wäre es sinnvoll, Räume nach einem bestimmten Schema zusammenzufassen. Demzufolge müssen jedoch zunächst entsprechende Toleranzen gefunden werden. Diese Bachelorarbeit widmete sich der weiteren Untersuchung der "Raumdivergenz-Effekte". Sie beschreiben die unterschiedliche Wahrnehmung eines identischen Audiosignals bei wechselndem Raumeindruck. Mit einem durchgeführten Hörtest wurden zu diesem Zweck die "Externalisierung", also die Lokalisation eines Hörereignisses außerhalb des Kopfes, sowie die subjektive Übereinstimmung von Bild und Ton durch die Probanden bewertet. Die Auswertung dieser Faktoren soll zeigen wie sich die Bilder auf die Wahrnehmung der Externalisierung auswirken und ob sich Gesetzmäßigkeiten beobachten lassen Die Ergebnisse haben letztendlich gezeigt, dass Raumdivergenz-Effekte bei kleinen Unterschieden zwischen visuellen und auditiven Eindruck nicht nachgewiesen werden konnten. Bei größeren Disparitäten zwischen Bild und Ton sind diese Effekte jedoch erkennbar. Eine Zusammenfassung ähnlicher Raumgrößen, bei gleichzeitiger Gewährleistung einer überzeugenden binaurale Synthese, scheint demnach grundsätzlich möglich. Die generelle Fähigkeit zur Externalisierung konnte allerdings auch bei großen Unterschieden zwischen Bild und Ton festgestellt werden bzw. nicht drastisch eingeschränkt werden.



Schaab, Maximilian;
Automatische Klassifikation klassischer Musikstile anhand relativer Tonhöhenklassen. - 100 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2015

Diese Bachelorarbeit befasst sich mit der Klassifikation von Audioaufnahmen westlicher klassischer Musik im Bezug auf die Stilistik. Dazu wird untersucht, inwieweit der Ausgang der Klassifikation von der Information über die jeweilige Tonart der Stücke profitiert. Um die Tonart eines Stückes bestimmen zu können, bedarf es im realen Anwendungsfall einer automatischen Erkennung dergleichen. In dieser Arbeit werden vier gängige Verfahren zur automatischen Tonarterkennung untersucht. Dazu werden zunächst die Erkennungsraten auf geeigneten Datensätzen ermittelt und die zugehörigen Parameter optimiert. Die Klassifikation in die Epochen westlicher Musik Barock, Klassik, Romantik und Moderne wird auf einem 1600 Stück großem Datensatz getestet. Mittels der Tonart werden die Stücke nach Tongeschlecht (Dur/Moll) aufgeteilt. Für jedes Stück wird eine globale Chromastatistik extrahiert, welche anschließend zirkulär rotiert wird, bis der Grundton der jeweiligen Tonart an erster Stelle steht. Anhand dieser relativen Tonhöhenklassen werden für die Dur-, als auch für die Moll-Stücke separate Modelle trainiert und die Testdaten anschließend entsprechend klassifiziert. Es wird gezeigt, dass relative Tonhöhenklassen, welche sich die Information über die Tonart zu Nutze machen, das Klassifikationsergebnis gegenüber einfachen Chromamerkmalen deutlich verbessern. Eine gute Methode zur automatischen Tonarterkennung führt wiederum zu guten Klassifikationsergebnissen und übertrifft in manchen Fällen sogar die korrekt annotierten Tonarten. Ein ausführlicher Vergleich mit weiteren chromabasierten Merkmalen zeigt, dass relative Tonhöhenklassen in vielerlei Hinsicht stabile und effiziente Merkmale darstellen. Die Klassifikation auf Basis von globalen Chromamerkmalen erreicht jedoch nicht den Stand der Technik auf dem Gebiet der stilistischen Klassifikation.



Fischer, Georg;
Untersuchungen zur perfekten Audiorekonstruktion von Kugelarraydaten. - 62 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2015

Ziel der vorliegenden Arbeit ist es, eine Filterbank mit der Eigenschaft perfekter Audiorekonstruktion auf sphärische Arrays anzuwenden. Untersucht werden soll, ob eine Frequenzabhängige Verarbeitung der Arraydaten, erreicht werden kann, wobei ein Fokus dieser Arbeit auf der Reduktion der Schallfelddaten liegt. Darüber hinaus soll untersucht werden, inwieweit eine Filterbankanwendung zur Reduktion von Messfehlern verwendet werden kann. Zum Erreichen der Ziele wurde eine MDCT-Filterbank auf simulierte Kugelarraydaten angewandt. In den Experimenten wurden verschiedene Arraykonfigurationen und Testsignale untersucht. Für unterschiedliche Filterbankkonfigurationen wurde die Qualität der Filterung in einem Hörexperiment analysiert und evaluiert. In den Hörtests konnte gezeigt werden, dass eine Filterbank ein flexibles Werkzeug darstellen kann, um die Arrayverarbeitung effizienter zu gestalten. Darüber hinaus war es möglich, den Einfluss von unkorreliertem Rauschen mithilfe der Filterbank zu reduzieren.



Heinl, Tobias;
Untersuchung zur Anwendung eines Spatial-Audio-Systems in Verbund mit konventioneller Bühnenbeschallung. - 88 S. Ilmenau : Techn. Univ., Bachelorarbeit, 2015

SpatialSound Wave ist ein wellenfeldsynthese-basiertes Audiosystem zur räumlichen Wiedergabe virtueller Audioszenen auf reduzierten Lautsprechersetups. Es wurde am Fraunhofer-Institut für Digitale Medientechnologie IDMT in Ilmenau entwickelt und wird unter anderem in Planetarien, Tonstudios sowie als mobiles System verwendet. Um SpatialSound Wave auch zur Beschallung von Bühnen nutzen zu können, bedarf es umfangreicher Erweiterungen der bisherigen Audio-Rendering-Struktur. Zusätzlich müssen geeignete Lautsprechersetups entwickelt werden. Der Zuhörer soll schlussendlich in der Lage sein, das Geschehen auf der Bühne nicht nur in angemessener Lautstärke sondern auch räumlich transparent wahrnehmen zu können. Um virtuelle Quellen möglichst präzise und unabhängig von der Position des Hörers erzeugen zu können, müssen die konventionellen Stereo-Setups um zusätzliche Lautsprecher erweitert werden. Die entstehenden Teilsysteme werden unter Beachtung des Haas-Effektes aufeinander abgestimmt und können so unterschiedlich dimensioniert werden. In dieser Arbeit wird zunächst die bisherige Rendering-Struktur von SpatialSound Wave um die Möglichkeit für front-orientierte Bühnenbeschallung erweitert und anschließend entsprechende Lautsprechersetups entwickelt. Im Rahmen eines Probandentests wurden die Lokalisationseigenschaften sowie der relative Höreindruck der jeweiligen Systeme evaluiert. Die Auswertung der Daten bestätigt, dass die neu entwickelten Setups bezüglich beider Kriterien einem konventionellen Stereosystem deutlich überlegen sind. Durch Messungen konnte bei allen Testsystemen eine gute bis sehr gute Sprachverständlichkeit festgestellt werden. Zur späteren Nutzung wurde ein Entwurf für eine grafische Benutzeroberfläche ausgearbeitet, deren Bedienstruktur speziell zur Verwendung mit den entwickelten Lautsprechersystemen ausgelegt ist.



Dannehl, Jill;
Untersuchung zur Verifikation von einem emotionsbasierten Lärmemissionstest in unterschiedlichen Testumgebungen. - 70 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2015

In der vorliegenden Bachelorarbeit werden die Erkenntnisse einer Masterarbeit aufgegriffen, in der eine Erhebungsmethode zur Beschreibung der Wahrnehmung von Hydraulikgeräuschen durch Experten entwickelt worden ist. Zwar konnten in dieser nachvollziehbare Ergebnisse gewonnen werden, eine Verifikation wurde jedoch nicht durchgeführt. Ziel dieser Bachelorarbeit war es daher, die Reproduzierbarkeit der Ergebnisse in einer unterschiedlichen Testumgebung und mit Laien als Probanden zu untersuchen. Dazu werden zunächst die Forschungsgebiete der Emotionen und Lärm näher betrachtet. Ein Überblick über die verschiedenen Verfahren zur Messung von Lärm, sowie Methoden der Emotionsmessung wird gegeben. Im Weiteren wird die Hörtestmethode des Free Choice Profiling, dessen Anpassung und Durchführung näher erläutert. Die erhobenen Daten werden durch eine Hauptkomponentenanalyse analysiert und interpretiert. Ein Vergleich der erzielten Ergebnisse beider Studien wird durchgeführt und eine Prognose über die Reproduzierbarkeit des Wahrnehmungstest abgegeben.



Müller, Jan;
Medientechnologie für die interaktive Lagekarte: Spezifikation eines Datenformats und Implementierung der erforderlichen Schnittstellen zum Datenaustausch. - 70 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Für die Verbesserung der Ausbildung von Stabskräften beim Bundesamt für Bevölkerungsschutz und Katastrophenhilfe wurde das Projekt Medientechnologie für die interaktive Lagekarte, kurz MiLK, ins Leben gerufen. Es soll eine webbasierte Lernumgebung entstehen, die ein interaktives Training an der Lagekarte ermöglicht. Die Lernumgebung besteht aus einer Lehrer- und einer Schüleranwendung. In der Lehreranwendung können Übungen erstellt werden, die durch den Schüler später gelöst werden müssen. Aufbauend auf einer ersten Implementierung der Lehreranwendung befasst sich diese Arbeit mit der Speicherung von Übungsdaten in einer RDF-Datenbank, um Übungen zu einem späteren Zeitpunkt abrufen oder verändern zu können. Hierzu werden die von der Benutzeroberfläche generierten Daten für die Speicherung in eine RDF/XML-Darstellung überführt. Des Weiteren beschreibt diese Arbeit die Implementierung einer Datenschnittstelle, welche die Daten mittels Konvertierung für die Speicherung in der RDF-Datenbank vorbereitet und gespeicherte Daten aufbereitet zur Verfügung stellt. Weiterhin wird eine Lösung entwickelt und prototypisch implementiert, mit der, mittels einer WebSocket-Verbindung, Änderungen in der Datenbank an andere Systeme weitergegeben werden können, ohne dass diese die Daten explizit abrufen müssen.



Gotsch, Marcel;
Analyse und Optimierung von segmentbasiertem Video-Matching. - 66 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Das massive Aufkommen von Videoinhalten im Internet verlangt nach neuen Methodiken, welche zum Schutz des Urheberrechts, der Überwachung von Werbeausstrahlungen, der Suche nach Inhalten und zur Reduktion von redundantem Videomaterial innerhalb von Datenbanken eingesetzt werden können. Diese Arbeit gibt einen Überblick über zwei wichtige Verfahren und präsentiert eine prototypische Applikation, welche ähnliche Videosegmente innerhalb einer Datenbank identifiziert. Dazu wird ein State of the Art Hash-Algorithmus verwendet, der robust gegen typische Transformationen, wie Weichzeichnung, Rotation, Beschnitt, Einfügen eines Logos, Helligkeits- und Kontrastveränderung und starkes Rekodieren ist. Das Verfahren wurde mit realen und synthetisch erzeugten Datensätzen evaluiert.



Hohlfeld, Julian;
Untersuchung zur Beeinflussung emotionaler Reaktionen durch die Interaktion auditiver und visueller Reize. - 102 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

In dieser Arbeit wird untersucht, welchen Einfluss Musik auf die wahrgenommene Emotion bei der Rezeption von Spielfilmszenen hat. Im Vordergrund stehen dabei Emotionen des Ekels, der Angst sowie starker (negativer) Aktivierung, welche durch den Einsatz bestimmter Musikstücke verstärkt oder abgeschwächt werden sollten. Hierfür wurden fünf Filmszenen kommerzieller Spielfilme ausgewählt und anschließend mit verschiedenen Musikstücken unterlegt, um unterschiedliche Stimuli hinsichtlich der emotionalen Qualität und Intensität zu erzeugen. Neben Grundlagen der kognitiven Emotionsforschung werden dabei auch Erkenntnisse und die geschichtliche Entwicklung der zeitgenössischen Emotionsforschung sowie Besonderheiten film- und musikinduzierter Emotionen näher beleuchtet und in die Konzeption der Stimuli integriert. Die emotionalen Reaktionen der Probanden wurden im Rahmen eines Laborexperimentes anhand einer modifizierten Version des Positive and Negative Affect Schedule (PANAS) nach Watson & Tellegen (1988) erfasst und anschließend statistisch ausgewertet. Die einzelnen Film- und Audiosequenzen wurden hierfür zuerst in ein mehrdimensionales Modell eingeordnet, anschließend wurden die statistischen Messwerte hinsichtlich ihrer zentralen Tendenz miteinander verglichen. An dem Experiment nahmen 37 Personen einer selektiven Stichprobe teil. Dabei zeigten sich signifikante Unterschiede zwischen den emotionalen Reaktionen der einzelnen Stimulusgruppen. Bei drei der fünf Filmszenen ließen sich Hinweise dafür finden, dass Musik spezifische emotionale Wirkungen im Kontext aktivierender Filmsequenzen auslösen kann. Hierbei ließen sich deutliche Zusammenhänge zwischen der emotionalen Wirkung eines Musikstückes und der emotionalen Wirkung der Filmsequenz, in welchem dieses Musikstück eingesetzt wurde, erkennen. Weiterhin konnte beobachtet werden, dass die Konfrontation der Probanden mit einem stark negativen visuellen Reiz zu einem geringeren Einfluss von Musik auf die emotionale Reaktion führte.



Oertel, Jonas;
Raumakustische Klassifizierung und Vergleich verschiedener Hörumgebungen für Lautsprecherwiedergabe. - 63 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2014

Diese Arbeit befasst sich mit den raumakustischen Eigenschaften von Räumen, die für die Wiedergabe von Audioinhalten über Lautsprecher genutzt werden. Da das Wohnzimmer im privaten Bereich als die bevorzugte Umgebung hierfür gelten kann, wird dieser Raum genauer untersucht. Anhand von Messungen der Raumimpulsantwort in sechs Beispielräumen und der daraus abgeleiteten Kenngrößen wird eine vergleichende Untersuchung der raumakustischen Eigenschaften durchgeführt und eine Klassifizierung der Nutzungsumgebungen erstellt. Hierfür werden Nachhallzeit, Anfangsnachhallzeit, Schwerpunktzeit, Klarheits- und Deutlichkeitsmaß sowie interauraler Kreuzkorrelationskoeffizient und Seitenschallgrad verwendet. Es ergeben sich mehrere Kriterien, die eine Bewertung der raumakustischen Eigenschaften ermöglichen. Diese können bei der Erforschung und Entwicklung von Audioverarbeitung und -geräten für den Heimgebrauch als Hilfsmittel dienen, diese an die Raumakustik der Nutzungsumgebungen anzupassen.



Kaiser, Christian;
Evaluation von Methoden zur automatischen Erkennung von Fehlern in Audio-Metadaten. - 89 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Die vorliegende Arbeit untersucht Fehler in Metadaten von Musikstücken. Sie wird durch das Bedürfnis motiviert, qualitative Informationssysteme ohne Duplikate mit geringem manuellen Aufwand zu realisieren. Fehler werden dabei als Ursache dieser Duplikate betrachtet. Ziel der Arbeit ist es, grundlegende Techniken zur Identifikation von Audio-Metadaten-Dubletten zu beschreiben und anschließend ihre Eignung durch reale Testdaten zu überprüfen. Die vier Phasen, die für eine erfolgreiche Duplikaterekennung notwendig sind, werden vorgestellt. Besonders Distanzmaße zur Messung der Ähnlichkeit zweier Zeichenketten und Klassifikationsmethoden werden im Detail beschrieben.



Rekitt, Martin;
Bestimmung der Häufigkeitsverteilung von Quadrantenfehlern bei der Lokalisation von Hörereignissen unter Verwendung einer binauralen Kopfhörerwiedergabe. - 70 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Das auditive System des Menschen ermöglicht durch die Verarbeitung von akustischen Eigenschaften des Schallsignals eine dreidimensionale Klangwahrnehmung. Werden diese Merkmale gestört oder nicht eindeutig verarbeitet, können Lokalisationsfehler auftreten. In der Binauralsynthese, bei der die Filterwirkung der Ohrmuschel durch Kopfbezogene Übertragungsfunktionen (HRTF's) simuliert wird, sind Anomalien in der Richtungswahrnemung häufig präsent. Die vorliegende Bachelorarbeit befasst sich mit dem sogenannten Quadrantenfehler. Untersucht wird dessen Häufigkeitsverteilung in der Horizontalebene. Dazu wird ein Hörtest unter der Verwendung einer binauralen Kopfhörerwiedergabe konzipiert. Im ersten Teil der Arbeit erfolgt die Planung und Durchführung von Raumimpulsantwortmessungen. Die Ergebnisse werden analysiert und für die mit MATLAB durchgeführte Binauralsynthese vorbereitet. Aufbauend auf den Resultaten des Algorithmus, wird der Hörtest konzipiert und realisiert. Weitere Überlegungen während des Bearbeitungsprozesses wie die Auswahl der Messpositionen, Wahl der Signale oder räumlicher Aufbau des Hörtests werden ausführlich erklärt. Die Bewertungen der Probanden ergaben häufig vorkommende Quadrantenfehler im Bereich der direkten Richtungen vorn und hinten. Mit steigender lateraler Auslenkung treten diese immer seltener auf. Für die linke und rechte Seite zeigt sich ein nahezu identisches Verhalten. Im hinteren Halbkreis sind im Gegensatz zum vorderen Teil leicht verbesserte Resultate zu erkennen. Weiterhin hat sich die Notwendigkeit der monauralen Signalverarbeitung zur Vermeidung des Quadrantenfehlers erwiesen. Zusätzlich wird die Abhängigkeit binauraler Signalmerkmale in Bezug auf die Verteilung des vorliegenden Problems untersucht. Mit Hilfe der Hörtestergebnisse erfolgt außerdem eine Auswertung der Externalisation des Signals in Abhängigkeit von der Wiedergabeposition.



Gerhardt, Christoph;
Entwicklung eines Verfahrens zur Verbesserung von Mikrofonklassifizierung basierend auf der Analyse von Umwelteinflüssen. - 58 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Die Anzahl täglich erstellter Audioaufnahmen ist vor allem durch die zunehmende Verbreitung von mobilen Aufnahmegeräten in den letzten Jahren enorm gestiegen. Allerdings ist durch vielfältige Bearbeitungsmöglichkeiten nicht immer gewährleistet, dass der Inhalt einer Datei auch dem der originalen Aufnahme entspricht. Um mögliche Bearbeitungen zu entdecken, wurden in den letzten Jahren verschiedene Ansätze entwickelt. Einer dieser Ansätze basiert darauf, dass für die Aufnahme verwendete Mikrofon zu identifizieren und damit zu gewährleisten, dass die gesamte Aufzeichnung mit dem selben Gerät durchgeführt wurde. Ziel dieser Arbeit ist es, ein solches Verfahren zur Mikrofonklassifizierung durch die Analyse und Verarbeitung von Umgebungseinflüßen zu erweitern und so die Genauigkeit der Ergebnisse zu verbessern um eine höhere Zuverlässigkeit zu erreichen.



Brass, Tobias;
Raumakustische Parameter von Räumen. - 59 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Das Ziel akustischer Aufnahme- und Wiedergabesysteme ist es, beim Rezipienten eine perfekte auditive Illusion zu erzeugen. Aus diesem Grund beschäftigen sich verschiedene Einrichtungen mit der Weiterentwicklung von Audiosystemen wie der binauralen Kopfhörerwiedergabe, der Wellenfeldsynthese oder Ambisonics. Im Rahmen eines Forschungsprojekts an der Technischen Universität Ilmenau sollen Untersuchungen durchgeführt werden, die unverstandene Faktoren bezüglich der Aufnahme und Wiedergabe dieser Verfahren klären sollen. Beispielhafte Aspekte der Untersuchung sind die Divergenz zwischen Aufnahme- und Wiedergaberaum oder die Komplexität der Szene. Um dieses Projekt zu unterstützen wird in dieser Arbeit anhand raumakustischer Messungen eine Auswahl raumakustischer Parameter untersucht. Basierend auf Messungen von Raumimpulsantworten werden Räume mit unterschiedlichen akustischen Eigenschaften akustisch gemessen und ausgewertet. Das Ziel der Auswertung ist es, den Räumen eine akustische Charakteristik zuzuschreiben.



Anton, Markus;
Raumakustische Messungen und akustische Bewertung von Seminarräumen an der TU Ilmenau. - 48 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Diese Bachelorarbeit befasst sich mit der Messung und Auswertung raumakustischer Parameter von Seminarräumen an der Technischen Universität Ilmenau hinsichtlich der Sprachverständlichkeit. Hierzu wird im ersten Schritt der Messvorgang erläutert. Im Fokus der Betrachtung befinden sich die Nachhallzeit, die frühe Abklingzeit, das Deutlichkeitsmaß, der Deutlichkeitsgrad und der Schalldruckpegel. Die Parameter werden für fünf Räume unterschiedlichen Charakters erhoben und anschließend verglichen.



Schreindorfer, David;
Vorverarbeitung für die Extraktion von visuellen Merkmalsdeskriptoren in Nachrichtenvideos. - 66 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Die vorliegende Bachelorarbeit beschäftigt sich mit dem Thema der Vorverarbeitung für die Extraktion von visuellen Merkmalsdeskriptoren in Nachrichtenvideos. Dazu werden Overlay-Grafiken detektiert. Zu den hier behandelten Grafiken zählen Picture-in-Pictures, Logos, Untertitel und Bauchbinden. Es werden Algorithmen zur Detektion der Grafiken vorgestellt, implementiert und evaluiert. Neben einem umfangreichen Grundlagenteil, der für diese Arbeit wichtige Verfahren erläutert, werden aktuelle Forschungsergebnisse im Bereich der Detektion dieser Grafiken gezeigt. Abschließend werden die Ergebnisse der Algorithmen anhand eines Datensatzes ausgewertet. Dabei wird eine Genauigkeit von bis zu 75 % erzielt.



Schubert, Julia;
Storyboard-Patterns in digitalen Spielen. - 52 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Diese Arbeit beschäftigt sich mit der Identifizierung und Beschreibung von Strukturen, sogenannten Patterns, in Anwendungen des Game-Based Learnings, welche die Lernprozess von Nutzern unterstützen. Als Grundlage für deren Beschreibung dient das Storyboarding, welches gleichzeitig auch in der Spielentwicklung als Element eines Spieles angewendet werden kann. Für die Herausarbeitung dieser Storyboard-Patterns muss eingangs auf das Storyboarding selbst als Werkzeug eingegangen werden. Im weiteren Verlauf werden Patterns und Instanzen durch Hinzunahme dieser Storyboards erläutert und abgegrenzt, um auf diese Weise eine Grundlage für die weitere Arbeit mit pädagogischen Patterns zu erhalten. Ziel dieser Arbeit ist die konkrete Identifizierung von pädagogischen Patterns in den Lernspielen "1961", "TraSt" und "GERA", anhand der zuvor festgelegten Eigenschaften. Zusätzlich soll im Rahmen dieser Arbeit eine Anwendung entstehen, die den Einsatz eines digitalen Storyboards zeigt.



Mittag, Christina;
Untersuchung zur Berechnung von Lautsprechersignalen bei wellenfeldsynthese-basierter Tonwiedergabe mit reduzierter Lautsprecheranzahl. - 62 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Die Wellenfeldsynthese ist ein räumliches Audiowiedergabeverfahren, bei dem das Schallfeld einer virtuellen Schallquelle für einen definierten Hörbereich synthetisiert wird. Hierzu wird für jeden Lautsprecher mit Hilfe von Verzögerungs- und Verstärkungskoeffizienten ein individuelles Signal berechnet, so dass durch die Überlagerung der Einzelsignale das Schallfeld der virtuellen Quelle entsteht. Dafür wird eine sehr hohe Anzahl an Lautsprechern benötigt, deren Anschaffungskosten und Raumanspruch vor allem für kleine Einrichtungen und Privatpersonen eine große Hürde darstellen. Das Fraunhofer Institut für Digitale Medientechnologie IDMT in Ilmenau forscht seit einigen Jahren an einer Technologie, die wellenfeldsynthese-basierte Audiowiedergabe auch mit reduzierter Lautsprecheranzahl ermöglichen soll. Bei der Darstellung bewegter virtueller Quellen können jedoch hörbare Klangartefakte entstehen. Diese sind vermutlich auf die Überlagerung der unterschiedlich verzögerten Signale zurückzuführen. In dieser Bachelorarbeit wird der Algorithmus, der die zur Synthese benötigten Koeffizienten berechnet, analysiert und ein Ansatz zur Optimierung gesucht. Aufbauend auf Beschreibungen der Funktionsweise des Algorithmus und vorangegangenen Untersuchungen zu Frequenzverschiebungen bei Wellenfeldsynthese werden zwei Parameter des Algorithmus näher betrachtet. Ihre Auswirkung auf die Wiedergabequalität und den Bewegungsfluss der Quelle wird in einem Hörtest evaluiert. Die Auswertung der erhobenen Daten bestätigt die Abhängigkeit der Artefakte von der Verwendung von Verzögerungskoeffizienten. Ein Einfluss der Parameter auf den wahrgenommenen Bewegungsfluss ist kaum zu erkennen. Auf Grundlage der gewonnenen Erkenntnisse werden Anwendungsempfehlungen für die zukünftige Arbeit mit dem Algorithmus gegeben.



Fiedler, Bernhard;
Untersuchung zur Umsetzung einer interaktiven Raumsimulation zur Distanzdarstellung virtueller Schallquellen. - 69 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Im Bereich der Virtuellen Realität gibt es stets neue technologische Fortschritte, um den akustischen Eindruck so realitätsnah wie möglich zu gestalten. Eine wirklichkeitsgetreue Simulation von audiovisuellen Inhalten erfordert neben der Richtungswahrnehmung zusätzlich die Darstellung räumlicher Tiefe. Insbesondere mit der Entwicklung von mobilen Virtual-Reality-Brillen steigt das Interesse an personengebundenen Wiedergabesystemen zur dreidimensionalen Klangabbildung. Die binaurale Kopfhörerwiedergabe eignet sich dafür im besonderen Maße. Das Ziel der Arbeit ist die Entwicklung eines Raumsimulationskonzeptes zur Distanzdarstellung von virtuellen Schallquellen unter Verwendung der Binauralsynthese. Als Grundlage dient die objektbasierte Wiedergabe virtueller Klangszenen, die eine getrennte Betrachtung von Schallquellen unabhängig vom Wiedergabesystem ermöglicht. Die Arbeit analysiert zwei bisherige Ansätze der objektbasierten Raumsimulation und vergleicht diese hinsichtlich ihrer Vor- und Nachteile zur akustischen Realitätstreue sowie zur Signalverarbeitung. Auf Basis der gewonnenen Erkenntnisse gibt die Arbeit einen Vorschlag zur Vereinigung der Algorithmen in einem einzigen Konzept. Unter Berücksichtigung der Mechanismen des menschlichen Entfernungshörens erfolgt die detaillierte Vorstellung der entworfenen Algorithmen. Diese werden zudem in einem Software-Prototypen implementiert und evaluiert. Die Ergebnisse der objektiven Vergleiche zwischen gemessenen und simulierten Raumimpulsantworten zeigen eine realitätsnahe Abbildung der Initialzeitlücken auf. Auch hinsichtlich anderer Distanzmerkmale, wie das Verhältnis von Direktschallenergie zu Nachhallenergie sind grundsätzliche Ähnlichkeiten erkennbar. Da die Wahrnehmungsqualität von den Eigenschaften des zu simulierenden Raumes und der verwendeten Kopfübertragungsfunktionen abhängt, muss der Parametersatz für die Simulation besonders sorgsam ermittelt werden. Insgesamt gibt das entworfene Rendering-Konzept einen Vorschlag zur Erweiterung der binauralsynthesebasierten Raumsimulation, um den Eindruck räumlicher Entfernung virtueller Schallquellen zu vermitteln. Aus den informellen Hörtests ist zu entnehmen, dass die Integration entfernungsabhängiger Eigenschaften unter Einschränkungen zu einem gewünschten relativen Entfernungseindruck führt.



Haigis, Michael;
Automatische Detektion und Klassifikation von Tieren in Videos. - 109 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Die heutige Artenforschung nutzt zunehmend technische Möglichkeiten, um das Verhalten verschiedener Spezies zu untersuchen. Dabei steht sie vor der Herausforderung, die enorme Datenmenge, die Videofallen produzieren, zu verarbeiten. In dieser Arbeit sollen automatisierte Algorithmen vorgestellt werden, die das lineare Sichten dieses Materials nicht nur unterstützen, sondern ganz ersetzen. Zunächst wird auf vorrangegangene Forschungen eingegangen. Innerhalb des Forschungsprojektes SAISEBCO des Max-Planck-Instituts für evolutionäre Anthropologie, des Fraunhofer Instituts für Digitale Medientechnologie und des Fraunhofer Institut für Integrierte Schaltungen werden hierbei Algorithmen zur Detektion und Klassifikation verschiedener Menschenaffenarten entwickelt. Ausgangspunkt für den entwickelten Algorithmus sind Videoaufnahmen, aus denen in regelmäßigen Abständen Einzelbilder extrahiert wurden. Als Detektionsalgorithmus zur Bestimmung der "region of intrest" wird ein auf einem Hintergrund basierender Selektionsalgorithmus (GoDec) verwendet, dessen Kernfunktionalität durch eine Abwandlung der "Principal Component Analysis" (PCA) realisiert wird. Als Ergänzung zu den so gewonnenen ROIs werden die Ergebnisse mit einem den optischen Fluß definierenden Algorithmus verifiziert. Eine anschließende Evaluation dieses Detektionsblocks erbrachte zufriedenstellende Ergebnisse. Für die Klassifikation der Tierart wurde die klassische Pipeline "Vorverarbeitung", "Merkmalsextraktion" und "Klassifikation" verwendet. Während sich die Vorverarbeitung auf das Anpassen der Beleuchtungssituation beschränkte, wurden als Merkmalsdeskriptoren GABOR, "Diskrete Cosinus-Transformation" (DCT), "Weber Local Descriptor" (WLD), "Local Binary Pattern" (LBP), "Local Tenary Pattern" (LTP), PIXEL und "Histogram of Oriented Gradients" (HOG) verwendet. Als Klassifikatoren werden "Support Vector Machine" (SVM), "K-Nearest Neighbor" (KNN) und "Sparse Representation Classification" (SRC) mit den Merkmalsraumtransformationen "Principal Component Analysis" (PCA) und "Linear Preserving Projection" (LPP) kombiniert und untereinander verglichen. Am erfolgversprechendsten erwies sich "K-Nearest Neighbor" mit dem Merkmalsdeskriptor LTP und der Merkmalsraumtransformation LPP.



Pawlus, David;
Implementierung der interaktiven Lagekarte für Training im Bevölkerungsschutz und Katastrophenhilfe. - 90 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2014

Extreme Wetterphänomene, bedingt durch den voranschreitenden Klimawandel, und terroristische Anschläge stellen nur zwei aus einer Vielzahl von Situationen dar, die ein hohes Gefährdungspotential für die Menschheit mit sich bringen. Kommt es zu einem Katastrophenfall, so ist die Lage oft unübersichtlich und erfordert enorme technische und organisatorische Einsatzmaßnahmen, um die Gefahr einzudämmen. Für diese Aufgabe muss bei den Verantwortlichen der Katastrophenabwehr fundiertes Wissen über die Maßnahmen und Werkzeuge des Krisenmanagements vorhanden sein. Die Ausbildung der Führungskräfte für den Einsatz übernimmt in Deutschland das BBK (Bundesamt für Bevölkerungsschutz und Katastrophenhilfe). Bei den Lehrgängen hat sich gezeigt, dass das vermittelte theoretische Wissen durch das Fehlen von realitätsnahen praktischen Übungsmöglichkeiten nur teilweise angewendet werden kann. Um die Qualität der Lehrgänge zu verbessern, soll auf Basis der Webble-Technologie eine interaktive Lernumgebung entwickelt werden, die sich auf die Vermittlung der Grundlagen der Lagedarstellung konzentriert. Dafür werden in der vorliegenden Arbeit sowohl ein Konzept als auch ein Design und das User Interface für dieses System nach den Grundsätzen der Usability (deutsch: Gebrauchstauglichkeit) entwickelt. Ziel dabei ist die Implementierung eines funktionsfähigen Prototyps, welcher das entwickelte Konzept veranschaulicht.



Bauer, Mathias;
Untersuchung zu Bewertungsunterschieden im Zusammenhang von Musik und Emotionen in Abhängigkeit von der Wahl des Antwortformates. - 60 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2014

Der Begriff "Emotion" ist gemäß dem derzeitigen Forschungsstand nicht exakt definierbar, weshalb es eine Vielzahl an unterschiedlichen Erklärungsversuchen und Emotionsmodellen gibt. Besonders im Bereich Musik gestalten sich die Klassifizierungsversuche bisher schwierig. Ein Anliegen dieser Arbeit ist es daher einen möglichst umfangreichen und differenzierten Einblick in das Feld der musikinduzierten Emotionen zu geben. Mit den, aus dem Bereich der Psychologie bereitgestellten, Self-Report Methoden können zunehmend klar verwertbare Resultate bezüglich der individuellen Bewertungen eines Menschen gewonnen werden. In der vorliegenden Arbeit soll der Fokus daher besonders auf verschiedene Arten dieser subjektiven Befragungsmethoden gelegt werden, sowie deren Auswirkungen auf die Beurteilungen in einer Testsituation. Auf Grundlage der Daten einer Studie bezüglich der Verwendung des Free-Choice Profiling und des Self-Assessment Manikin, soll in einem neu konzipierten Test mittels paarweisen Vergleichs geklärt werden, inwieweit sich die bereits erhaltenen Ergebnisse reproduzieren lassen. Die Auswahl geeigneter Teststimuli ist dabei ebenso Gegenstand der Arbeit, wie die umfassende Erläuterung der Testkonzeption, -durchführung und -auswertung. Eine abschließende Gegenüberstellung der drei Verfahren soll deren Vor- und Nachteile zutage fördern und Anhaltspunkte liefern, inwiefern die Bewertungen von Testteilnehmern durch die Eigenarten der einzelnen Methoden beeinflusst oder verzerrt werden können. Darüber hinaus werden bestehende Emotionsmodelle und Self-Report Methoden kritisch hinterfragt und Versuche unternommen neue Ansätze zu liefern, um zukünftige Bearbeitungen besser dem Bereich der Musik-Emotionsforschung anpassen zu können.



Betz, Lorenz;
Vibroakustische Untersuchungen eines elektrodynamischen Wandlers in geschlossenen Gehäusen unterschiedlicher Geometrien. - 79 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2013

Die Arbeit befasst sich mit dem Einfluss der Gehäusegeometrie auf das Schwingungsverhalten und die akustischen Übertragungseigenschaften geschlossener Lautsprecher. Bei sehr flachen und gleichzeitig langen Gehäuseformen treten Effekte auf, die durch die klassischen Berechnungsvorschriften geschlossener Lautsprecher nicht erklärt werden können. Im Detail ist dies ein Absinken der Resonanzfrequenz sobald die Gehäusetiefe bei konstantem Volumen reduziert wird. Dieser Effekt wird verstärkt, wenn zudem eine zweite Dimension verkleinert wird, so dass ein langes, flaches Lautsprechergehäuse entsteht. Der Einfluss der Gehäusegeometrie auf das Schwingungsverhalten wurde in vorangegangenen Arbeiten aufgezeigt und lässt sich durch die Oszillationseigenschaften der Luft im Gehäuseinneren sowie durch Grenzschichteffekte erklären. In dieser Arbeit werden die akustischen Auswirkungen der tieferen Resonanzfrequenz untersucht sowie weitere Parametervariationen durchgeführt. Neben einer Variation der Wandlerposition und der Membranmasse wird der Effekt an einem zweiten Wandler überprüft. Die Messergebnisse zeigen einen geringfügig höheren Schalldruckpegel unterhalb der Resonanzfrequenz, sobald die Gehäusetiefe bei konstantem Volumen reduziert wird. Verstärkt wird dieser Trend, wenn eine zweite Dimension des Lautsprechers minimiert und die Wandlerposition Richtung Rand verschoben wird. Eine interessante Beobachtung ergibt der Verlauf nichtlinearer harmonischer Verzerrung unterhalb der Resonanzfrequenz, der trotz größerer Membranauslenkung geringere Werte aufweist. Dies könnte ein Vorteil flacher, langer Gehäuse gegenüber konventionellen Gehäuseformen sein. Gleichzeitig steigt mit der Variation der Gehäusegeometrie aber auch der Einfluss von Stehwellen im Lautsprechergehäuse, der zu lokalen Minima und Maxima im Frequenzgang führt. Die Messungen an einem zweiten Wandler zeigen, dass der Einfluss der Gehäusegeometrie von verschiedenen Parametern, insbesondere der Membranmasse sowie der Steifigkeit der Aufhängung abhängt und dementsprechend unterschiedlich stark auftritt.



Sturm, Michael;
Untersuchung zur raumakustischen Entzerrung von Multikanallautsprechersystemen. - 118 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2013

Bisherige Bemühungen zur raumakustischen Entzerrung von 3D-Audio-Applikationen sind in ihrer Komplexität oftmals praxisfern und deshalb in ihren Ergebnissen unzureichend. Die Equalisierung spielt jedoch bei der Anwendung von Multikanallautsprechersystemen eine entscheidende Rolle, da die erfolgreiche Synthetisierung des Zielschallfelds innerhalb einer Hörfläche von ihr abhängig ist. Diese Bachelorarbeit analysiert deshalb, mittels Messungen von Raumimpulsantworten, die Auswirkung von Reflexionen unterschiedlicher Lautsprecherpositionen auf verschiedene Punkte einer definierten Fläche. Auf dieser Grundlage wird anschließend ein Ansatz zu deren digitalen Entzerrung präsentiert, der ein Mittelungsschema über Raumimpulsantworten ausgewählter Messpositionen, inklusive einer ausreichenden spektralen Auflösung für das Filterdesign, umfasst. Durch die Berücksichtigung raumakustischer Grundlagen wird die Komplexität der Entzerrung reduziert und eine Praxistauglichkeit hergestellt, die eine Equalisierung von Hörflächen unterschiedlicher Räume ermöglichen soll. In einer Entzerrung mittels programmierter FIR-Filter wird dies, bezüglich spektraler Linearisierung der Hörfläche eines stark reflektiven Raumes, bestätigt. Weiterhin besitzt der Ansatz eine Gültigkeit für verschiedene Höhen dieses Bereichs. Die Grenzen des dabei verwendeten Filterdesigns verhindern allerdings bessere Ergebnisse. Mit diesem Ansatz findet eine tendenzielle Verringerung der Nachhallzeit, aber nur eine geringfügige Auswirkung auf Reflexionen innerhalb der Hörfläche statt, womit die Frage nach der erfolgreichen Equalisierung von 3D-Audio-Anwendungen offen bleibt. Die Übertragbarkeit auf beliebige Räume kann ebenfalls nicht geklärt werden.



Pälchen, Sascha;
Anwendung von Methoden zur Bandbreitenerweiterung zur Optimierung von Kugelarrayauralisationen. - 80 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2013

Mikrofonarrays mit kugelförmig angeordneten Mikrofonen erlauben eine dreidimensionale Abtastung räumlicher Schallfelder. Die so aufgezeichneten Messdaten können auf beliebigen Wiedergabesystemen, wie z.B. mithilfe der Wellenfeldsynthese (WFS) oder für die binaurale Wiedergabe über Kopfhörer auralisiert, also hörbar gemacht werden. Somit soll einem Hörer der Eindruck vermittelt werden, sich in dem gemessenen Raum zu befinden. Der Frequenzbereich, der fehlerfrei durch ein Mikrofonarray aufgezeichnet werden kann, ist stark von der verwendeten Array-Konfiguration abhängig. Auch Messfehler, wie räumliches Aliasing oder Mikrofonrauschen schränken die verwendbare Bandbreite des Arrays bei hohen bzw. niedrigen Frequenzen ein. Mithilfe von Verfahren zur psychoakustischen Bandbreitenerweiterung soll der Frequenzbereich bei der binauralen Auralisation von Kugelarraydaten erweitert werden. Basierend auf dem Prinzip der "missing fundamental" (deutsch: fehlender Grundton) kann dem Menschen auch beim Fehlen niedriger Frequenzen ein Tieftoneindruck vermittelt werden. Die Qualität der Tieftonwiedergabe wurde in einem subjektiven Hörtest untersucht und bewertet. Dabei wurde gezeigt, dass eine Bandbreitenerweiterung die Qualität der Wiedergabe bandbegrenzter räumlicher Schallfelder verbessern kann.



Richter, Daniel;
Erweiterung eines Verfahrens zur Bestimmung der Phasenkohärenz von komplexen Signalen. - 88 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2013

Die Phasenkohärenz von komplexen Signalen ist ein neuer, vielversprechender Ansatz zur Beschreibung von raumakustischen Phänomenen. Es wird angenommen, dass sie unter anderem in Verbindung mit der Entfernung einer Schallquelle zum Hörer steht. Mit ihrer Hilfe soll sich weiterhin beschreiben lassen, wie stark ein Hörer an einem bestimmten Ort im Raum seine meist unbewusste Aufmerksamkeit auf eine akustische Darbietung fokussiert. In der Literatur wird eine Verringerung der Phasenkohärenz auf eine steigende Veränderung des Signals durch gleichzeitig beim Hörer eintreffende Reflexionen zurückgeführt. In dieser Arbeit wird ein bereits bestehendes Modell zur Bestimmung der Phasenkohärenz verbessert und um ein komplexes Gehörmodell erweitert. Das Gehörmodell bildet dabei die einzelnen Verarbeitungstufen des Gehörs vom Außenohr bis zu den ersten Synapsen am Ende des Innenohrs nach. Dadurch soll sowohl der Einfluss des Gehörs auf die resultierende Phasenkohärenz, als auch die Art und Weise wie sie durch das menschliche Gehör ausgewertet werden könnte, simuliert werden. Des Weiteren wurde das anschließende Verfahren zur Bestimmung der Phasenkohärenz überarbeitet und die Leistungsfähigkeit seiner einzelnen Verarbeitungsstufen gesteigert. Ziel der Arbeit ist die Überprüfung des vermuteten Zusammenhangs zwischen der Entfernung eines Schallereignisses und der Phasenkohärenz. Es wird weiterhin der Frage nachgegangen, in wie weit auch die Position des Hörers / der Schallquelle im Raum und bei binauralem Hören die Einfallsrichtung des Schalls neben der Entfernung eine Rolle spielen. Aus den Ergebnissen geht hervor, dass neben der Entfernung auch der jeweilige Raum, das dargebotene Signal und der Schalleinfallsrichtung gewisse Einflüsse auf die Phasenkohärenz haben. Es wurde festgestellt, dass die Mediane aller für eine Entfernung ermittelten Phasenkohärenzen mit zunehmender Distanz abnehmen, die Breite der Verteilung der Werte dagegen zunimmt und das der Quelle zugewandte Ohr in der Regel höhere Phasenkohärenzen aufweist, als das der Quelle abgewandte Ohr. Vereinzelt wurden jedoch auch Abweichungen von diesen Eigenschaften festgestellt.



Wronka, Johannes;
Design und Verifikation von Soundbeispielen zur Beschreibung der Emotionsdimensionen "Valence" und "Arousal". - 38 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2013

Diese Bachelorarbeit beschreibt den Vorgang des Designs und der anschließenden Verifikation von Soundbeispielen, um diese in einem zweidimensionalen Modell mit den Achsen Valenz und Erregung abzubilden. Ziel der Arbeit ist es, 18 geeignete Beispiele zu erstellen, welche anhand der fünf Basisemotionen Freude, Angst, Wut, Ekel bzw. Ablehnung und Trauer, definiert nach Charles Darwin, klassifiziert werden können. Diese sollen danach in einem eigenen Hörtest geprüft werden. Anhand der zwei Dimensionen Valenz, Erregung, sowie der zusätzlichen dritten Dimension Dominanz, besteht die weitere Aufgabe in der grafischen Abbildung dieser Beispiele. Weiterführend soll untersucht werden, inwiefern die Manipulation dieser Sounds durch das Hinzufügen einer wahrnehmbaren Distanz eine Rolle für die emotionale Bewertung spielt und somit auch für die Abbildung im Valenz-Erregungs-Modell. Die Arbeit gliedert sich in vier Teile. Der erste behandelt die theoretischen Grundlagen und zeigt mögliche Messmethoden und Verfahren zur Evaluierung von Emotionen. Anhand dieser wird im zweiten Abschnitt die Planung, Erstellung und Durchführung des eigenen Hörtests erläutert. Den Abschluss bildet die Auswertung der ermittelten Daten sowie die anschließende Diskussion über die Ergebnisse. Es wird dargelegt, dass sich die erstellten Soundbeispiele zu weiten Teilen in den Bereichen des Valenz-Erregungs-Modells wiederfinden, die sich auch in anderen Studien ergaben. Weiterhin zeigen die Eintragungen, dass die überwiegende Mehrheit der manipulierten Sounds signifikante Änderungen bei der Bewertung von Erregung sowie Dominanz aufweisen und sich somit eine Abhängigkeit der dimensionalen Bewertung des Hörers bzgl. der wahrgenommenen Distanz ergibt.



Albrecht, Alexander;
Psychoakustisch motivierte Schallfeldzerlegung bei der Auralisation von Kugelarraydaten. - 80 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2013

Kugelmikrofonarrays erlauben eine räumliche Analyse von Schallfeldern. Die daraus gewonnen Daten können anschließend weiterverarbeitet und wiedergegeben werden, um dem Hörer den Eindruck zu vermitteln er befinde sich im gemessenen Raum. Dieser Prozess wird als Auralisation bezeichnet. Die Verarbeitung der gemessenen Daten erfolgt über rechenaufwändige Algorithmen. In diesem Zusammenhang werden alle Schritte der Arraysignalverarbeitung für die Auralisation vorgestellt. Diese Bachelorarbeit beschäftigt mit der Analyse der Raumdaten in Bezug auf psychoakustische Effekte. Basierend auf den Ergebnissen der Analyse werden mögliche Optimierungsansätze der Datenverarbeitung vorgestellt. Der Fokus liegt hierbei auf einer Optimierung im Zeitbereich, wobei das Schallfeld in einen frühen und späten Anteil zerlegt wird. Der frühe Anteil wird mit einer höheren Genauigkeit berechnet als der späte Anteil. Eine Optimierung im Frequenzbereich wird konzeptionell dargestellt. Zur Evaluierung der Optimierungsansätze werden diese mittels eines Hörtest analysiert und ausgewertet. Die Ergebnisse zeigen, dass mit dem präsentierten Ansatz eine deutliche Beschleunigung der Datenverarbeitung und Reduzierung des Speicherbedarfs erreicht werden kann.



Krieg, Fabian;
Investigation of support vector machines for rhythm pattern classification. - 129 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2013

Im Rahmen dieser Bachelorarbeit wurde untersucht, in wie weit eine Software zur Klassifikation von Musik nach ihren rhythmischen Eigenschaften durch die Nutzung von Support Vektor Maschinen ausgebaut werden kann. Dabei kam in der Referenzimplementierung ein k-Nearest-Neighbour Verfahren zum Einsatz, wobei eine Vorselektion relevanter Pattern über andere Audiomerkmale vorgenommen wurde. Für die Beschreibung der rhythmischen Eigenschaften wurden die Log-Lag-AKF sowie eine Darstellung im Zeitbereich genutzt. Zum Abgleich der Pattern kamen mehrere Ähnlichkeitsmaße auf Basis der Kreuzkorrelation zum Einsatz. Dabei wurde die Nutzung weicher Maxima eruiert, über die durch eine Summierung aller Überlagerungen eine mathematisch valide Kernfunktion definiert werden kann. Weiterhin wurde eine Kernfunktion entwickelt, die eine Begrenzung auf wenige Verschiebungen ermöglicht. Außerdem wurde untersucht, inwieweit sich über einfache synthetisierte Referenzpattern eine ausreichende Abbildung der Pattern entwickeln lässt. Die einzelnen Verfahren wurden bei Tests an zwei verschiedenen Datensätzen hinsichtlich ihrer Klassifikationsgüte sowie ihres Rechenaufwands geprüft. Dabei hat sich gezeigt, dass keines der Verfahren die Referenzimplementierung in beiden Aspekten übertreffen kann. Die Gründe hierfür werden untersucht und dargestellt.



Krüger, Stefan;
Untersuchung drahtloser Musikübertragungstechniken und Integration in einen Flachlautsprecher. - 99 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2013

Die Arbeit befasst sich mit der Untersuchung drahtloser Musikübertragungstechniken und deren prototypischer Integration in ein Flachlautsprechersystem des Fraunhofer IDMT. Es werden technische Grundlagen zu den Verfahren Bluetooth, UPnP/DLNA und AirPlay erläutert, genutzte Protokolle analysiert und verwendete Codecs betrachtet. Im Anschluss erfolgt die Entwicklung eines Demonstrator-Systems, mit dem die untersuchten Verfahren in die Schaltungselektronik des Flachlautsprechersystems integriert werden können. Die Standardschnittstelle IS, zur Übertragung digitaler Audiodaten zwischen integrierten Schaltkreisen, wird vorgestellt und zur Anbindung des Demonstrators an den Signalprozessor des Flachlautsprechers implementiert. Ein MUSHRA-Hörtest und Messungen anhand des Demonstrators liefern Aufschluss darüber, inwiefern sich die drahtlosen Musikübertragungstechniken hinsichtlich ihrer Audioqualität am Flachlautsprecher unterscheiden. Gleichzeitig wird der Vergleich zur kabelgebundenen Zuspielung angestellt. Unter Berücksichtigung weiterer, für den Einsatz im Flachlautsprecher relevanter, Faktoren wird schließlich die Empfehlung für eine der Technologien ausgesprochen. Hinwiese zur schaltungstechnischen Integration eines marktüblichen drahtlosen Audiomoduls in die Flachlautsprecherelektronik schließen die Arbeit ab.



Pabst, Kai;
Evaluierung einer binauralen Simulation einer zweikanaligen Stereo-Lautsprecherwiedergabe. - 60 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2013

Die binaurale Wiedergabe von Audiosignalen über Kopfhörer ermöglicht die gehörrichtige Abbildung auditiver Umgebungen. Diese Arbeit umfasst eine Untersuchung der gehörrichtigen Kopfhörerwiedergabe unbearbeiteter zweikanaliger Stereo-Signale durch die binaurale Simulation einer optimal positionierten zweikanaligen Lautsprecherwiedergabe für zwei auditive Umgebungen. Anhand der Messung von individuellen Raumimpulsantworten wird die binaurale Simulation über ein zweikanaliges Shaping- und Panning-Verfahren erstellt. Die halbautomatisierten MATLAB-Verfahren ermöglichen eine individuelle Anpassung. Die Evaluierung erfolgt über einen dreiteiligen Hörtest der Grundgesamtheit von 28 Nicht-Experten Hörern. Diese Arbeit untersucht Ursachen und Zusammenhänge der Distanzwahrnehmung, der Richtungswahrnehmung sowie der subjektiv wahrgenommenen Klangqualität für zweikanalige Stereo-Signale. Die Ergebnisse des Hörtests zeigen, dass über die vorgestellten Verfahren eine gezielte Veränderung des auditiven Distanzeindruckes möglich ist ohne die Lokalisationsgenauigkeit zu verringern. Die Klangqualität der zweikanaligen Stereo-Audiosignale ist hierdurch beeinträchtigt. Die binaurale gehörrichtige Simulation einer zweikanaligen Stereo-Lautsprecherwiedergabe ist mit Einschränkungen dazu geeignet, die subjektive Wahrnehmung einer auditiven Umgebung gezielt zu verändern.



Kruh-Elendt, Andre;
Untersuchungen zum Einfluss der Abtastfrequenz auf die binaurale Auralisation. - 60 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2013

Interaurale Laufzeitunterschiede (ITDs) spielen in der Schallquellenlokalisation eine große Rolle. Höhere Abtastraten bewirken eine bessere Zeitauflösung bei binauralen Aufnahmen. Da diese Zeitauflösung bei den ITDs eine Rolle spielt, könnte dadurch auch die Schallquellenlokalisation verbessert werden. Anhand eines Hörversuches wurden Veränderungen in der Wahrnehmung der Winkelauflösung und in der Bewegungswahrnehmung von Schallquellen in der Horizontalebene untersucht. Die Ergebnisse zeigen eine leichte Tendenz für die Verbesserung der Winkelauflösung im frontalen Bereich. Eindeutige, signifikante Ergebnisse, die für die Vorteilhaftigkeit von höheren Abastraten in der Binauraltechnik sprechen, konnten anhand der Untersuchungen jedoch nicht gefunden werden.



Männchen, Andreas;
Entwicklung eines echtzeitfähigen Verfahrens zur automatischen Saitenerkennung in monophonen und polyphonen Gitarrenaufnahmen. - 59 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2013

Diese Arbeit befasst sich damit, ein Verfahren zu entwickeln, dass die Saitenerkennung auf Basis von monophonen und polyphonen Gitarrenaufnahmen in Echtzeit ermöglicht. Das hier vorgestellte Gesamtsystem behandelt zwei Teilprobleme der Gitarrentranskription: die reine Transkription, bestehend aus Onset- und Tonhöhenerkennung, die in diesem Fall Mehrstimmigkeit unterstützen muss, und die Zuordnung der Töne zu den entsprechenden Saiten. Die polyphone Tonhöhenerkennung wird durch das Einbetten einer dem Stand der Technik entsprechenden Methode in ein Teilsystem zur Extraktion von Tonkandidaten aus dem Signal realisiert. Aufbauend auf den Ergebnissen dieses ersten Teilschritts werden die spektralen Positionen und Amplituden der Harmonischen der Tonkandidaten abgeleitet, die zur frameweisen Feature-Extraktion und anschließenden Klassikation mittels einer Support Vector Machine (SVM) genutzt werden. Der Klassikationsprozess beruht auf einem maschinellen Lernverfahren und wird durch die Aggregation der Klassikationsergebnisse der einzelnen Frames und einen Plausibilitätslter erweitert. Das System wurde in MATLAB implementiert und zur Umsetzung mit Echtzeitfähigkeit nach C++ portiert. Die Evaluation der Leistungsfähigkeit des präsentierten Verfahrens erfolgt in einer Reihe von Experimenten mit unterschiedlichem Fokus anhand eines manuell annotierten Datensatzes bestehend aus Aufnahmen unterschiedlicher E-Gitarren.



Schnemilich, Marcel;
Untersuchung des Einflusses der Geometrie eines Lautsprechergehäuses auf das Schwingungsverhalten eines elektrodynamischen Wandlers. - 91 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2013

In der Dissertation "Untersuchungen zum Einsatz von Flachlautsprechern an schallreflektierenden Grenzflächen" von Daniel Beer wurden drei Lautsprecher mit gleichem Innenvolumen, aber unterschiedlicher Innentiefe dieses Volumens vermessen. Entgegen der klassischen theoretischen Betrachtung von Lautsprechern, wurde dabei ein Einfluss der Form des Gehäuses auf die Resonanzfrequenz der Lautsprecher beobachtet. Je geringer die Gehäusetiefe bei dieser Untersuchung war, desto tiefer lag die Resonanzfrequenz. Anhand der Messergebnisse wurden naheliegende Vermutungen innerhalb dieser Dissertation angestellt, wie sich diese Beobachtung erklären lässt. Es konnte allerdings keine abschließende Klärung dieses Effektes vollzogen werden. Das Ziel dieser Arbeit bestand in der weiteren Untersuchung dieses beobachteten Effektes. Es sollte dabei die Abhängigkeit der Form des Lautsprechergehäuses auf das Verhalten des Lautsprechers untersucht werden. Dazu wurde die Dimensionierung des benötigten Luftvolumens über die Thiele- & Small-Parameter analysiert. Hierbei findet keine Berücksichtigung der Form des Luftvolumens statt. Es wurde vermutet, dass es in wandnahen Bereichen des Lautsprechergehäuses zu einer Herausbildung einer akustischen Grenzschicht kommt und durch diese die Herabsenkung der Resonanzfrequenz zu erklären ist. Die Berechnungen an geschlossenen Lautsprechersystemen berücksichtigen, in Folge der Vernachlässigung von Viskosität und Wärmeleitfähigkeit der Luft, keine Effekte in der akustischen Grenzschicht. Durch die Simulation von Lautsprechermodellen konnte das Entstehen einer akustischen Grenzschicht nachgewiesen werden. Auch deren Einfluss auf die Verschiebung der Resonanzfrequenz wurde herausgestellt. Die Simulation zeigte allerdings, dass bereits mit der mathematischen Beschreibung der Modelle unter Vernachlässigung von Viskosität und Wärmeleitung der Luft, eine Verschiebung der Resonanzfrequenz zu erklären ist. Hierzu wurde unter anderem eine Eigenfrequenzanalyse eines Modells durchgeführt. Es lässt sich ein Zusammenhang zwischen der Schallschnelle im Gehäuse und der Resonanzfrequenz des Systems erschließen. Da bei einer Kugelschallwelle die Schnelle einen Blindanteil besitzt und dieser die mitschwingende Mediumsmasse charakterisiert, legt dies den Verdacht nahe, dass die Verschiebung der Resonanzfrequenz im Zusammenhang mit dieser Masse steht. Durch diese Relation kann die Verschiebung der Resonanzfrequenz bei den unterschiedlichen Lautsprechergehäusen mit unterschiedlicher Form, aber gleichem Volumen erklärt werden. Weiterhin konnte gezeigt werden, dass sich bei einer zusätzlichen Variation des Lautsprechergehäuses eine weitere Herabsenkung der Resonanzfrequenz vollzieht. Ist das Luftvolumen nicht nur besonders flach, sondern zusätzlich auch besonders lang, wurde nahezu eine Halbierung der Resonanzfrequenz in der Simulationssoftware festgestellt. Diese weitere Verschiebung konnte mit einer realen Messung an einem gebauten Lautsprecher nachgewiesen werden.



Trier, Oliver;
Distanzabbildung in Binauralsystemen. - 47 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2013

Realistisch wirkende virtuelle Umgebungen werden sowohl in der Industrie, als auch in der Forschung immer wichtiger, um verschiedenste Szenarien visuell als auch akustisch naturgetreu simulieren zu können. Um die akustische räumliche Wahrnehmung zu realisieren, bietet sich dafür die binaurale Kopfhörerwiedergabe an. Für eine virtuelle räumliche Darstellung scheint die genaue Wahrnehmung der Schallquellendistanz von Bedeutung zu sein. Dahingehend wird in dieser Arbeit eine Kunstkopfmessung durchgeführt, in der die Ü bertragungsfunktionen von 0 bis 180 in fein abgestuften Distanzen im Nahfeld gemessen werden, um entstandene binaurale Raumimpulsantworten hinsichtlich verschiedener Distanzmerkmale genauer zu untersuchen. Als Ergebnis zeigt sich, dass insbesondere im Nahfeld die verschiedenen Distanzmerkmale unterschiedlich stark ausgeprägt sind. Eine präzise Parametrisierung von Distanzeigenschaften könnte somit eine wichtige Rolle für das menschliche Entfernungshören spielen, da kleine Distanzänderungen von wenigen Zentimetern die Übertragungsfunktionen, aufgrund von Abschattungs- und Beugungseffekten an Torso, Kopf und Ohrmuschel, stark beeinflussen.



Meißner, Henri;
Vergleich unterschiedlicher Fokussierungsverfahren mit Lautsprecheranordnungen im Mittel-/Hochtonbereich. - 69 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2013

Räumliche Audiowiedergabeverfahren wie die Wellenfeldsynthese oder das Beamforming ermöglichen die Erzeugung von fokussierten Schallquellen zwischen Lautsprecheranordnung und Hörer. Da das erzeugte Schallfeld dem einer realen Schallquelle sehr ähnlich ist, kann akustische Nähe mit fokussierten Schallquellen erreicht werden. Die verwendeten Wiedergabeverfahren sind aber zumeist mit einer großen Lautsprecheranzahl und dementsprechenden Abmessungen verbunden. Es gilt zu untersuchen, ob Aufwand (Qualität und Anzahl der Lautsprecher) und Abmessungen (Größe und Abstand der Lautsprecher) der Wiedergabeverfahren reduziert werden können, wenn diese ausschließlich fokussierte Schallquellen für eine einzelne Person erzeugen sollen. Es wird ein Versuchsaufbau vorgestellt, der es gestattet, die Auswirkung der Reduzierung fokussierender Verfahren auf die menschliche Wahrnehmung von akustischer Nähe zu untersuchen. Der Versuchsaufbau besteht aus einem modularen Lautsprecherarray und einer Algorithmenberechnung in Matlab und erlaubt die Variierung von Anzahl und Abstand der Lautsprecher sowie der Berechnung der Ansteuerungsfunktionen. In einem Hörtest werden der akustische Näheeindruck dieser Faktoren von 17 Probanden relativ zu einer realen Schallquelle auf Lautsprecherebene bewertet. Die Ergebnisse werden durch Messungen der interauralen Pegeldifferenz mithilfe eines Kunstkopfes ergänzt und mit ähnlichen Untersuchungen aus der Literatur verglichen.



Goecke, David;
Erstellung und psychoakustische Bewertung verschiedener Presets für ein räumliches Klangeffektgerät. - 42 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2013

Der Einsatz von Effekten für die Stereo-Soundwiedergabe von Audiosignalen ist bereits gängige Praxis geworden. Diese Arbeit beschreibt Voruntersuchungen, die als Basis für die Entwicklung eines 3D-Klangeffektgerätes dienen. Eine Anwendung ist für verschiedene Wiedergabeverfahren denkbar. Hier werden Untersuchungen für die Wellenfeldsynthese und das SpatialSound Wave des Fraunhofer IDMT durchgeführt. Beide Methoden ermöglichen die akustische Darstellung von Audiosignalen als virtuelle Schallquellen mit real wirkender Raumakustik und mit kreativ erzeugten Effekten. Mithilfe psychoakustischer Bewertungen neuer Effekte, mit denen das Potenzial eines 3D-Klangeffektgerätes analysiert werden kann, wird eine erste Konzeptidee eines 3D-Klangeffektgerätes erarbeitet, und wichtige Eigenschaften vorgestellt.



Rueppel, Anna;
Interaktives Audio-Display: theoretische und praktische Aspekte. - 52 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2012

Die Möglichkeit Informationen akustisch über ein auditives Display darzustellen ist ein vielseitiges Mittel der Informationsdarstellung und -verarbeitung. Klängen wird eine festgelegte Bedeutung oder Funktion zugeordnet und kann die visuelle Informationsverarbeitung ergänzen oder ersetzen. Die Interaktion mit Klängen bietet die Möglichkeit Informationen zu manipulieren und dessen Verständnis zu steigern. Werden Klänge oder Geräusche in einem räumlichen Umfeld wiedergegeben, sind zusätzliche Aspekte der Lokalisation von Bedeutung. Die Bestimmung der Herkunftsrichtung akustischer Ereignisse ist hauptsächlich von den Klangeigenschaften abhängig. Im Rahmen dieser Arbeit wurde eine Beispielimplementierung in der Form eines räumlichen auditiven Spiels erstellt um, die Interaktion mit unterschiedlichen Klängen zu untersuchen. Da das Spiel für eine große Lautsprecherwand entwickelt wurde, spielen weiterhin die Unterscheidung, sowie die vertikale und horizontale Lokalisation mehrerer zeitgleicher Schallquellen eine wichtige Rolle. Die Auswahl geeigneter Klänge und Verbesserung der Spieleigenschaften wurde mithilfe eines Probandentests durchgeführt.



Zabel, Anett;
Vergleich von Hörtestmethodiken zur Beurteilung der räumlichen Wahrnehmung bei binauraler Kopfhörerwiedergabe. - 70 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2012

In dieser Arbeit werden drei Hörtestmethoden auf ihre Eignung zur Untersuchung der räumlichen Wahrnehmung bei binauraler Wiedergabe untersucht. Als quantitative Methoden werden dabei eine Zeiger- und die Herstellungsmethode, als qualitative Methode die Repertory - Grid - Methode verwendet. Eine besondere Analyse und Protokollierung findet dabei über die Anwendung letzterer statt. Die daraus gewonnenen Erkenntnisse sollen als Anwendungs- und Hilfestellungsrichtlinien für weitere Untersuchungen dienen. Neben dem Vergleich der Hörtestmethoden findet eine Zusammenstellung von Parametern und deren Einfluss auf die räumliche Wiedergabe statt. Die Ergebnisse dieser Arbeit zeigen, dass die quantitativen Methoden schnell und vergleichsweise präzise messen, wohingegen die qualitative Methode die umfangreichsten Ergebnisse liefert. Ein weiteres Ergebnis ist, dass die wichtigsten Parameter für die räumliche Wahrnehmung bei binauraler Wiedergabe die Externalität, Natürlichkeit und das Zusammenspiel von Content und Klanggestaltung sind.



Bönsel, Carsten;
Entwicklung eines Videoanalyseverfahrens zur automatischen Erkennung der Handposition der Greifhand in Gitarrenaufnahmen. - 110 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2012

Die vorliegende Bachelorarbeit befasst sich mit der Detektion der Greifhandposition aus einzelnen Videoframes in Gitarrenaufnahmen. Neben den Ergebnissen einer Grundlagenrecherche und der Beleuchtung verwandter Forschungsarbeiten aus dem Bereich der multimodalen Musiktranskription wird ein neuer Ansatz vorgestellt, der über ein mehrstufiges Videoanalyseverfahen die Bundlage berechnet. Diese wird nach beendeter Analyse über den Zeitverlauf des Musikstücks ausgegeben. Der ermittelte Parameter kann als Vektor gelesen und im Rahmen des Information Retrievals weiter verwertet werden. Darüber hinaus liegt der Arbeit eine Sammlung von Teststücken unterschiedlicher Spieltechniken, Stilistiken und Genres, sowie entsprechende Videoaufnahmen bei, welche eigens zu Evaluationszwecken erstellt wurden. Alle Noten stehen in verschiedenen, zum Teil offenen Formaten zur Verfügung. Das hier entwickelte Verfahren erreichte in praktischen Tests eine je nach Analysematerial schwankend hohe Erkennungsrate größer 70%. Anhand der gewonnenen Ergebnisse kann der Einsatz visueller Analyse zu Zwecken der Fehlerkorrektur und der Eliminierung von musikalischen Mehrdeutigkeiten in der automatischen Musiktranskription empfohlen werden.



Kuhnke, Felix Konstantin;
Entwicklung eines echtzeitfähigen Time-Stretching Algorithmus unter Einbeziehung von transkriptionsbasierten Metadaten. - 46 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2012

Diese Arbeit ist Teil des Forschungsprojekts "Songs2See - Musikvisualisierung und Musiksuche für interaktive Anwendungen anhand transkriptionsbasierter Analyseverfahren", welches derzeit am Fraunhofer Institut für Digitale Medientechnologie erforscht wird. Ziel dieser Arbeit ist die Entwicklung eines echtzeitfähigen Time-Stretching und Pitch-Shifting Algorithmus für Musiksignale unter Einbeziehung von transkriptionsbasierten Metadaten. Der Algorithmus soll abschließend als Teil einer Anwendung der Adobe Flash-Plattform implementiert werden. Neben der Auswahl und Implementierung eines geeigneten Algorithmus beschäftigt sich die Arbeit mit der Verwendung von transkriptionsbasierten Metadaten. Dazu wurde analysiert, in welcher Form diese zur Verbesserung des Algorithmus eingesetzt werden können. Ergebnis der Arbeit ist die Auswahl und Implementierung des Phase Vocoder Algorithmus. Zusätzlich wurde eine Möglichkeit zur Nutzung von transkriptionsbasierten Metadaten in Form von Notenanschlägen zur Verbesserung der Audioqualität entwickelt. Der anschließende Hörtest zeigte, dass die Einbeziehung der Metadaten die Audioqualität in den meisten Fällen verbessern kann.



Sammer, Sven;
Untersuchungen zu Probanden-Auswahlverfahren für auditive Qualitätsuntersuchungen. - 106 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2012

Die Probandenauswahl spielt im Rahmen von auditiven Qualitätsuntersuchungen eine wesentliche Rolle, um Testergebnisse zu erhalten, mit welchen Aussagen über die zu analysierende Zielstellung getroffen werden können. Die für diese Thematik notwendigen Grundlagen und Definitionen zur Schallwahrnehmung sowie eine Analyse der bereits bekannten Methoden zu Lokalisationsuntersuchungen werden erläutert und gegeneinander abgewägt. Weiterhin wird der Aufbau des konzipierten Probandenauswahlverfahrens beschrieben und dessen Wirksamkeit anhand der Durchführung getestet. Da bei bisherigen auditiven Untersuchungen meist nur einfache Hörtests zur Untersuchung der Eignung der Probanden stattfinden ist das Ziel im Rahmen dieser Arbeit mittels einer Kombination aus webbasiertem Fragebogen, Audiogramm und Lokalisationstest auf Basis der Plantechnik eine geeignete Auswahl an Testpersonen zu erhalten, die der definierten Zielstellung entsprechen. Dabei sollen vor allem die auditiven Fähigkeiten der Versuchspersonen im Zusammenhang mit der Lokalisation des akustischen Schallereignisses und Externalisierung bei der binauralen Kopfhörerwiedergabe überprüft werden. Als Resultat werden Vorschläge bzw. Empfehlungen für die Anwendung der ausgewählten Auswahlverfahren für Studien zur auditiven Qualitätswahrnehmung aufgestellt.



Hellmich, Mathias;
Erstellung einer Datenbank von kopfbezogenen Impulsantworten. - Online-Ressource (PDF-Datei: V, 46 S., 6,64 MB) : Ilmenau, Techn. Univ., Bachelorarbeit, 2012
Enth. außerdem: Thesen

Dreidimensionale Wiedergabe von Bild und Ton sind derzeit einige der wichtigsten Forschungsfelder für die Medienwiedergabe. Um eine binaurale Tonwiedergabe, mit der ein dreidimensionales Tonerlebnis erzeugt wird, ermöglichen zu können, werden kopfbezogene Übertragungsfunktionen eines Kunstkopfes aufgenommen und in einer Datenbank gespeichert. Diese Funktionen beschreiben sehr präzise die Richtungsmerkmale von Schallquellen anhand von nur zwei Wiedergabequellen. Die Wiedergabe findet dabei über Kopfhörer statt. Da diese Übertragungsfunktionen stark von individuellen Hörern abhängig sind, konnte noch keine kommerzielle Verwendung gefunden werden. Diese Arbeit beinhaltet die Grundlagen, auf denen die binaurale Wiedergabe basiert. Sie befasst sich mit binauralen Merkmalen sowohl im allgemeinen als auch speziell bei kopfbezogenen Übertragungsfunktionen. Ebenso werden verschiedene Mikrofonierungsverfahren angesprochen. Es wird eine Datenbank von kopfbezogenen Übertragungsfunktionen anhand eines Kunstkopfes aufgenommen. Die Durchführung des Vorhabens wurde mitsamt dem Aufbau und den auftretenden Problemen erläutert. Das Endergebnis dieser Arbeit ist eine umfangreiche und möglichst genaue Datenbank aus kopfbezogenen Übertragungsfunktionen für die horizontale Ebene. Vergleiche zu Messungen mit Probanden wurden durchgeführt und analysiert, um eine Grundlage für die effektive Erstellung einer individualisierten Datenbank zu liefern. Die entstandene Datenbank soll später sinnvoll zu weiteren Forschungszwecken eingesetzt werden können.



http://www.db-thueringen.de/servlets/DocumentServlet?id=20448
Winges, Manuel;
Untersuchung und Visualisierung von Rhythmus- und Samplingplagiaten in Musik. - 64 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2012

Die Gruppe Semantische Musik Technologien am Fraunhofer Institut für Digitale Medientechnologie beschäftigt sich mit Methoden zur automatischen Analyse von Musik. In der Vergangenheit wurden unter anderem Verfahren zur Bestimmung von Ähnlichkeiten zwischen Musikstücken und Algorithmen zur Transkription der Hauptmelodie und Rhythmusspur entwickelt. Ziel der Arbeit ist es, zwei gegebene Musikausschnitte auf den Verdacht des Plagiarismus zu untersuchen. Dabei sollen Ähnlichkeiten im Rhythmus, sowohl Wiederverwendung von Originalaufnahmen (Sampling) erkannt werden. Rhythmusplagiate beinhalten sowohl Ähnlichkeiten im Zeitverlauf der Rhythmuskomponenten als auch Klangfarbenähnlichkeiten. In der Tonhöhe oder Geschwindigkeit manipulierte Rhythmusinstrumente und Samples werden ebenfalls identifiziert. Für die Bestimmung rhythmischer Ähnlichkeit werden die Musikausschnitte mittels Nicht-negativer Matrix-Faktorisierung (NMF) in rhythmische Basisvektoren zerlegt. Zeitlich korrelierende Vektoren werden dabei gruppiert und zu Instrumenten rekonstruiert. Die separierten Quellen werden über Korrelationsansätze miteinander verglichen. Für die Samplingdetektion werden die Segmente ebenfalls mittels NMF zerlegt und das Auftreten ähnlicher Klänge verglichen. Die Algorithmen werden in ein bereits existierendes Framework integriert und visuell dargestellt.



Seideneck, Mario;
Entwicklung einer Testumgebung für personalisierbare mobile Rundfunkdienste. - 64 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2011

Diese Bachelorarbeit beschäftigt sich mit der Entwicklung einer Testumgebung für personalisierbare mobile Rundfunkdienste. Im Rahmen dieser Arbeit findet eine Analyse mobiler Endgeräte sowie ihrer Besonderheiten statt und es wird ein Überblick über existierende Übertragungsverfahren gegeben, die speziell auf die Erfordernisse dieser Gerätetypen zugeschnitten sind. Des Weiteren werden verschiedene Forschungsprojekte zu ähnlichen Themen untersucht und dort verwendete Komponenten analysiert. - Basierend auf DVB-H (Digital Video Broadcasting for Handhelds) wird ein Gesamtkonzept zur Übertragung audiovisueller Inhalte, Daten und interaktiver Dienste entworfen, das die spezischen Systemanforderungen konkretisiert sowie die Zusammenstellung und Aufgaben einzelner Tools definiert. - Bei der Umsetzung der Konzeption wird auf frei verfügbare existierende Programme zurckgegriffen und durch Modizierung für eigene Szenarien nutzbar gemacht. Unter Verwendung von verschiedenen Endgeräten entsteht ein erweiterbares Ende-zu-Ende-System, dessen Setup und Möglichkeiten verdeutlicht werden. - Innerhalb der Ergebnisse werden die Funktionstüchtigkeit des Testsystems und mögliche Einsatzgebiete dargestellt sowie Möglichkeiten weiterführender Arbeiten aufgezeigt.



Klengel, Daniel;
Entwicklung eines Systems zur automatisierten Erkennung von Fehlern und Qualitätsproblemen in A/V-Material. - 80 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2011

In Rundfunk- und Archivsystemen fallen täglich dutzende Stunden Audio- und Videomaterial an. Diese Daten durchlaufen grundsätzlich von der Produktion über Ingest, Schnitt, Postproduktion und Distribution zahlreiche Verarbeitungsstufen, welche in der Regel durch Transfer- und Transkodierprozesse miteinander verknüpft sind. Jeder dieser Bearbeitungsschritte führt dabei neue potentielle Fehlerquellen ein. Es besteht daher im Allgemeinen die Notwendigkeit, Material einer technischen Abnahme zu unterziehen, um etwaige Probleme möglichst frühzeitig in der Kette erkennen und beheben zu können. In der Praxis werden diese Tätigkeiten derzeit noch zu einem großen Teil von menschlichen Gutachtern ausgeführt, was jedoch zeitaufwändig und fehleranfällig ist. Im Rahmen der vorliegenden Arbeit werden die Anforderungen an automatisierte Systeme zur Qualitätsüberwachung im Broadcastbereich analysiert und der aktuelle Stand der Technik dargestellt. Basierend auf dem am IDMT entwickelten Signalanalyse-Framework "Broadcast Error Monitoring" wird im weiteren Verlauf schwerpunktmäßig die Möglichkeit der Performanceverbesserung hin zu Echtzeitfähigkeit untersucht. Hierfür werden die Detektionsmodule Blocking-, Blur- und Ringing-Detection mithilfe der CUDA-Technologie implementiert und über ein Interface angebunden. Anschließend werden die erzielten Verbesserungen evaluiert.



Krawetzke, Martin;
Bewegungskompensierte Tiefenanalyse. - 62 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2011

Die vorliegende Arbeit beschäftigt sich mit der Verbesserung von Tiefenkarten im Bereich der Stereoanalyse. In Videokonferenzsystemen wird die Kamera typischerweise so positioniert, dass kein direkter Augenkontakt zwischen den Teilnehmern möglich ist. Mit Hilfe der Tiefenkarten kann eine virtuelle Blickrichtungskorrektur in solch einem Videokonferenzsystem ermöglicht werden. Hierfür werden Tiefeninformationen aus den vorhandenen Stereoaufnahmen extrahiert. Diese Informationen tragen zur Erstellung virtueller Ansichten des Nutzers bei. Da die Tiefenkarten fehlerbehaftet sind, wirkt das synthetisierte Material oft unnatürlich. Für eine Verbesserung ergibt sich die Möglichkeit, Wissen auch aus anderen Bereichen der Bildverarbeitung in die Stereonanalyse einzubeziehen. Es werden gängige Methoden der Bewegungskompensation vorgestellt und implementiert. Die Implementierung erfolgt als Unterstützung der Stereoanalyse während der Tiefenkartenberechnung und als Nachfilterung der erstellten Tiefenkarten. Für die Bewegungsberechnung werden Block-Struktur-Algorithmen ähnlich der Nutzung in Videokodern und die klassische Horn-Schunck-Methode der optischen Flussbestimmung implementiert. Anhand vorhandener und speziell erstellter Testsets wird die Robustheit und Wirkung der erstellten Algorithmen analysiert.



Hadam, Ann-Christine;
Konzeptionelle Integration des PATTI-Demonstrators in die Prozesse eines Informationssystems für adaptives Assessment. - 72 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2011

Assessment wird in heutigen E-Learning-Systemen immer gefragter. Des Weiteren steht Personalisierung an oberster Stelle, wenn es um Weiterentwicklungen im E-Learning-Bereich geht. Beide Konzepte werden am Fraunhofer IDMT im adaptiven Assessment-System askme! vereint und miteinander kombiniert. Das entwickelte System strebt neben der Personalisierung des Assessment-Prozesses auch die Möglichkeit der Integration von simulativen Werkzeugen an. Simulationen haben gegenüber anderen multimedialen Applikationen, wie Animationen und Grafiken, den Vorteil, dass sie die kognitiven Lernziele höherer Ordnung nach der Bloom'schen Taxonomie ansprechen können. Die Taxonomie teilt die Lernziele in die Bereiche Wissen, Verständnis, Anwendung, Analyse, Synthese und Evaluation ein. Simulationen können diese Ziele vor allem deshalb erfüllen, weil mit ihnen die Hypothesenbildung und deren Test besonders einfach sind. Diese Bachelorarbeit beschäftigt sich daher mit der konzeptionellen Integration einer Simulation in das adaptive Assessment-System askme!. Diese Simulation ist die Demonstrationssoftware PATTI, die am Institut für Medientechnik der TU Ilmenau entstand und Effekte der Psychoakustik zeigt. Zur Konzeption werden die Potenziale beider Programme bei der gemeinsamen Anwendung im Assessment vorgestellt und in Verbindung zueinander gebracht. Daraus entwickelt sich ein Szenario, das eine Möglichkeit aufzeigt, wie die Integration in der Praxis umgesetzt werden kann. Dieses Szenario beinhaltet die Erstellung eines vereinfachten Domänen- und Lerner-Modells sowie die Erarbeitung von Beispielfragen für das durchzuführende Assessment. Darauf aufbauend wurde ein Konzept entworfen, das die auszutauschenden Informationen vorstellt und Empfehlungen zur Integrationsumsetzung bietet. Dieses Konzept bildet dann die Grundlage für die spätere Implementierung.



Räth, Hans-Jürgen;
Entwicklung einer automatisierten Testumgebung für Geräte der Unterhaltungselektronik. - 54 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2011

In dieser Arbeit wurde eine Testumgebung für Geräte der Unterhaltungselektronik entwickelt und umgesetzt. Die Arbeit beschreibt ausgehend vom Stand der Technik, in welcher Form Befehle an das Gerät gesendet werden und geht darauf ein, wie diese Befehle erzeugt und übermittelt werden. Es wird die Entwicklung eines IR-Sendemoduls und dessen Ansteuerung sowie der Protokollierung der gesendeten Befehle beschrieben. Bei der Prüfung, ob übliche Fernbedienungssysteme so zu adaptieren sind, dass sie im Rahmen der Testumgebung zur Ansteuerung der Testgeräte verwendet werden können, zeigte sich, dass die Adaptionen sehr aufwändig wären. Dieser Aufwand steht in keinem Verhältnis zum gewünschten Ergebnis. Es wurde eine Mikrocontroller-Plattform gesucht, die die Generierung und Aussendung von IR-Befehlen übernehmen kann. Aufgrund der kompletten Vorkonfiguration und der einfachen Programmierbarkeit fiel die Entscheidung auf die Arduino-Plattform. Der einfache Aufbau der Plattform ermöglicht den direkten Anschluss der Infrarot-LED, mit der die Signale ausgesendet werden. Das Sendemodul erhält vom angeschlossenen Computer lediglich die zu sendende Bitfolge und Informationen über das zu verwendende Übertragungsprotokoll. Mit der zum Arduino gehörenden Programmiersprache "Wiring" wurde ein Programm geschrieben, das diese eingehenden Informationen verarbeitet und die IR-LED aktiviert. Das Sendemodul erhält seine Steuerinformationen durch eine Java-Anwendung, die auf dem angeschlossenen PC läuft. Da für zur Wiederverwendbarkeit diese Informationen speicherbar sein sollen, wurde eine einfache XML-Struktur geschaffen, die die Speicherung in einfachen Textdateien zulässt. Die Java-Anwendung protokolliert die gesendeten Befehle mit Hilfe einer MySQL-Datenbank, die aus zwei Tabellen besteht. Zur späteren manuellen Prüfung der Ausführung eines gesendeten Befehls muss Ablauf der Testsequenz videoüberwacht und aufgezeichnet werden.



Fiedler, Paul;
Schallfeldanalyse und Anpassung eines Übersprechkompensationsfilters für binaurale Wiedergabe. - 79 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2011

Mittels binauralen Wiedergabesystemen ist es möglich, naturgetreue Richtungseindrücke von Schallereignissen beim Zuhörer hervorzurufen, obwohl dieser nur über zwei Schallquellen für die Wiedergabe verfügt. Die meisten binauralen Wiedergabesysteme wurden in der Vergangenheit über Kopfhörer realisiert, da bei diesen die Kanaltrennung bis zum Empfänger, dem menschlichen Ohr, problemlos aufrecht zu erhalten ist. Grenzen dieser Technik werden jedoch durch Phänomene wie die Im-Kopf-Lokalisation oder die Vorne-Hinten-Vertauschung deutlich. Im Rahmen dieser Arbeit wurde eine binaurale Wiedergabe mittels zwei Lautsprechern in Stereoanordnung untersucht. Bei der normalen Stereowiedergabe sprechen Signalanteile vom linken Lautsprecher auf das rechte Ohr über und umgekehrt. Bei der binauralen Wiedergabe über Lautsprecher in Stereoanordnung ist dieses Übersprechen jedoch unerwünscht und muss durch einen Algorithmus kompensiert werden, da ansonsten der räumliche Höreindruck verloren geht. Analysiert wurde ein implementiertes Verfahren zur Übersprechkompensation, zusätzlich wurden Einflüsse des Mess- und Abhörraums kompensiert. Ziel der Untersuchungen dieser Arbeit war es, die unmittelbare Umgebung der Ohren des Zuhörers in Bezug auf die Übersprechkompensation zu analysieren. Für die Simulation eines Zuhörers wurde ein Kunstkopf im erzeugten Schallfeld platziert. Weiterhin wurde dabei von einem statischen System ausgegangen, d.h. Stereoanordnung, Hörerposition sowie Ausrichtung des Zuhörers blieben während der Messungen konstant. Einen Großteil der vorbereitenden Maßnahmen der Untersuchungen stellte dabei die Entwicklung einer geeigneten Messvorrichtung dar. Diese ermöglichte es, Messpunkte in der Umgebung der Ohren des Kunstkopfes präzise, stabil und rekonstruierbar anzufahren. Die Messungen selbst sowie deren Analyse stellte den zweiten großen und wichtigen Teil dieser Arbeit dar. Auch die computergestützte Simulation des Anwendungsfalles wurde eingehend beleuchtet.



Schneemann, Friederike;
Gesichtsdetektion zur Verbesserung von Tiefenkarten. - 81 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2011

Diese Arbeit befasst sich mit der Entwicklung eines Gesichtsdetektionsverfahrens zur Verbesserung von Tiefenkarten für Videokommunikationsanwendungen. Der Aufbau eines Videokommunikationssystems führt typischerweise dazu, dass der für die menschliche Kommunikation enorm wichtige Blickkontakt nicht zustande kommt. Das Setzen einer virtuellen Kamera entgegen der Blickrichtung der kommunizierenden Person kann dieses Problem lösen. Hierzu ist eine dreidimensionale Repräsentation des Nutzers nötig. Diese kann über extrahierte Tiefeninformationen der abgebildeten Szene erzeugt werden. Die zum Beispiel mit Hilfe eines Stereo-Kamera-Systems ermittelten Tiefeninformationen sind jedoch häufig fehlerbehaftet, was zu einem unnatürlich wirkenden 3D-Modell der kommunizierenden Person führt. Zur Verbesserung der Tiefenextraktion können Zusatzinformationen über die Szenenstruktur verwendet werden. Im Bereich der Videokommunikation bietet es sich an, Gesichtsdetektoren einzusetzen und die damit gewonnenen Informationen in der Tiefenanalyse zu nutzen. Diese Arbeit gibt einen ausführlichen Überblick über bestehende Verfahren zur Detektion von Gesichtern und analysiert diese hinsichtlich ihrer Eignung für 3D-Videokommunikation. Auf Hautfarbensegmentierung basierende Verfahren werden als gut geeignet bewertet und deshalb detailliert vorgestellt. Ein, mit einem personalisierten Hautmodell arbeitendes Verfahren wird zur Detektion des Gesichtsbereichs implementiert. Um Gesichtsmerkmale wie die Augen und den Mund zu finden, wird der gefundene Gesichtsbereich auf seine Farb- und Symmetrieeigenschaft untersucht. Über Modellwissen wird eine, die Gesichtsgrenzen beschreibende Ellipse ermittelt. Mit einer handelsüblichen Webcam selbst aufgenommenes Bildmaterial, sowie einer Bilddatenbank entnommenes Material dient exemplarisch der Evaluation des neu entwickelten Verfahrens. Abschließend werden die Ergebnisse diskutiert und Verbesserungsmöglichkeiten vorgestellt.



Zahn, Alexandra;
Detektion und Analyse von Bewegung in Filmszenen. - 80 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2011

Die vorliegende Bachelorarbeit beschreibt die Entwicklung eines Systems zur Detektion und Klassifizierung von Bewegungen in Filmsequenzen. Dabei werden globale und lokale Bewegungskomponenten geschätzt und entsprechend differenziert. Zur Klassifizierung von Bewegungen globaler Art kommen Merkmale zum Einsatz, die mithilfe des optischen Flusses zuvor extrahiert und den Eigenschaften charakteristischer Strömungsfelder in einer Gegenüberstellung zugewiesen werden konnten. Die Richtungsschätzung erfolgt mit Bestimmung des Zentrums einer aufnahmebedingten Bewegung und gibt Aufschluss darüber, ob und wie oft sich die Kamera innerhalb eines Filmshots entlang oder um die optische Achse gedreht anderenfalls in horizontale oder vertikale Richtung bewegt hat. Resultierende Zeitintervalle werden im Verlauf auf ihre Art als translatorische oder rotatorische Bewegungsphase hin untersucht. Ausgewählte statistische Verfahren zur Eliminierung von Ausreißern verbessern die Ergebnisse und erhöhen die Robustheit gegenüber Bildstörungen oder veränderten Beleuchtungssituationen. Um die Bewegungserfassung auf die lokale Ebene zu erweitern, wird die zuvor registrierte globale Bewegung mittels affiner Transformation jeweils frameweise kompensiert. Auf diese Weise lassen sich Bewegungen lokaler Art anhand ihrer Positionsänderungen relativ zum unbewegten Hintergrund auch unter dem Umstand einer bewegten Kamera detektieren. Die anschließende Verfolgung sich bewegender Objekte unter Verwendung des CamShift-Algorithmus ermöglicht Aussagen über mittlere Bewegungsgeschwindigkeit, deren Richtung und die Größe bewegter Bildbereiche.



Mahr, Johannes;
Konzeption und prototypische Entwicklung eines kompakten 2-Wege Audioverstärkers zum Einsatz im Gehäuse eines Flachlautsprechers. - 75 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2010

Eine unauffällige und platzsparende Integration von Audiowiedergabesystemen in Räumen mit Hilfe von Flachlautsprechern war bisher kaum oder nur mit inakzeptablen klanglichen Einbußen möglich. Zur Lösung dieses Problems wurden am Fraunhofer-Institut für Digitale Medientechnologie (IDMT) in Ilmenau Flachlautsprecher mit einer Tiefe von 2,4cm entwickelt, die eine Wiedergabe des Frequenzbereichs von 100Hz bis 20kHz bei einem Schalldruckpegel von 94dB ermöglichen. Anders als bisherige Flachlautsprechertechnologien ermöglichen diese einen Einsatz direkt an der Wand des Hörraumes zur Wiedergabe mit hoher Klangqualität. Bisher wurden diese Flachlautsprecher mit externen Controllern und Verstärkern betrieben. Wichtige Schritte zur Weiterentwicklung der Flachlautsprecher sind die Entwicklung eines effizienten Audioverstärkers sowie eines Filternetzwerks, das Hoch- und Tieftonsignal trennt sowie den Amplitudenfrequenzgang bei tiefen Frequenzen anhebt. Damit sollen die externen Controller und Verstärker ersetzbar sein. Beide sollen in das Flachlautsprechergehäuse integriert werden und dürfen daher eine Bauhöhe von 12mm nicht überschreiten. In dieser Arbeit wurden prototypisch eine Audioverstärker-Schaltung und eine Frequenzweiche entwickelt, die den Anforderungen an einen Einsatz in dem Gehäuse eines 2-Wege Flachlautsprechers genügen. Hierfür wurde zunächst der Markt für integrierte Audioverstärker sowie aktive und passive elektrische Bauelemente zur Realisierung von Audiofilterschaltungen analysiert. Die aktuell verfügbaren Verstärkertechnologien sowie mögliche Filterarten für Frequenzweichen wurden verglichen. Insbesondere auf die aktuell immer mehr an Bedeutung gewinnende Klasse-D Audio-Verstärkertechnik wurde detailliert eingegangen. Auf der Basis dieser Recherchen wurde ein Klasse-D Verstärker und eine analoge aktive Filterschaltung realisiert. Die Schaltung ist inklusive ausreichender Kühlvorrichtungen und bei sehr geringem Volumenbedarf in die Flachlautsprecherbox integrierbar. Im Vergleich zu alternativen Umsetzungsmöglichkeiten, wie z.B. der Verwendung einer digitalen oder passiven Frequenzweiche, ist die entwickelte Platine zudem sehr kostengünstig. - Das Ergebnis dieser Arbeit ist seit Juni 2010 im Ausstellungs-Truck der Fraunhofer-Gesellschaft, sowie in mehreren Flachlautsprechern zu Ausstellungszwecken im Einsatz.



Krasser, Johannes;
Automatische Detektion von Spielfehlern in Aufnahmen von polyphonen Instrumenten. - 61 S. : Ilmenau, Techn. Univ., Bachelor-Arbeit, 2010

In der Abteilung Metadaten des Fraunhofer Instituts für Digitale Medientechnologie in Ilmenau wird an innovativen Technologien für das Information Retrieval aus audio-visuellen Daten, insbesondere aus Musik geforscht. Das Ziel dieser Arbeit ist die Entwicklung eines Programms zur automatischen Detektion von Spielfehlern in Aufnahmen polyphoner Instrumente. Das polyphone Instrument wird von einem Musikschüler gespielt und dabei aufgezeichnet. Für jedes Musikstück existiert zusätzlich eine Referenz in symbolischer Form, z.B. als MIDI-Datei. Im Rahmen dieser Arbeit werden Verfahren zur Detektion von Fehlern implementiert und untersucht. Zunächst werden dazu Ansätze verfolgt, welche auf Chromagrammen basieren. Es wird gezeigt, dass damit die Erkennung von Abschnitten, die Spielfehler enthalten, mit ausreichend geringer Falsch-Positiv-Rate möglich ist. Anschließend sollen mögliche erkannte Fehler genauer aufgeschlüsselt werden. Dafür werden aktuelle Algorithmen zur Multi-Pitch-Estimation vorgestellt und implementiert. Für eine spätere Evaluation wird ein kleiner, aber repräsentativer Testdatensatz erstellt. Anschließend wird das Programm mit diesem Datensatz getestet.



Sass, Rebecca;
Vergleich des Einflusses kopfbezogener Übertragungsfunktionen auf die Ausprägung binauraler Merkmale bei Verwendung unterschiedlicher Aufnahmeverfahren. - 61 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2010

Kopfbezogene Übertragungsfunktionen beschreiben die Veränderung, die eine Schallwelle auf dem Weg von der Quelle zu den Trommelfellen einer Person durch Beugung, Reflexion und Abschattung am Körper erfährt. In ihnen sind räumliche Informationen über ein Schallereignis kodiert, die das menschliche Gehirn zu einem dreidimensionalen Höreindruck verarbeiten kann. Mit Hilfe der kopfbezogenen Übertragungsfunktionen lässt sich die binaurale Wiedergabe realisieren, die ein räumliches Hörerlebnis mit nur zwei Schallquellen ermöglicht. - Die Aufnahme der kopfbezogenen Übertragungsfunktionen sowie der kopfbezogenen Impulsantworten kann auf verschiedene Weise geschehen. Im Rahmen dieser Arbeit wurden drei Aufnahmeverfahren unter gleichen Bedingungen umgesetzt und ihre Ergebnisse analytisch verglichen. Alle Aufnahmen wurden an einem Kunstkopf unter Verwendung unterschiedlicher Mikrofonierungen durchgeführt. Bei den eingesetzten Mikrofonen handelt es sich um die im Kunstkopf integrierten Mikrofone, um Originalkopfmikrofone an einem Kopfbügel sowie um selbstgebaute Sondenmikrofone. - Anhand der aufgenommenen Daten wurden rechnerisch die kopfbezogenen Übertragungsfunktionen und Impulsantworten ermittelt. Aus ihnen wurden die interauralen Laufzeit- und Pegeldifferenzen berechnet. Für Vergleichszwecke wurden die ermittelten Daten weiter aufbereitet und grafisch veranschaulicht. Die Aufnahmeverfahren und ihr Einfluss auf die Ausprägung der binauralen Merkmale wurden betrachtet und bewertet.



Hoffmann, Danilo;
Weiterentwicklung eines Autorenwerkzeugs zur intuitiven Erstellung von Diensten für das digitale Fernsehen. - 110 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2010

In der heutigen Zeit der stetigen Weiterentwicklung des Internets haben Nutzer immer vielfältigere Möglichkeiten, bestimmte Informationen, wie beispielsweise Nachrichten- oder Wissensdienste, bequem über angebotene Anwendungen abzufragen. Jedoch ist die Einstiegsschwelle zur Inanspruchnahme dieser Dienste vergleichsweise hoch. Anwender müssen sich meist mit der grundlegenden Inbetriebnahme von Endgeräten, wie beispielsweise PCs, auseinandersetzen, um an die gewünschten Informationen zu gelangen. - Das iKabel-Projekt am Fraunhofer Institut für Digitale Medientechnologie (IDMT) hat es sich zur Aufgabe gemacht, Informationsdienste und interaktive Dienste, die im Internet verbreitet sind, auf herkömmlicher Weise über breitbandige TV-Kabelnetze zu verteilen, um sie so auch für unerfahrene Nutzer, die lediglich mit der Bedienung eines Fernsehers vertraut sind, verfügbar zu machen. Es wird eine Technologie-Plattform entwickelt, die vorhandene Infrastrukturen nutzt, und sie um Komponenten auf Verteiler- und Empfängerseite erweitert. Die Erstellung und Verteilung von Diensten kann für erfahrene, in der Programmierung geübte Autoren schon vollzogen werden, allerdings müssen auch Autorensysteme für unerfahrene Benutzer implementiert werden. - Diese Ausarbeitung greift die Entwicklung des im iKabel-Projekts entworfenen iKabelAuthors auf und beschäftigt sich mit der Weiterentwicklung dieses Programms, sodass es an die gegenwärtigen Anforderungen angepasst wird. Es soll möglich sein, auf grafische Weise neue Dienste zu erstellen und vorhandene Dienste zu bearbeiten. Da das Autorenprogramm besonders für unerfahrene Nutzer verwendbar sein soll, müssen Aspekte der Benutzerfreundlichkeit in die Gestaltung einfließen. - Für die Weiterentwicklung es ist notwendig, eine Analyse am Programm zu vollziehen, um den aktuellen Stand in den Punkten Funktionalität und Anwenderfreundlichkeit zu untersuchen. Hierbei ist es erforderlich, Grundlagen der Softwareentwicklung zu legen, um den iKabelAuthor effizient weiter zu entwickeln. Verschiedene Methoden der systematischen Konzeption von Software werden vorgestellt und bewertet, aktuelle Ausgangspunkte und strukturelle Ansätze der Softwaretechnik werden präsentiert. Nur eine konsequent durchgeführte und gut dokumentierte Umsetzung der geplanten Vorgehensweise kann zu einer erfolgreichen Weiterentwicklung des Autorenprogramms führen.



Schirmer, Christopher;
Konzeption und prototypische Entwicklung von Tools für den Zugriff auf Medieninhalte über eine XML-Repräsentation. - 64 S. Ilmenau : Techn. Univ., Bachelor-Arbeit, 2009

In der heutigen Zeit existieren eine Vielzahl von Datei- und Multimediaformaten. Um auf ein bestimmtes Format zuzugreifen und daran Änderungen vornehmen zu können, werden stets spezielle Tools benötigt, die oft nur mit diesem einen Format arbeiten. Diese Arbeit beschäftigt sich mit dem formatunabhängigen Zugriff und der Modifikation von Binärdaten und Metadaten, genauer gesagt von Multimediadaten. Dabei wird die Struktur einer Binärdatei innerhalb einer XML-Repräsentation beschrieben. Zunächst werden aktuelle Standards und existierende Lösungen untersucht. Anschließend wird ein Konzept für ein Toolkit erarbeitet, das den Zugriff und die Modifikation von Binärdateien und gegebene Anwendungsfälle unterstützt. Abschließend wird dieses Konzept prototypisch umgesetzt und ein Ausblick für die Anwendung in zukünftigen Anwendungsfällen gegeben.