Publikationen im Fachgebiet

Nachstehend finden Sie eine automatisierte Zusammenstellung der Veröffentlichungen des Fachgebietes. Die Veröffentlichungen der einzelnen Mitarbeiter:innen finden Sie auf deren persönlichen Seiten.

Publikationsliste

Anzahl der Treffer: 286
Erstellt: Thu, 16 May 2024 23:03:40 +0200 in 0.0687 sec


Werner, Stephan;
Über den Einfluss kontextabhängiger Qualitätsparameter auf die Wahrnehmung von Externalität und Hörereignisort. - Ilmenau : Universitätsbibliothek, 2018. - 1 Online-Ressource (x, 211 Seiten)
Technische Universität Ilmenau, Dissertation 2018

Diese Arbeit umfasst meine Forschungstätigkeiten auf dem Gebiet des räumlichen Hörens. Es wird der Frage nachgegangen, welche Effekte verschiedene Kontexteinflüsse auf die Herausbildung einer auditorischen Illusion haben. Diese Effekte werden quantitativ erfasst. Es werden die Wahrnehmung von Externalität, Hörereignisrichtung u. a. bei Verwendung eines Binauralsynthesesystems untersucht. Als Ziel steht die Beschreibung und Messbarmachung der Kontexteinflüsse Raumdivergenz, Personalisierung und visuelle Merkmale. Die eigenen Untersuchungen zeigen deutlich, dass für das Zustandekommen einer sogenannten perfekten auditorischen Illusion eine ausreichende technische Realisierung der korrekten Ohrsignale nicht ausreichend ist. Vielmehr ist eine Erfüllung der intrinsischen Erwartungshaltung des Hörers notwendig. Der Prozess der Herausbildung von Qualität lässt sich durch einen Vergleich und Beurteilungsprozess beschreiben. Hierbei werden die aus den durch die Sinnesorgane aufgenommenen Reizungen abgeleiteten Qualitätsmerkmale mit den abgeleiteten Merkmalen einer inneren, individuellen Referenz verglichen. Dieser Prozess ist ausschlaggebend für die Herausbildung eines Hörereignisses. Mithilfe von qualitätsbewertenden Befragungen (Hörtests) lässt sich dieses Hörereignis als Abbildung messbar und beschreibbar machen. Die Ergebnisse meiner Arbeit zeigen, dass eine Divergenz akustischer Raumparameter zwischen einer binaural synthetisierten Szene und dem Abhörraum zu einer signifikanten Verringerung der Externalisierung von Hörereignissen führt. Eine Konvergenz raumakustischer Parameter erhöht die wahrgenommene Externalisierung. Die Sichtbarkeit von bspw. Lautsprecherattrappen im Abhörraum lässt die Externalität insgesamt ansteigen. Der sogenannte Raumdivergenzeffekt kann dadurch aber nicht aufgelöst werden. Die Personalisierung eines Binauralsynthesesystems zeigt eine Verringerung von Fehllokalisationen und einen Anstieg der Externalisierung. Es wird die Vermutung aufgestellt und untersucht, inwiefern Lokalisierungsfehler und Externalisierung korrelieren. Es wird gezeigt werden, dass eine personalisierte Binauralsynthese den Raumdivergenzeffekt nicht auflösen kann. Die Untersuchungen zum Raumdivergenzeffekt dienen als Grundlage zur Entwicklung von Methoden, welche verschiedene zeit- und energiebasierte akustische Merkmale der verwendeten Raumimpulsantworten verändern. Das Ziel ist die Anpassung einzelner raumakustischer Parameter der Synthese an die Raumakustik des Abhörraumes zur Erzeugung einer plausiblen auditorischen Illusion.



https://www.db-thueringen.de/receive/dbt_mods_00039220
Brandenburg, Karlheinz;
Echt oder Fake? Stimmt das, was ich höre?. - In: Kinderuni Ilmenau 2018, (2018)

Neidhardt, Annika;
Detection of a nearby wall in a virtual echolocation scenario based on measured and simulated OBRIRS. - In: Aesthetics and science, (2018), S. 31-40

Klein, Florian; Neidhardt, Annika; Seipel, Marius; Sporer, Thomas
Training on the acoustical identification of the listening position in a virtual environment. - In: 143rd Audio Engineering Society International Convention 2017, (2018), S. 205-212

Brandenburg, Karlheinz; Cano, Estefanía; Klein, Florian; Köllmer, Thomas; Lukashevich, Hanna; Neidhardt, Annika; Sloma, Ulrike; Werner, Stephan
Plausible augmentation of auditory scenes using dynamic binaural synthesis for personalized auditory realities. - In: Science, technology, design, and implementation, (2018), S. 258-267

Neidhardt, Annika; Ignatious-Tommy, Alby; Pereppadan, Anson Davis
Plausibility of an interactive approaching motion towards a virtual sound source based on simplified BRIR sets. - In: 144th Audio Engineering Society International Convention 2018, (2018), S. 685-695

Klein, Florian; Werner, Stephan
The relevance of auditory adaptation effects for the listening experience in virtual acoustic environments. - In: 144th Audio Engineering Society International Convention 2018, (2018), S. 575-582

Kruspe, Anna;
Application of automatic speech recognition technologies to singing. - Ilmenau : Universitätsbibliothek, 2018. - 1 Online-Ressource (vi, 179 Blätter)
Technische Universität Ilmenau, Dissertation 2018

Das Gebiet des Music Information Retrieval befasst sich mit der automatischen Analyse von musikalischen Charakteristika. Ein Aspekt, der bisher kaum erforscht wurde, ist dabei der gesungene Text. Auf der anderen Seite werden in der automatischen Spracherkennung viele Methoden für die automatische Analyse von Sprache entwickelt, jedoch selten für Gesang. Die vorliegende Arbeit untersucht die Anwendung von Methoden aus der Spracherkennung auf Gesang und beschreibt mögliche Anpassungen. Zudem werden Wege zur praktischen Anwendung dieser Ansätze aufgezeigt. Fünf Themen werden dabei betrachtet: Phonemerkennung, Sprachenidentifikation, Schlagwortsuche, Text-zu-Gesangs-Alignment und Suche von Texten anhand von gesungenen Anfragen. Das größte Hindernis bei fast allen dieser Themen ist die Erkennung von Phonemen aus Gesangsaufnahmen. Herkömmliche, auf Sprache trainierte Modelle, bieten keine guten Ergebnisse für Gesang. Das Trainieren von Modellen auf Gesang ist schwierig, da kaum annotierte Daten verfügbar sind. Diese Arbeit zeigt zwei Ansätze auf, um solche Daten zu generieren. Für den ersten wurden Sprachaufnahmen künstlich gesangsähnlicher gemacht. Für den zweiten wurden Texte automatisch zu einem vorhandenen Gesangsdatensatz zugeordnet. Die neuen Datensätze wurden zum Trainieren neuer Modelle genutzt, welche deutliche Verbesserungen gegenüber sprachbasierten Modellen bieten. Auf diesen verbesserten akustischen Modellen aufbauend wurden Algorithmen aus der Spracherkennung für die verschiedenen Aufgaben angepasst, entweder durch das Verbessern der Robustheit gegenüber Gesangscharakteristika oder durch das Ausnutzen von hilfreichen Besonderheiten von Gesang. Beispiele für die verbesserte Robustheit sind der Einsatz von Keyword-Filler-HMMs für die Schlagwortsuche, ein i-Vector-Ansatz für die Sprachenidentifikation sowie eine Methode für das Alignment und die Textsuche, die stark schwankende Phonemdauern nicht bestraft. Die Besonderheiten von Gesang werden auf verschiedene Weisen genutzt: So z.B. in einem Ansatz für die Sprachenidentifikation, der lange Aufnahmen benötigt; in einer Methode für die Schlagwortsuche, die bekannte Phonemdauern in Gesang mit einbezieht; und in einem Algorithmus für das Alignment und die Textsuche, der bekannte Phonemkonfusionen verwertet.



http://nbn-resolving.de/urn:nbn:de:gbv:ilm1-2018000226
Brandenburg, Karlheinz; Sladeczek, Christoph
Audiocodecs : Hörgenuss aus der digitalen Welt. - In: Digitalisierung, (2018), S. 65-79

https://doi.org/10.1007/978-3-662-55890-4_5
Sporer, Thomas; Brandenburg, Karlheinz; Brix, Sandra; Sladeczek, Christoph
Wave field synthesis. - In: Immersive sound, (2018), S. 311-332