Publications in the field

Below you will find an automated compilation of the publications of the group. For publications of the individual members of staff, please refer to their personal pages.

List of publications

Anzahl der Treffer: 283
Erstellt: Wed, 24 Apr 2024 23:02:40 +0200 in 0.0597 sec


Werner, Stephan; Klein, Florian; Mayenfels, Thomas; Brandenburg, Karlheinz
A summary on acoustic room divergence and its effect on externalization of auditory events. - In: QoMEX 2016, ISBN 978-1-5090-0354-9, (2016), insges. 6 S.

This contribution presents a summary of results from perceptual auditory experiments on context dependent quality parameters for virtual acoustic environments. The investigated quality features are influenced by divergence between synthesized scene and listening room and adaptation on congruence or divergence between the rooms. Two experiments are presented. The results from the first experiment show the room divergence effect on spatial auditory perception. A divergence between the listening room and binaurally synthesized room leads to a decrease of perceived externalization while congruence yields an increase. A more comprehensive statistical analysis regarding significance, effect size and visual influences is added to complement the original publication of this data. The second experiment shows this effect as the result of expectations of the listeners and can be shifted by adaptation and training. In the experiments we show, that training to congruent or divergent room combinations can increase or decrease the room divergence effect.



http://dx.doi.org/10.1109/QoMEX.2016.7498973
Neidhardt, Annika;
Distance perception in virtual auditory environments with a moving avatar. - In: Fortschritte der Akustik, ISBN 978-3-939296-10-2, (2016), S. 1327-1330

Werner, Stephan; Böhme, Martina; Mayenfels, Thomas; Klein, Florian
Variance in measured binaural room transfer functions of individuals. - In: Fortschritte der Akustik, ISBN 978-3-939296-10-2, (2016), S. 83-85

Sloma, Ulrike; Schäfer, Florian
Comparison of evaluation methods for the quality assessment of audio signals. - In: Fortschritte der Akustik, ISBN 978-3-939296-10-2, (2016), S. 893-896

When evaluating audio signals not only the overall audio quality but also the underlaying quality parameters are of high interest. For this purpose relevant quality features, e.g., attribute and vocabulary lists, have been determined by several researchers. When evaluating the quality description of a set of audio signals with a few predefined quality features an appropriate evaluation design has to be found. This study presents a comparison of two evaluation paradigms. On one hand a single-stimulus-with-multiple-attributes method and on the other hand a multi-stimulus-with-single-attribute method were used for evaluation of the same stimuli and quality attributes.



Loos, Alexander;
Face recognition for great apes : identification of primates in real-word-environments. - Ilmenau : Universitätsbibliothek, 2016. - 1 Online-Ressource (xi, 279 Seiten)
Technische Universität Ilmenau, Dissertation 2016

Aufgrund des gegenwärtigen Artensterbens sind viele Spezies, einschließlich Menschenaffen wie Schimpansen und Gorillas, vom Aussterben bedroht. Daher gewinnt die Überwachung der aktuellen Bestände mittels autonomer Aufnahmegeräte zunehmend an Bedeutung. Die manuelle Auswertung solcher Daten ist jedoch extrem mühsam, zeitaufwändig und kostenintensiv. Um der immer größer werdenden Datenflut Herr zu werden, untersucht diese Arbeit ein neues Anwendungsgebiet der Bildverarbeitung und des maschinellen Sehens: Automatische Detektion und Identifikation von Primaten in Bildern und Videos. Basierend auf der Annahme, dass Menschen und unsere nächsten Verwandten ähnliche Charakteristika des Gesichts aufweisen, werden in dieser Arbeit Algorithmen zur Erkennung menschlicher Gesichter erweitert um Schimpansen und Gorillas in ihrem natürlichen Lebensraum zuverlässig identifizieren zu können. Die Dissertation beschreibt und evaluiert ein algorithmisches System bestehend aus Detektion, Ausrichtung und Identifikation von Primatengesichtern in Bildern und Videos. Die vorgeschlagenen Algorithmen sind dabei robust gegenüber verschiedenen Posen, Beleuchtungsbedingungen und partiellen Verdeckungen sowie anderen Faktoren wie sie häufig in realen Anwendungsszenarien auftreten. Die Leistungsfähigkeit, aber auch Grenzen des Systems werden ausführlich anhand von Datensets freilebender und gefangener Schimpansen und Gorillas diskutiert. Mit dem Fokus auf die individuelle Erkennung werden zuerst Algorithmen für eine zuverlässige Erkennung von Primaten in Bildern vorgestellt. Holistische Merkmale sowie lokale Deskriptoren werden mittels einer Entscheidungsfusion kombiniert. Anschließend wird dieser Ansatz auf die Erkennung von Menschenaffen in Videos erweitert. Nach der Detektion und Verfolgung von Gesichtern werden Module zur Qualitätsbeurteilung angewandt, um Frames zu identifizieren, die sich am besten für die folgenden Gesichtserkennungsalgorithmen eignen. Weiterhin wird ein neuartiger Frame-Weighting-Algorithmus beschrieben, welcher basierend auf der Konfidenz des Klassifikators die Resultate mehrerer Frames gewichtet. Des Weiteren werden die entwickelten Algorithmen auf realistischen, von Experten annotierten Bild- und Videodatenbanken, sorgfältig evaluiert. Um die Vorteile des vorgeschlagenen Systems zu demonstrieren, wird es mit anderen dem Stand der Technik entnommenen Algorithmen zur Gesichtserkennung verglichen. Die implementierten Algorithmen wurden in einer prototypischen Anwendung zusammengeführt, welche derzeit von Biologen genutzt wird um Populationsgrößen schneller und genauer schätzen zu können. Daher hat das entwickelte Primate Recognition Framework (PRF) das Potential, den Weg zu effizienteren Monitoringverfahren zu ebnen und damit zukünftig Wissenschaftlern zu helfen, neue innovative Schutzmaßnahmen zu entwickeln.



http://www.db-thueringen.de/servlets/DocumentServlet?id=27246
Klein, Florian; Werner, Stephan
Auditory adaptation to non-individual HRTF cues in binaural audio reproduction. - In: Journal of the Audio Engineering Society, ISSN 0004-7554, Bd. 64 (2016), 1/2, S. 45-54

http://dx.doi.org/10.17743/jaes.2015.0092
Sporer, Thomas; Liebetrau, Judith; Werner, Stephan; Kepplinger, Sara; Gabb, Timo; Siedler, Theresa
Localization of audio objects in multichannel reproduction systems. - In: The future of audio entertainment technology - cinema, television and the internet, ISBN 978-1-5108-0050-2, (2015), Paper 8-1, Seite 142-150

Klein, Florian; Werner, Stephan
Auditory adaptation in spatial listening tasks. - In: 138th Audio Engineering Society convention 2015, (2015), S. 521-530

Werner, Stephan; Klein, Florian; Brandenburg, Karlheinz
Influence of spatial complexity and room acoustic disparity on perception of quality features using a binaural synthesis system. - In: 2015 Seventh International Workshop on Quality of Multimedia Experience (QoMEX), ISBN 978-1-4799-8959-1, (2014), insges. 6 S.

This contribution presents investigations on the influence of scene complexity and room acoustic disparity on the perception of different quality features using a binaural headphone system. The quality features "spatial presence" and "listener envelopment" are investigated next to "perceived externalization" and "localization" of an auditory event. The test uses three different rooms with distinct room acoustic characteristics and several scenes with different spatial complexity. The work addresses the question if the quality features can profit by the different audio scenes or not. The results show that spatial presence is influenced by spatial complexity while room acoustic disparity influences listener envelopment. Furthermore, externalization and localization are not affected by spatial complexity regardless of the personalization method used for binaural synthesis.



http://dx.doi.org/10.1109/QoMEX.2015.7148131
Harczos, Tamás;
Cochlear implant electrode stimulation strategy based on a human auditory model, 2015. - Online-Ressource (PDF-Datei: XXIV, 161 S., 4,27 MB) Ilmenau : Techn. Univ., Diss., 2015

Cochleaimplantate (CI), verbunden mit einer professionellen Rehabilitation, haben mehreren hunderttausenden Hörgeschädigten die verbale Kommunikation wieder ermöglicht. Betrachtet man jedoch die Rehabilitationserfolge, so haben CI-Systeme inzwischen ihre Grenzen erreicht. Die Tatsache, dass die meisten CI-Träger nicht in der Lage sind, Musik zu genießen oder einer Konversation in geräuschvoller Umgebung zu folgen, zeigt, dass es noch Raum für Verbesserungen gibt. Diese Dissertation stellt die neue CI-Signalverarbeitungsstrategie Stimulation based on Auditory Modeling (SAM) vor, die vollständig auf einem Computermodell des menschlichen peripheren Hörsystems beruht. Im Rahmen der vorliegenden Arbeit wurde die SAM Strategie dreifach evaluiert: mit vereinfachten Wahrnehmungsmodellen von CI-Nutzern, mit fünf CI-Nutzern, und mit 27 Normalhörenden mittels eines akustischen Modells der CI-Wahrnehmung. Die Evaluationsergebnisse wurden stets mit Ergebnissen, die durch die Verwendung der Advanced Combination Encoder (ACE) Strategie ermittelt wurden, verglichen. ACE stellt die zurzeit verbreitetste Strategie dar. Erste Simulationen zeigten, dass die Sprachverständlichkeit mit SAM genauso gut wie mit ACE ist. Weiterhin lieferte SAM genauere binaurale Merkmale, was potentiell zu einer Verbesserung der Schallquellenlokalisierungfähigkeit führen kann. Die Simulationen zeigten ebenfalls einen erhöhten Anteil an zeitlichen Pitchinformationen, welche von SAM bereitgestellt wurden. Die Ergebnisse der nachfolgenden Pilotstudie mit fünf CI-Nutzern zeigten mehrere Vorteile von SAM auf. Erstens war eine signifikante Verbesserung der Tonhöhenunterscheidung bei Sinustönen und gesungenen Vokalen zu erkennen. Zweitens bestätigten CI-Nutzer, die kontralateral mit einem Hörgerät versorgt waren, eine natürlicheren Klangeindruck. Als ein sehr bedeutender Vorteil stellte sich drittens heraus, dass sich alle Testpersonen in sehr kurzer Zeit (ca. 10 bis 30 Minuten) an SAM gewöhnen konnten. Dies ist besonders wichtig, da typischerweise Wochen oder Monate nötig sind. Tests mit Normalhörenden lieferten weitere Nachweise für die verbesserte Tonhöhenunterscheidung mit SAM. Obwohl SAM noch keine marktreife Alternative ist, versucht sie den Weg für zukünftige Strategien, die auf Gehörmodellen beruhen, zu ebnen und ist somit ein erfolgversprechender Kandidat für weitere Forschungsarbeiten.



http://www.db-thueringen.de/servlets/DocumentServlet?id=26207