http://www.tu-ilmenau.de

Logo TU Ilmenau


Ansprechpartner

Dr.-Ing. Stephan Werner

Kommissarischer Fachgebietsleiter

Telefon +49 3677 69-1653

E-Mail senden

Ihre Position

INHALTE

Andere Projekte

pyBinSim

Als Werkzeug und Renderer für unsere Binauralsynthese wurde pyBinSim entwickelt. Es ermöglicht eine Faltung von Audioinhalten mit einer Vielzahl von Filtern, bspw. binaurale Raumimpulsantworten (BRIRs), und integriert ein beliebiges Posen- und Positionstracking.

Die Hauptmotivation für die Entwicklung von pyBinSim war die Notwendigkeit eines einfachen BRIR-Faltungswerkzeugs zur Untersuchung der Hörerbewegung in einem virtuellen akustischen Raum, basierend auf Messungen in realen Räumen. Das Tool ist unabhängig von den verwendeten Trackingsystemen, indem eine OSC-basierte Schnittstelle verwendet wird. Es basiert auf Python und ist daher hoffentlich einfach zu erlernen und sehr flexibel.

Der Quellcode ist unter der MIT license als Open Source auf Github verfügbar:

github.com/pyBinSim/pyBinSim

Weiter Beschreibungen finden sich in: Annika Neidhardt, Florian Klein, Niklas Knoop, and Thomas Köllmer, "Flexible Python tool for dynamic binaural synthesis applications", 142nd Convention of the Audio Engineering Society, Germany, 2017.

Kontakt: Annika Neidhardt (annika.neidhardt@tu-ilmenau.de)

Dataset of measured binaural room impulse responses for use in a position-dynamic auditory augmented reality application

Scheme of the speakers and measurement positions; click to enlarge.

The dataset includes measured binaural room impluse responses (BRIRs) using a head and torso simulator (KEMAR). The measurements are realized for six loudspeaker positions. Five loudspeakers are placed in a standardized five-channel surround setup with the left and right speaker at +/-30° from the center speaker. The left-surround and right-surround speaker are placed at +/-120°. The distance to the midpoint of this setup is 3.5 m. The sixth loudspeaker is placed 1.35 m from the midpoint and 150° to the right side of the setup.  Loudspeakers of type Geithain R906 are used.

The BRIRs are measured at nine positions within the loudspeaker setup. For each position the artificial head is turned 360° in the horizontal plane with a step size of 5°. Next to the midpoint position of the setup, frontal, backward, and lateral positions are measured. The covered plane size is 4m x 4m. The figure to the right gives an overview about the names and setup.

A TV studio at the Technische Universität Ilmenau is used as room for the measurements. The room has a total size of 19.5m x 11.5m x 5.5m. The reverberation time (RT60 from 80 Hz to 18 kHz) is approx. 0.7 s. The C50 and C80 are 15dB and 17dB.

Please feel free to use the measured BRIRs for your research and your project!

You can download it here. Contact: stephan.werner@tu-ilmenau.de

Dataset of In-The-Ear and Behind-The-Ear Binaural Room Impulse Responses used for Spatial Listening with Hearing Implants

The contribution presents a dataset of binaural room impulse responses (BRIRs) using a KEMAR head and torso simulator. Twelve positions around the head are recorded in three rooms with different room acoustics. The rooms represent a standard conform listening lab, a room for rehabilitation of hearing diseases, and a room with larger size in room geometry. Next to the in-ear recordings, behind-ear BRIRs are recorded to simulate the microphone positions of hearing aid devices. The dataset is used in a research project to develop innovative methods and technologies for spatial listening and speech intelligibility using cochlea implants and bone conducti on hearing aids. The dataset enables a dynamic binaural resynthesis of different directions and rooms for research and rehabilitation.

The dataset can be downloaded here ; contact florian.klein@tu-ilmenau.de or  stephan.werner@tu-ilmenau.de.

Mikrofone am Institut

Das Institut für Medientechnik besitzt zahlreiche Mikrofone, die für die unterschiedlichsten Zwecke eingesetzt werden können. Je nach Bauart und Wandlerprinzip ist der Klang unterschiedlich. In einer studentischen Projektarbeit wurde sich die Mühe gemacht ein Vergleichshören über den Webbrowser zu ermöglichen. Dies finden Sie hier:

Mikrofone am Institut

 

 

Individual BRTF Dataset

Interquartile distances of measured BRTFs of the left ear of 25 test persons in the listening lab (after ITU-R BS.1116-1).

Binaural synthesis systems allow the reconstruction of an acoustic environment by employing binaural room transfer functions (BRTFs) and convolving them with dry audio sig­nals. The aim of this tech­nique is to create a plausible and immersive auditory illusion with a high quality of experience. The perceived quality features such as localization, ex­ternalization, or col­oration should be comparable to those of a real listening situation. The experienced quality de­pends, amongst others, on the personalization of the binaural resynthesis. The smaller the deviation of the used BRTF for the synthesis from the individual transfer function, the better the perceived quality. Recorded BRTFs have been shown to exhibit high individual differences.

This contribution presents an analysis of individually meas­ured BRTFs for several subjects, rooms, and source posi­tions. A dataset of 25 individual BRTFs was used to investigate for what frequency ranges particularly large individual differ­ences or slight differences occur. The used dataset is stored in the SOFA (Spatially Oriented Format for Acoustics) file format and is available here.

More information can e found here: Werner, S., Böhme, M., Mayenfels, T., and Klein, F.: "Variance in Measured Binaural Room Transfer Functions of Individuals", 42. Jahrestagung für Akustik, DAGA, Aachen, Germany, 2016.

Contact: Stephan Werner (stephan.werner@tu-ilmenau.de)

ReVOGS

Das Realistic Video Object Generation System (kurz: ReVOGS) ist ein Echtzeit-Software-System für Bild und Videoanalyse und -synthese mit dem Schwerpunkt auf die Synthese von 3D Videoobjekten. Seine modulare Struktur ermöglicht die einfache Implementierung und Untersuchung einer Vielzahl von Algorithmen durch das Verbinden von funktionalen Modulen in einem Graphen. Der Graph kann als XML-Datei gespeichert aber auch visuelle erstellt und editiert werden.

Für die Implementierung der Module unterstützt das System Multi-Threading sowie die Nutzung der GPU für Aufgaben der Bildverarbeitung. Eine Anwendung namens ReVOGS-Profiler verwaltet die Echtzeitanforderungen und ermöglicht detailierte Messungen der Peformance.

Das System ist für verschiedene Aufgaben wie Kamerakalibrierung, Multi-View-Capturing, Tiefenschätzung und virtuelle Viewsynthese im Einsatz. Es läuft auf Windows und Linux Systemen. 

Kontakt: Christian Weigel

Multi-Touch Tisch

Im Rahmen einer Diplomarbeit wurde ein Multi-Touch-Table auf Basis der gestörten Totalreflektion gebaut. Das Prinzip wurde erstmals von Jeff Han in seiner  weltbekannten Präsentation 2006 vorgestellt. Wir planen den Einsatz dieses sehr intuitiven Eingabegerätes für neue Methoden in der Qualitätsbewertung.

Der Tisch besteht aus einem robusten Aluminium-Gehäuse. Der Bildschirm ist eine 10mm dicke Acrylglasplatte der Größe 1000x750mm. Um die Platte wurden über 100 IR-LEDs angebracht deren Reflektionen mit 60 Bildern/s von einer Point Grey Research-Kamera mit speziellem IR-Pass-Filter aufgenommen werden.


Kontakt: Christian Weigel