Publications in the field

Below you will find an automated compilation of the publications of the group. For publications of the individual members of staff, please refer to their personal pages.

List of publications

Anzahl der Treffer: 283
Erstellt: Mon, 29 Apr 2024 23:02:45 +0200 in 0.0956 sec


Mehnert, Markus; Gatzsche, Gabriel; Arndt, Daniel; Brandenburg, Karlheinz
Circular pitch space based harmonic change detection. - In: 124th Audio Engineering Society convention 2008, (2008), S. 725-733

Jumisko-Pyykkö, Satu; Weitzel, Mandy; Strohmeier, Dominik
Designing for user experience: what to expect from mobile 3D TV and video?. - In: 1st International Conference on Designing Interactive User Experiences for TV and Video 2008, ISBN 978-1-617-38011-2, (2008), S. 183-192

Uhle, Christian;
Automatisierte Extraktion rhythmischer Merkmale zur Anwendung in Music-Information Retrieval-Systemen, 2008. - Online-Ressource (PDF-Datei: 145 S., 2873 KB) : Ilmenau, Techn. Univ., Diss., 2008
Parallel als Druckausg. erschienen

Das Thema dieser Dissertation ist die Extraktion von Merkmalen, die rhythmische Eigenschaften von Audiosignalen beschreiben. Diese Merkmale sind für die Anwendung in Music Information Retrieval (MIR)-Systemen ausgewählt. Obwohl in der Vergangenheit an der Extraktion rhythmischer Merkmale wie zum Beispiel Tempo und Taktart in großem Umfang gearbeitet wurde, erreichen aktuelle Verfahren nicht die Erkennungsleistung eines geübten Zuhörers. Eine der Ursache dafür wird in der Auswertung von Informationen auf unterschiedlichen Abstraktionsebenen beim Menschen vermutet, eine weitere bei der Berücksichtigung von \mbox{musikalischem} Vorwissen. Der hier beschriebene Ansatz orientiert sich an diesen Analysemechanismen. Zur Identifikation von geeigneten Merkmalen und relevanten Aspekten der menschlichen Verarbeitung der Schallsignale werden Grundlagen aus Musiktheorie, Psychoakustik und Kognitionswissenschaft erklärt. Bekannte Verfahren zur Extraktion rhythmischer Merkmale werden in einer ausführlichen Darstellung des Standes der Technik anschließend erläutert. Der Hauptteil der Arbeit enthält eine Zusammenstellung von Verfahren des maschinellen Hörens, die Informationen auf unterschiedlichen Abstraktionsebenen auswerten. Eine kompakte Darstellung der metrischen Struktur wird zur Ermittlung der metrischen Merkmale vorgestellt. Da einerseits die Auswertung von Low-level-Merkmalen die Anwendung von musikalischem Vorwissen nur in geringen Maß ermöglicht, und andererseits die Informationen auf höheren Abstraktionsebenen durch ihre Fehlerhaftigkeit die Erkennungsleistung in verschiedenen Situationen einschränken können, werden die Ergebnisse der verschiedenen Verfahren in Abhängigkeit ihrer Konfidenzmaße zu einem Gesamtergebnis zusammengefasst. Die Extraktion von rhythmischen Merkmalen aus den Informationen maschinell detektierter perkussiver Instrumente stellt einen Fortschritt im Vergleich zu bekannten Arbeiten dar. Eine Segmentierung in charakteristische Abschnitte des Audiosignals, die zum Beispiel Strophe oder Refrain repräsentieren, wird als Vorverarbeitungsschritt zur Analyse vorgestellt und die dadurch erreichte signifikante Verbesserung der Erkennungsleistung nachgewiesen. Die Leistungsfähigkeit der Verfahren wird anhand eines umfangreichen Testdatensatzes evaluiert und die Eignung der extrahierten Merkmale in einem MIR-System untersucht.



http://www.db-thueringen.de/servlets/DocumentServlet?id=10855
Kühhirt, Uwe;
Authoring objektbasierter AV-Anwendungen, 2008. - Online-Ressource (PDF-Datei: X, 160 S., 6,35 MB) : Ilmenau, Techn. Univ., Diss., 2008

Die vorliegende Dissertation beschäftigt sich mit dem Authoring-Prozess objektbasierter AV-Anwendungen auf Basis des Objekt- und Szenenkonzeptes von MPEG-4. Diese moderne Beschreibungsform vereint die interaktiven Nutzungsmöglichkeiten digitaler Medien mit den Distributionsmöglichkeiten audiovisueller Medien. Die Umsetzung des Objekt- und Szenenkonzeptes hat tief greifende Auswirkungen auf die gesamte digitale Medienkette. Die Schaffung leistungsfähiger Autorensysteme ist eine wichtige Voraussetzung für die Verbreitung solcher Anwendungen. Das Ziel der Arbeit war die Entwicklung von Konzepten und Komponenten für ein Autorensystem mit Unterstützung eines auf mehrere Autoren verteilten Authoring-Prozesses. Authoring-Formate speichern alle anfallenden Informationen zur Beschreibung einer objektbasierten AV-Anwendung. Es wurden Authoring-Formate entwickelt, welche an die Anforderungen konkreter Anwendungen hinsichtlich Abstraktionsebene und Funktionsumfang angepasst sind. Autorenwerkzeuge sind die Schnittstellen des Autorensystems zu den Autoren. Im Fokus stehen grafisch-interaktive Werkzeuge zur Unterstützung eines intuitiven Arbeitens während des Authoring-Prozesses. Der Authoring-Server ist die technische Grundlage des Autorensystems für die verteilte Erstellung objektbasierter AV-Anwendungen. Er verwaltet alle anfallenden Daten und stellt diese den Autoren unter Berücksichtigung ihrer individuellen Berechtigungen zur Verfügung. Der Authoring-Server bildet die Schnittstelle zwischen den Produzenten der Medienobjekte und den Autoren. Er ermöglicht eine Wiederverwendung von Szenen und Szenenelementen über Produktionsgrenzen hinweg. Der Authoring-Server erlaubt es Autoren und auch Medienproduzenten, gemeinsam an der Erstellung einer AV-Anwendung zu arbeiten. Dafür wurde ein flexibles Datenmanagement auf Basis einer XML-Datenbank entworfen. Die entwickelten Konzepte orientieren sich an den Möglichkeiten von MPEG-4, sind aber auch auf andere multimediale Anwendungen übertragbar, die auf einem Szenengraphen beruhen. Auf dieser Basis können sowohl universell einsetzbare als auch spezialisierte Autorensysteme und Werkzeuge realisiert werden. Mehrere exemplarische Umsetzungen belegen die Funktionsfähigkeit der entwickelten Komponenten.



http://www.db-thueringen.de/servlets/DerivateServlet/Derivate-14561/ilm1-2008000059.pdf
Strohmeier, Dominik; Jumisko-Pyykkö, Satu
How does my 3D video sound like? - impact of loudspeaker set-ups on audiovisual quality on mid-sized autostereoscopic display. - In: 3DTV-Conference: The True Vision - Capture, Transmission and Display of 3D Video, ISBN 978-1-4244-1760-5, (2008), S. 73-76

http://dx.doi.org/10.1109/3DTV.2008.4547811
Weigel, Christian; Fan, FeiFei
GPU-based 3D video object synthesis and its quality assessment. - In: 3DTV-Conference: The True Vision - Capture, Transmission and Display of 3D Video, ISBN 978-1-4244-1760-5, (2008), S. 121-124

http://dx.doi.org/10.1109/3DTV.2008.4547823
Ley, Nicolas; Weigel, Christian
GPU-based background illumination correction for blue screen matting. - In: Proceedings, (2007), S. 1912-1915

Weigel, Christian; Schübel, Peter
Trifocal transfer on commodity graphics hardware. - In: Proceedings, (2007), S. 1686-1690

Brandenburg, Karlheinz;
Immersion, Interaktion und künstliche Intelligenz. - In: 100 Produkte der Zukunft, (2007), S. 115

Cao, Shi; Reiter, Ulrich; Weitzel, Mandy
Influence of interaction on perceived quality in audio visual applications: subjective assessment with n-back working memory task. - In: AES 30th International Conference on Intelligent Audio Environments 2007, (2007), S. 26-34