Technische Universität Ilmenau

Computational Analysis of Sound and Music (CASM) - Interaktive Studienpläne der TU Ilmenau

Die Interaktiven Studienpläne sind ein Informationsangebot zu den Studiengängen der TU Ilmenau.

Die rechtsverbindlichen Studienpläne entnehmen Sie bitte den jeweiligen Studien- und Prüfungsordnungen (Anlage Studienplan).

Alle Angaben zu geplanten Lehrveranstaltungen finden Sie im elektronischen Vorlesungsverzeichnis.

Bitte beachten Sie, dass auf dieser Seite keine Aktualisierungen mehr vorgenommen werden. Alle Module und Studienpläne ab der PO-Version 2021 (Bachelor- und Master-Studiengänge) sind ab sofort im Campus-Portal erreichbar.

Modulinformationen zu Modulnummer 201260 - allgemeine Informationen
Modulnummer201260
FakultätFakultät für Elektrotechnik und Informationstechnik
Fachgebietsnummer2182 (Audiovisuelle Technik)
Modulverantwortliche(r)Prof. Dr. Alexander Gerd Raake
SpracheEnglisch
TurnusSommersemester
Vorkenntnisse

Basic knowledge of audio signal processing, machine learning, statistics, linear algebra, and Python programming 

Lernergebnisse und erworbene Kompetenzen

After the lectures students

- can explain different perceptual audio attributes
- are able to differentiate between different audio domains such as speech, music, and environmental sounds
- have gained knowledge about different audio and time-frequency representations
- are able to explain and implement individual steps of a common machine learning model lifecycle
- have gained knowledge about common deep neural network architectures for audio analysis
- are able to explain research objectives, challenges, and common approaches for different music and environmental audio analysis tasks
- have demonstrated their practical knowledge in solving a selected audio analysis task by implementing, training, and evaluating a deep neural network and presenting the research results as a scientific publication and presentation 

Inhalt

Foundations of Audio Processing (audio signals and domains, audio and time-frequency representations, sound perception, perceptual audio features) 

Foundations of Deep Learning (data representation & processing, model training and evaluation, selected neural network architectures)
Music Information Retrieval (rhythmic and harmonic analysis, music transcription, source separation)
Environmental Sound Analysis (sound event detection, acoustic scene classification, acoustic anomaly detection)
Research Project (literature & dataset research, data visualization, scientific writing)

 

Medienformen und technische Anforderungen bei Lehr- und Abschlussleistungen in elektronischer Form

Presentation, Moodle, Audio Examples, Python examples in Jupyter Notebook Environment, Laptop with access to https://colab.google/ and headphones required for all lectures

Literatur

Goodfellow, I., Bengio, Y., and Courville, A: Deep Learning, MIT Press, 2016.

Virtanen, T., Plumbley, Mark D., and Ellis, D.: Computational Analysis of Sound Scenes and Events, Springer, 2018.Müller, M.: Fundamentals of Music Processing Using Python and Jupyter Notebooks, Springer, 2021.Müller, M.: Fundamentals of Music Processing - Notebooks (https://www.audiolabs-erlangen.de/FMP)Müller, M.: Preparation Course Python Notebooks (https://www.audiolabs-erlangen.de/resources/MIR/PCP/PCP.html)scikit-learn (https://scikit-learn.org/stable/)librosa (https://librosa.org/doc/latest/index.html)

Lehrevaluation
Spezifik Referenzmodul
ModulnameComputational Analysis of Sound and Music (CASM)
Prüfungsnummer210550
Leistungspunkte5
SWS4 (2 V, 2 Ü, 0 P)
Präsenzstudium (h)45
Selbststudium (h)105
VerpflichtungPflichtmodul
AbschlussPrüfungsleistung mit mehreren Teilleistungen
Details zum AbschlussDas Modul Computational Analysis of Sound and Music (CASM) mit der Prüfungsnummer 210550 schließt mit folgenden Leistungen ab:
  • alternative semesterbegleitende Prüfungsleistung mit einer Wichtung von 25% (Prüfungsnummer: 2101098)
  • schriftliche Prüfungsleistung über 90 Minuten mit einer Wichtung von 75% (Prüfungsnummer: 2101099)

Details zum Abschluss Teilleistung 1:

Research Project


During the practical phases in the last 4 weeks of the lectures, small teams of students will work on a selected audio analysis task, conduct a literature and dataset research, and implement in Python all required steps ranging from the importing and processing of audio data to the implementation, training, and evaluation of suitable deep neural network architectures. This group work will be performed during practical phases in the lectures in the last 4 semester weeks. Student groups will document their project results in a short scientific paper and give a final project presentation in the final lecture.

Details zum Abschluss Teilleistung 2:

Written exam consisting of multiple-choice and free-form questions to evaluate the professional competences in the course topics

Link zum Moodle-Kurs
LehrendeDr. Jakob Abeßer
Anmeldemodalitäten für alternative PL oder SL

Dieses Modul enthält mindestens eine alternative semesterbegleitende Abschlussleistung. Bitte beachten Sie, dass diese in der Regel schon zu Beginn des Semesters, in dem diese angeboten wird, angemeldet werden muss.
Über die Details und Zeiträume dazu werden Sie vom Lehrenden und/oder dem Prüfungsamt informiert. Fragen Sie gegebenenfalls unbedingt beim Lehrenden nach.

This module contains at least one alternative exam part. Please note that this must usually be registered at the beginning of the semester in which it is offered.
The lecturer and/or the examination office will inform you about the details and time periods. If necessary, be sure to ask the lecturer.

max. Teilnehmerzahl
Spezifik im Studiengang Master Medieningenieurwissenschaften 2023
ModulnameComputational Analysis of Sound and Music (CASM)
Prüfungsnummer210550
Leistungspunkte5
Präsenzstudium (h)45
Selbststudium (h)105
VerpflichtungWahlmodul
AbschlussPrüfungsleistung mit mehreren Teilleistungen
Details zum AbschlussDas Modul Computational Analysis of Sound and Music (CASM) mit der Prüfungsnummer 210550 schließt mit folgenden Leistungen ab:
  • alternative semesterbegleitende Prüfungsleistung mit einer Wichtung von 25% (Prüfungsnummer: 2101098)
  • schriftliche Prüfungsleistung über 90 Minuten mit einer Wichtung von 75% (Prüfungsnummer: 2101099)

Details zum Abschluss Teilleistung 1:

Research Project


During the practical phases in the last 4 weeks of the lectures, small teams of students will work on a selected audio analysis task, conduct a literature and dataset research, and implement in Python all required steps ranging from the importing and processing of audio data to the implementation, training, and evaluation of suitable deep neural network architectures. This group work will be performed during practical phases in the lectures in the last 4 semester weeks. Student groups will document their project results in a short scientific paper and give a final project presentation in the final lecture.

Details zum Abschluss Teilleistung 2:

Written exam consisting of multiple-choice and free-form questions to evaluate the professional competences in the course topics

Link zum Moodle-Kurs
Anmeldemodalitäten für alternative PL oder SL

Dieses Modul enthält mindestens eine alternative semesterbegleitende Abschlussleistung. Bitte beachten Sie, dass diese in der Regel schon zu Beginn des Semesters, in dem diese angeboten wird, angemeldet werden muss.
Über die Details und Zeiträume dazu werden Sie vom Lehrenden und/oder dem Prüfungsamt informiert. Fragen Sie gegebenenfalls unbedingt beim Lehrenden nach.

This module contains at least one alternative exam part. Please note that this must usually be registered at the beginning of the semester in which it is offered.
The lecturer and/or the examination office will inform you about the details and time periods. If necessary, be sure to ask the lecturer.

max. Teilnehmerzahl