http://www.tu-ilmenau.de

Logo TU Ilmenau


Ihre Position

INHALTE

Praxiswerkstatt Machine Learning für Audio Signale in Python

Project Workshop Machine Learning for Audio Signals in Python

Lehrverantwortlicher: Prof. Dr.-Ing. Gerald Schuller

Inhalt

Machine Learning for Audio Signals in Python

In dieser Praxiswerkstatt sollen Machine Learning Ansaetze mittels Python und PyTorch auf Audio Signale angewendet werden. Ziel ist die Erkennung und die Separation von Klaengen oder Audio Quellen, wie z.B. die Separation von Audio Quellen, die Erkennung von Geraeuschen oder gesprochenen Schluesselwoertern, und die Zerlegung von Audiosignalen mit einer vom Signal gelernten Filterbank in seine "Klang-Atome"

In this project workshop, machine learning approaches using Python and PyTorch will be applied to audio signals. The goal is the recognition and separation of sounds or audio sources, such as the separation of audio sources, the recognition of noise or spoken keywords, and the decomposition of audio signals with a filter bank learned from the signal into its "sound atoms".

See also our github repository with Jupyter notebooks for it:

https://github.com/TUIlmenauAMS/MLfAS_Tutorials

Python Library for Sound Output and Input

Es gibt von uns eine Python Bibliothek zur Sound-Ausgabe und -Aufnahme: sound.py

Anleitung:

in Python importieren mit "import sound".

Dann stehen die Funktionen sound.sound zur live wiedergabe von sound, sound.wavread zum lesen von einem .wav file, und sound.wavwrite zum Schreiben als wavfile zur Verfuegung. Weiterhin gibt es die Funktion sound.record zum live Aufnehmen eines Klangs vom Mikrofon direkt in ein array. Die genaue Syntax sieht man im File sound.py.

----------------

Our sound library sound.py offers live playback and recording of sound, and reading from and writing to .wav files.

import sound.py, aufruf: sound.sound(snd,FS)

This is the file link:

Literatur und Links

Eugene Charniak: "Introduction to Deep Learning", MIT Press, 2018.

"Signals and Systems", Girod, Rabenstein, Stenger, Wiley.

Für Transformationen und Codierung:

K.R. Rao, P.C. Yip, Editors: "The Transform and Data Compression Handbook", CRC Press.

Strang, Nguyen: "Wavelets and Filter Banks", Wellesley Cambridge Press

Aktuelles

Ort und Zeit/ Date and Time

Wintersemester 2020/21

Zeit/Time: Di 15-17:15 Uhr

Start: 13.10.2020

Online Meeting (link will be shown after enrollment) 

 

Einschreibung/Registration

Die Einschreibung erfolgt auf elektronischem Weg

Max Teilnehmerzahl: 6. 

Electronic registration

Max. number of participants: 6

(also suitable for interested Master students)