Technische Universität Ilmenau

Deep Learning for Computer Vision - Modultafeln of TU Ilmenau

The module lists provide information on the degree programmes offered by the TU Ilmenau.

Please refer to the respective study and examination rules and regulations for the legally binding curricula (Annex Curriculum).

You can find all details on planned lectures and classes in the electronic university catalogue.

Information and guidance on the maintenance of module descriptions by the module officers are provided at Module maintenance.

Please send information on missing or incorrect module descriptions directly to modulkatalog@tu-ilmenau.de.

module properties Deep Learning for Computer Vision in degree program Bachelor Informatik 2013
module number200133
examination number220490
departmentDepartment of Computer Science and Automation
ID of group 2233 (Neuroinformatics and Cognitive Robotics)
module leaderProf. Dr. Horst-Michael Groß
term winter term only
languageDeutsch
credit points5
on-campus program (h)45
self-study (h)105
obligationelective module
examexamination performance with multiple performances
details of the certificateDas Modul Deep Learning für Computer Vision mit der Prüfungsnummer 220490 schließt mit folgenden Leistungen ab:
  • schriftliche Prüfungsleistung über 90 Minuten mit einer Wichtung von 100% (Prüfungsnummer: 2200826)
  • alternativ semesterbegleitende Studienleistung mit einer Wichtung von 0% (Prüfungsnummer: 2200827)


Details zum Abschluss Teilleistung 2:

erfolgreicher Abschluss der gestellten Implementierungsaufgaben mittels vorgegebener Deep Learning Frameworks

signup details for alternative examinations
maximum number of participants
previous knowledge and experience

Bachelor-Pflichtmodul "Neuroinformatik und Maschinelles Lernen"

learning outcome

Im Modul "Deep Learning für Computer Vision" haben die Studierenden die konzeptionellen, methodischen und algorithmischen Grundlagen von DNNs (Deep Neural Networks) kennen gelernt. Sie haben die grundsätzliche Herangehensweise dieser Form des Wissenserwerbs, der Generierung von implizitem Wissen aus Trainingsbeispielen, verstanden. Sie wissen, wie ein tiefes Neuronales Netzwerk aus Trainingsbeispielen lernt und diese nach Beendigung der Lernphase verallgemeinern kann, da das Netzwerk Muster und Gesetzmäßigkeiten in den Lerndaten erkannt hat. Die Studierenden haben sich die wesentlichen Konzepte, Lösungsansätze sowie Modellierungs- und Implementierungstechniken beim Einsatz von Deep-Learning-Verfahren und der zugehörigen Frameworks zur Implementierung solcher Netzwerke angeeignet.
Durch die Anwendung des erworbenen Wissens in ergänzenden, praxisnahen Implementierungsaufgaben (Teilleistung 2) sind die Studierenden in der Lage, Fragestellungen aus dem Anwendungsfeld Computer Vision zu analysieren, durch Anwendung des behandelten Methodenspektrums auf Fragestellungen aus den behandelten Bereichen neue Lösungskonzepte zu entwerfen und algorithmisch umzusetzen sowie bestehende Lösungen zu bewerten. Nach intensiven Diskussionen während der Übungen und zur Auswertung der Python-Implementierung können die Studierenden Leistungen ihrer Mitkommilitonen richtig einschätzen und würdigen. Sie berücksichtigen Kritik, beherzigen Anmerkungen und nehmen Hinweise an.

content

Zunächst werden wichtige Grundlagen des Moduls "Neuroinformatik & maschinelles Lernen" in Kurzfassung wiederholt. Aufbauend auf diesen Grundlagen werden weiterführende Deep-Learning-Techniken des aktuellen State of the Arts vermittelt. Anschließend wird vermittelt, welche Besonderheiten bei der Einbindung der Deep-Learning-Techniken und -Architekturen in verschiedene Anwendungsbereiche beachtet werden müssen. Außerdem wird auf die praktische Anwendung der Techniken und Architekturen auf eigenen Problemstellungen und Daten eingegangen. Abschließend wird auf aktuelle Forschungsfragen eingegangen. Alle Vorlesungsinhalte werden in praxisnahen Übungen vertieft.

Detaillierte Gliederung:
1. Einführung:  Verfahrensübersicht und Eingrenzung, Lernparadigmen, Überblick bekannte Architekturen und Datensätze
2. Frameworks: Keras, TensorFlow, PyTorch (Installation, Einrichtung, Vergleich)
3. Grundlagen Neuronaler Netzwerke und mathematische Zusammenhänge
- Kurze Wiederholung  aus Vorlesung "Neuroinformatik": Formales statisches Neuron, Multi Layer Perceptron, Schichten des Convolutional Neural Networks, Backpropagation (Stochastic Gradient Descent mit Mini-Batches, Optimierungsverfahren, Regularisierungstechniken)
- Beispielhafte Umsetzung der Grundlagen aus der Wiederholung in den Frameworks Keras und PyTorch
- Komplexes Beispiel LeNet
4. Architekturen
- ImageNet-Architekturen: AlexNet, VGG, Inception, ResNet, ResNext, SE-ResNet
- Weitere bekannte Architekturen: Stochastic Depth in ResNets, DenseNet, Wide ResNet, Xception, Inception-ResNet
- Mobile Architekturen: MobileNet (Version 1, 2 & 3), SqueezeNet, ShuffleNet (Version 1 & 2), SkipNet, ENet
- Ausblick: Was gibt es noch: Autoencoder, Restricted Boltzmann Machines, Deep Belief Networks, Rekurrente Netzwerke, Capsule Networks
- Schwerpunkte bilden die Kerntechnologien der vorgestellten Architekturen: Deep-Learning-Techniken, Regularisierungsmethoden, moderne Aktivierungsfunktionen
5. Anwendungen
- Von der Klassifikation zur Detektion: Sliding Window ersetzt durch Convolution, Region Proposal
- Segmentierung: pixelgenaue Klassifikation
- Posenerkennung: Skelettpunkte des Körpers schätzen
- Wiedererkennung: Gesichtserkennung, moderne Fehlerfunktionen
- Zusammenfassung: Begriffe und Konzepte zum Nachschlagen, gebräuchliche Datensätze, Bewertungsmetriken
6. Praktische Anwendung auf eigene Problemstellungen (Best Practice Guide)
- Umgang mit Daten: Auswahl Datensätze, Datenaufbereitung, Datenaugmentierung, Datensatzaufteilung
- Auswahl der Architektur und geeigneter Deep-Learning-Techniken: Auswahl Architektur, Auswahl Fehlerfunktionen, Auswahl Regularisierungstechniken, Transfer Learning
- Auswahl geeigneter Bewertungsmaße
- Typische Probleme und abzuleitende Schlussfolgerungen
7. Probleme und aktuelle Forschung
- Ausblick mit grundlegenden Lösungen, Kernkonzepten und Verweisen auf die Literatur
- Fragestellungen sind unter anderem: Was geht in Neuronalen Netzwerken vor? Kann man Neuronalen Netzwerken vertrauen? Sind tiefe Neuronale Netzwerke für Echtzeitanwendungen schnell genug? Wie flexibel sind Neuronale Netzwerke?

media of instruction

Powerpoint-Folien (als Papierkopie oder PDF), Übungsvordrucke, Videos, Python-Quelltextbeispiele, Deep Learning Frameworks, Jupyter Notebooks, Moodle-Kurs

Link zum Moodlekurs

https://moodle2.tu-ilmenau.de/course/view.php?id=3738

literature / references

A. Rosebrock: Deep Learning for Computer Vision with Python

evaluation of teaching