Lernen in kognitiven Systemen - Interaktive Studienpläne der TU Ilmenau

Die Interaktiven Studienpläne sind ein Informationsangebot zu den Studiengängen der TU Ilmenau.

Die rechtsverbindlichen Studienpläne entnehmen Sie bitte den jeweiligen Studien- und Prüfungsordnungen (Anlage Studienplan).

Alle Angaben zu geplanten Lehrveranstaltungen finden Sie im elektronischen Vorlesungsverzeichnis.

Bitte beachten Sie, dass auf dieser Seite keine Aktualisierungen mehr vorgenommen werden. Alle Module und Studienpläne ab der PO-Version 2021 (Bachelor- und Master-Studiengänge) sind ab sofort im Campus-Portal erreichbar.

Modulinformationen zu Modulnummer 200085 - allgemeine Informationen
Modulnummer	200085
Fakultät	Fakultät für Informatik und Automatisierung
Fachgebietsnummer	2233 (Neuroinformatik und Kognitive Robotik)
Modulverantwortliche(r)	Prof. Dr. Horst-Michael Groß
Sprache	Deutsch
Turnus	Sommersemester
Vorkenntnisse	Pflichtmodul "Neuroinformatik und Maschinelles Lernen", Wahlmodul "Deep Learning für Computer Vision"
Lernergebnisse und erworbene Kompetenzen	Im Wahlmodul "Lernen in Kognitiven Systemen" haben die Studierenden aufbauend auf den Modulen "Neuroinformatik und Maschinelles Lernen" und "Deep Learning für Computer Vision" die konzeptionellen, methodischen und algorithmischen Grundlagen des Maschinellen Lernens zum Erwerb komplexer Verhaltensleistungen in kognitiven Systemen (Autonome Systeme, Roboter, Prozessteuerungen, Spiele) durch Lernen aus Erfahrungen verstanden. Sie verfügen über Kenntnisse zur grundsätzlichen Herangehensweise dieser Form des Wissenserwerbs und zur Generierung von handlungsorientiertem Wissen aus Beobachtungen und Erfahrungen. Die Studierenden haben sich die wesentlichen Konzepte, Lösungsansätze sowie Modellierungs- und Implementierungstechniken beim Einsatz von Verfahren des Reinforcement Learnings und dessen Spielarten angeeignet. Sie sind in der Lage, praxisorientierte Fragestellungen aus dem o. g. Problemkreis zu analysieren, durch Anwendung des behandelten Methodenspektrums auf Fragestellungen aus den behandelten Bereichen neue Lösungskonzepte zu entwerfen und algorithmisch umzusetzen sowie bestehende Lösungen zu bewerten. Vor- und Nachteile der Komponenten und Verfahren im Kontext praktischer Anwendungen sind den Studierenden bekannt. Nach intensiven Diskussionen während der Übungen und zur Auswertung der Python-Implementierung (Teilleistung 2) können die Studierenden Leistungen ihrer Mitkommilitonen richtig einschätzen und würdigen. Sie berücksichtigen Kritik, beherzigen Anmerkungen und nehmen Hinweise an.
Inhalt	Das Modul vermittelt das erforderliche Methodenspektrum aus theoretischen Grundkenntnissen und praktischen Fähigkeiten zum Verständnis, zur Implementierung und zur Anwendung neuronaler und probabilistischer Techniken des Erwerbs von Handlungswissen durch Lernen aus evaluativ bewerteten Erfahrungsbeispielen. Sie vermittelt sowohl Faktenwissen, begriffliches und algorithmisches Wissen aus folgenden Themenkomplexen: Begriffliche Grundlagen: Verhalten; Agent; Zweck und Bedeutung von Lernprozessen; Stability-Plasticity Dilemma; Exploration-Exploitation Dilemma Reinforcement Learning (RL): Grundidee des RL; General RL-Task; Schwache und starke RL-Verfahren, RL als Markov Decision Process (MDP); Basiskomponenten eines RL-Agenten; Value/Action-Value Iteration und das Bellman´sche Optimalitätsprinzip; Q-Learning, Boltzmann-Aktionsauswahl; SARSA-Learning; On-policy und off-policy Verfahren; Eligibility Traces; RL und teilweise Beobachtbarkeit; Lösungsansätze zur Behandlung von POMDP Neuronale Umsetzung von RL-Agenten: Value Approximation am Beispiel TD-Gammon; NFQ-Verfahren; ADHDP-Verfahren; Grundidee von Policy Search Algorithmen Deep Reinforcement Learning (DRL) als Form des End-to-End Learnings: Atari Deep RL; AlphaGo; DeepControl Learning Classifier Systems (LCS) Multi-Agenten Systeme (MAS); Motivation und Arten von Multi-Agentensystemen; Konzepte zur Koordinierung von Agenten; Koordination mittels W-Lernen Exemplarische Software-Implementierungen von RL-Verfahren für Navigationsaufgaben, Spiele, Prozesssteuerungen (Teilleistung 2) Im Rahmen der Teilleistung 2 sollen in C++ oder Python eigene Plugins zur Anwendung des Reinforcement Learnings am Beispiel der Roboternavigation im Simulator erstellt und experimentell untersucht werden.
Medienformen und technische Anforderungen bei Lehr- und Abschlussleistungen in elektronischer Form	Präsenzvorlesung mit Powerpoint, Arbeitsblätter zur Vorlesung, Übungsaufgaben, Videos, Python Apps, studentische Demo-Programme, e-Learning mittels "Jupyter Notebook"
Literatur	- Sutton, R., Barto, A. Reinforcement Learning - An Introduction. MIT Press 1998 / 2018 http://incompleteideas.net/book/RLbook2018.pdf )- Alpaydin, Ethem. Maschinelles Lernen, Oldenbourg Verlag, 2008 - Bishop, Chr. Neural Networks for Patter Recognition, Oxford Press 1997
Lehrevaluation

Spezifik Referenzmodul
Modulname	Lernen in kognitiven Systemen
Prüfungsnummer	220455
Leistungspunkte	5
SWS	4 (2 V, 1 Ü, 1 P)
Präsenzstudium (h)	45
Selbststudium (h)	105
Verpflichtung	Pflichtmodul
Abschluss	Prüfungsleistung mit mehreren Teilleistungen
Details zum Abschluss	Das Modul Lernen in kognitiven Systemen mit der Prüfungsnummer 220455 schließt mit folgenden Leistungen ab: schriftliche Prüfungsleistung über 90 Minuten mit einer Wichtung von 100% (Prüfungsnummer: 2200743) alternative semesterbegleitende Studienleistung mit einer Wichtung von 0% (Prüfungsnummer: 2200744) Details zum Abschluss Teilleistung 2: eigene C++ oder Python-Implementierungen und Übungsaufgaben
Link zum Moodle-Kurs
Lehrende	Prof. Dr. Groß, Horst-Michael
Anmeldemodalitäten für alternative PL oder SL	Dieses Modul enthält mindestens eine alternative semesterbegleitende Abschlussleistung. Bitte beachten Sie, dass diese in der Regel schon zu Beginn des Semesters, in dem diese angeboten wird, angemeldet werden muss. Über die Details und Zeiträume dazu werden Sie vom Lehrenden und/oder dem Prüfungsamt informiert. Fragen Sie gegebenenfalls unbedingt beim Lehrenden nach. This module contains at least one alternative exam part. Please note that this must usually be registered at the beginning of the semester in which it is offered. The lecturer and/or the examination office will inform you about the details and time periods. If necessary, be sure to ask the lecturer.
max. Teilnehmerzahl

Spezifik im Studiengang Master Informatik 2013, Master Ingenieurinformatik 2014, Master Technische Kybernetik und Systemtheorie 2021, Master Informatik 2021, Master Ingenieurinformatik 2021, Master Biomedizinische Technik 2021
Modulname	Lernen in kognitiven Systemen
Prüfungsnummer	220455
Leistungspunkte	5
Präsenzstudium (h)	45
Selbststudium (h)	105
Verpflichtung	Wahlmodul
Abschluss	Prüfungsleistung mit mehreren Teilleistungen
Details zum Abschluss	Das Modul Lernen in kognitiven Systemen mit der Prüfungsnummer 220455 schließt mit folgenden Leistungen ab: schriftliche Prüfungsleistung über 90 Minuten mit einer Wichtung von 100% (Prüfungsnummer: 2200743) alternative semesterbegleitende Studienleistung mit einer Wichtung von 0% (Prüfungsnummer: 2200744) Details zum Abschluss Teilleistung 2: eigene C++ oder Python-Implementierungen und Übungsaufgaben
Link zum Moodle-Kurs
Anmeldemodalitäten für alternative PL oder SL	Dieses Modul enthält mindestens eine alternative semesterbegleitende Abschlussleistung. Bitte beachten Sie, dass diese in der Regel schon zu Beginn des Semesters, in dem diese angeboten wird, angemeldet werden muss. Über die Details und Zeiträume dazu werden Sie vom Lehrenden und/oder dem Prüfungsamt informiert. Fragen Sie gegebenenfalls unbedingt beim Lehrenden nach. This module contains at least one alternative exam part. Please note that this must usually be registered at the beginning of the semester in which it is offered. The lecturer and/or the examination office will inform you about the details and time periods. If necessary, be sure to ask the lecturer.
max. Teilnehmerzahl