http://www.tu-ilmenau.de

Logo TU Ilmenau


Ansprechpartner

Univ.-Prof. Dr.-Ing. Horst-Michael Groß

Head of department

Telefon +49 3677 692858

E-Mail senden

INHALTE

LKS - Lernen in kognitiven Systemen

Hinweise

Tragen Sie sich bitte MIT IHRER UNI-EMAILADRESSE in den Mailverteiler zu dieser Vorlesung ein, um den Einschreibeschlüssel für den moodle-Kurs  sowie aktuelle Informationen zu erhalten.

Senden Sie dazu eine E-Mail mit dem Betreff:
Eintrag in die Liste LKS
an folgende Adresse: lks@tu-ilmenau.de.

Sie erhalten als Antwort den Hinweis, dass Ihre E-Mail zurückgehalten wird, bis der Moderator diese genehmigt hat. Das kann bis zu einem Tag dauern, am Wochenende auch länger. Sobald Sie in die Liste aufgenommen sind, erhalten Sie eine entsprechende Willkommensnachricht.


Lehrinhalte

Die Lehrveranstaltung vermittelt das erforderliche Methodenspektrum aus theoretischen Grundkenntnissen und praktischen Fähigkeiten zum Verständnis, zur Implementierung und zur Anwendung neuronaler und probabilistischer Techniken des Erwerbs von Handlungswissen durch Lernen aus evaluativ bewerteten Erfahrungsbeispielen. Sie vermittelt sowohl Faktenwissen, begriffliches und algorithmisches Wissen aus folgenden Themenkomplexen:

  • Begriffliche Grundlagen: Verhalten; Agent; Zweck und Bedeutung von Lernprozessen; Stability-Plasticity Dilemma; Exploration-Exploitation Dilemma

  • Reinforcement Learning (RL): Grundidee des RL; General RL-Task; Schwache und starke RL-Verfahren, RL als Markov Decision Process (MDP); Basiskomponenten eines RL-Agenten; Value/Action-Value Iteration und das Bellman´sche Optimalitätsprinzip; Q-Learning, Boltzmann-Aktionsauswahl; SARSA-Learning; On-policy und off-policy Verfahren; Eligibility Traces; RL und teilweise Beobachtbarkeit; Lösungsansätze zur Behandlung von POMDP

  • Neuronale Umsetzung von RL-Agenten: Value Approximation am Beispiel TD-Gammon; NFQ-Verfahren; ADHDP-Verfahren; Grundidee von Policy Search Algorithmen

  • Deep Reinforcement Learning (DRL) als Form des End-to-End Learnings: Atari Deep RL; AlphaGo
  • Learning Classifier Systems (LCS)

  • Imitation Learning
  • Multi-Agenten Systeme (MAS); Motivation und Arten von Multi-Agentensystemen; Konzepte zur Koordinierung von Agenten; Koordination mittels W-Lernen

  • Exemplarische Software-Implementierungen von RL-Verfahren für Navigationsaufgaben, Spiele, Prozesssteuerungen

Im Rahmen des Pflichtpraktikums sollen in C++ oder Python eigene Plugins zur Anwendung des Reinforcement Learnings am Beispiel der Roboternavigation im Simulator erstellt und experimentell untersucht werden.


Vorlesungsskript & Prüfungsschwerpunkte SS 2020