Lernen in kognitiven Systemen


 

Hinweis:

Tragen Sie sich bitte MIT IHRER UNI-EMAILADRESSE in den Mailverteiler zu dieser Vorlesung ein, um den Einschreibeschlüssel für den moodle-Kurs  sowie aktuelle Informationen zu erhalten.

Senden Sie dazu eine E-Mail mit dem Betreff: Eintrag in die Liste LKS an folgende Adresse: lks@tu-ilmenau.de.

Sie erhalten als Antwort den Hinweis, dass Ihre E-Mail zurückgehalten wird, bis der Moderator diese genehmigt hat. Das kann bis zu einem Tag dauern, am Wochenende auch länger. Sobald Sie in die Liste aufgenommen sind, erhalten Sie eine entsprechende Willkommensnachricht.



Lehrinhalte:

Die Lehrveranstaltung vermittelt das erforderliche Methodenspektrum aus theoretischen Grundkenntnissen und praktischen Fähigkeiten zum Verständnis, zur Implementierung und zur Anwendung neuronaler und probabilistischer Techniken des Erwerbs von Handlungswissen durch Lernen aus evaluativ bewerteten Erfahrungsbeispielen. Sie vermittelt sowohl Faktenwissen, begriffliches und algorithmisches Wissen aus folgenden Themenkomplexen:

  • Begriffliche Grundlagen: Verhalten; Agent; Zweck und Bedeutung von Lernprozessen; Stability-Plasticity Dilemma; Exploration-Exploitation Dilemma
  • Reinforcement Learning (RL): Grundidee des RL; General RL-Task; Schwache und starke RL-Verfahren, RL als Markov Decision Process (MDP); Basiskomponenten eines RL-Agenten; Value/Action-Value Iteration und das Bellman´sche Optimalitätsprinzip; Q-Learning, Boltzmann-Aktionsauswahl; SARSA-Learning; On-policy und off-policy Verfahren; Eligibility Traces; RL und teilweise Beobachtbarkeit; Lösungsansätze zur Behandlung von POMDP
  • Neuronale Umsetzung von RL-Agenten: Value Approximation am Beispiel TD-Gammon; NFQ-Verfahren; ADHDP-Verfahren; Grundidee von Policy Search Algorithmen
  • Deep Reinforcement Learning (DRL) als Form des End-to-End Learnings: Atari Deep RL; AlphaGo
  • Learning Classifier Systems (LCS)
  • Imitation Learning
  • Multi-Agenten Systeme (MAS); Motivation und Arten von Multi-Agentensystemen; Konzepte zur Koordinierung von Agenten; Koordination mittels W-Lernen
  • Exemplarische Software-Implementierungen von RL-Verfahren für Navigationsaufgaben, Spiele, Prozesssteuerungen

Im Rahmen des Pflichtpraktikums sollen in C++ oder Python eigene Plugins zur Anwendung des Reinforcement Learnings am Beispiel der Roboternavigation im Simulator erstellt und experimentell untersucht werden.


 

Weitere Informationen:

Aktuelle Modultafel
Lehrmaterialien im moodle-Kurs Lernen in Kognitiven Systemen SS 2021