Anzahl der Treffer: 493
Erstellt: Thu, 02 May 2024 23:13:25 +0200 in 0.0926 sec


Müller, Steffen; Sprenger, Sina; Groß, Horst-Michael;
OfficeMate: a study of an online learning dialog system for mobile assistive robots. - In: ADAPTIVE 2014, ISBN 978-1-63266-616-1, (2014), S. 104-110

Stricker, Ronny; Müller, Steffen; Müller, Steffen *1979-*; Groß, Horst-Michael;
Non-contact video-based pulse rate measurement on a mobile service robot. - In: RO-MAN: the 23rd IEEE International Symposium on Robot and Human Interactive Communication, 2014, ISBN 978-1-4799-6766-7, (2014), S. 1056-1062

http://dx.doi.org/10.1109/ROMAN.2014.6926392
Müller, Steffen; Sprenger, Sina; Groß, Horst-Michael;
Online adaptation of dialog strategies based on probabilistic planning. - In: RO-MAN: the 23rd IEEE International Symposium on Robot and Human Interactive Communication, 2014, ISBN 978-1-4799-6766-7, (2014), S. 692-697

http://dx.doi.org/10.1109/ROMAN.2014.6926333
Weinrich, Christoph; Wengefeld, Tim; Schröter, Christof; Groß, Horst-Michael
People detection and distinction of their walking aids in 2D laser range data based on generic distance-invariant features. - In: RO-MAN: the 23rd IEEE International Symposium on Robot and Human Interactive Communication, 2014, ISBN 978-1-4799-6766-7, (2014), S. 767-773

http://dx.doi.org/10.1109/ROMAN.2014.6926346
Hans, Alexander;
Advancing the applicability of reinforcement learning to autonomous control, 2014. - Online-Ressource (PDF-Datei: XII, 146 S., 1,49 MB) : Ilmenau, Techn. Univ., Diss., 2014

Mit dateneffizientem Reinforcement Learning (RL) konnten beeindruckende Ergebnisse erzielt werden, z.B. für die Regelung von Gasturbinen. In der Praxis erfordert die Anwendung von RL jedoch noch viel manuelle Arbeit, was bisher RL für die autonome Regelung untauglich erscheinen ließ. Die vorliegende Arbeit adressiert einige der verbleibenden Probleme, insbesondere in Bezug auf die Zuverlässigkeit der Policy-Erstellung. Es werden zunächst RL-Probleme mit diskreten Zustands- und Aktionsräumen betrachtet. Für solche Probleme wird häufig ein MDP aus Beobachtungen geschätzt, um dann auf Basis dieser MDP-Schätzung eine Policy abzuleiten. Die Arbeit beschreibt, wie die Schätzer-Unsicherheit des MDP in die Policy-Erstellung eingebracht werden kann, um mit diesem Wissen das Risiko einer schlechten Policy aufgrund einer fehlerhaften MDP-Schätzung zu verringern. Außerdem wird so effiziente Exploration sowie Policy-Bewertung ermöglicht. Anschließend wendet sich die Arbeit Problemen mit kontinuierlichen Zustandsräumen zu und konzentriert sich auf auf RL-Verfahren, welche auf Fitted Q-Iteration (FQI) basieren, insbesondere Neural Fitted Q-Iteration (NFQ). Zwar ist NFQ sehr dateneffizient, jedoch nicht so zuverlässig, wie für die autonome Regelung nötig wäre. Die Arbeit schlägt die Verwendung von Ensembles vor, um die Zuverlässigkeit von NFQ zu erhöhen. Es werden eine Reihe von Möglichkeiten der Ensemble-Nutzung entworfen und evaluiert. Bei allen betrachteten RL-Problemen sorgen Ensembles für eine zuverlässigere Erstellung guter Policies. Im nächsten Schritt werden Möglichkeiten der Policy-Bewertung bei kontinuierlichen Zustandsräumen besprochen. Die Arbeit schlägt vor, FittedPolicy Evaluation (FPE), eine Variante von FQI für Policy Evaluation, mit anderen Regressionsverfahren und/oder anderen Datensätzen zu kombinieren, um ein Maß für die Policy-Qualität zu erhalten. Experimente zeigen, dass Extra-Tree-FPE ein realistisches Qualitätsmaß für NFQ-generierte Policies liefern kann. Schließlich kombiniert die Arbeit Ensembles und Policy-Bewertung, um mit sich ändernden RL-Problemen umzugehen. Der wesentliche Beitrag ist das Evolving Ensemble, dessen Policy sich langsam ändert, indem alte, untaugliche Policies entfernt und neue hinzugefügt werden. Es zeigt sich, dass das Evolving Ensemble deutlich besser funktioniert als einfachere Ansätze.



http://www.db-thueringen.de/servlets/DocumentServlet?id=24739
Klingelschmitt, Stefan; Platho, Matthias; Groß, Horst-Michael; Willert, Volker; Eggert, Julian
Combining behavior and situation information for reliably estimating multiple intentions. - In: IEEE Intelligent Vehicles Symposium proceedings, 2014, ISBN 978-1-4799-3639-7, (2014), S. 388-393

http://dx.doi.org/10.1109/IVS.2014.6856552
Scheidig, Andrea; Schröter, Christof; Volkhardt, Michael; Müller, Steffen; Debes, Klaus; Groß, Horst-Michael; Döring, Nicola; Richter, Katja
SERROGA: Servicerobotik für die Gesundheitsassistenz im nutzerzentrierten Entwurf. - In: Wohnen - Pflege - Teilhabe, ISBN 978-3-8007-3574-7, (2014), insges. 8 S.

Schröter, Christof; Müller, Steffen; Volkhardt, Michael; Einhorn, Erik; Groß, Horst-Michael; Huijnen, Claire; Heuvel, Herjan van den; Berlo, Ad van; Bley, Andreas
CompanionAble - ein robotischer Assistent und Begleiter für Menschen mit leichter kognitiver Beeinträchtigung. - In: Wohnen - Pflege - Teilhabe, ISBN 978-3-8007-3574-7, (2014), insges. 8 S.

Vollmer, Christian; Hellbach, Sven; Eggert, Julian; Groß, Horst-Michael
Sparse coding of human motion trajectories with non-negative matrix factorization. - In: Neurocomputing, ISSN 1872-8286, Bd. 124 (2014), S. 22-32

https://doi.org/10.1016/j.neucom.2012.12.054
Keßler, Jens; Debes, Klaus; Groß, Horst-Michael
Adaptable ambient living assistant - ALIAS : Teilvorhaben: Häusliche Navigation im sozialen Kontext betreuungsbedürftiger Bewohner im altersgerechten Umfeld - SENSIBEL ; Abschlussbericht ; Berichtszeitraum: 15.07.2010 - 30.06.2013. - Ilmenau : Univ., Fak. Informatik und Automatisierung. - Online-Ressource (16 S., 697 KB)Förderkennzeichen BMBF 16SV4006. - Verbund-Nr. 01080022. - Engl. Berichtsbl. u.d.T.: Final report on the adaptable ambient living assistant (ALIAS) project

https://edocs.tib.eu/files/e01fb14/813183685.pdf