Reinforcement Learning, Steuerung und Optimierung – Von der Vorhersage zur Entscheidung
Was uns antreibt
Der Großteil der maschinellen Lernverfahren – einschließlich Deep Learning und probabilistischer Modelle – ist auf Vorhersagen ausgerichtet. Doch in vielen Anwendungen genügt das nicht: Unser Ziel ist nicht bloß zu wissen, wie sich ein System verhält, sondern es aktiv zu steuern – vom Auto über die Produktionslinie bis zum Roboter.
Solche entscheidungsbasierten Aufgaben sind das Einsatzfeld von Reinforcement Learning (RL), Optimierungsmethoden und intelligenter Regelungstechnik.
Unser Ansatz
Wir entwickeln neue Methoden im Reinforcement Learning und in der Optimierung, die auf die Dateneffizienz von Lernversuchen ausgelegt sind. Ziel ist es, optimale Steuerungsstrategien mit möglichst wenigen realen Versuchen zu erlernen.
- Für nicht-sequentielle Aufgaben nutzen wir fortschrittliche Verfahren der Bayesschen Optimierung.
- Für sequentielle Aufgaben – etwa Steuerungsprobleme – entwickeln wir Batch-Reinforcement-Learning-Methoden, die bestehende Daten wiederverwenden und so den Lernprozess deutlich beschleunigen.
In der Robotik verknüpfen wir visuelle Wahrnehmung und Manipulation, indem wir Deep Learning und klassische Regelung miteinander kombinieren – für adaptive, leistungsfähige Steuerungssysteme.
Anwendungsfelder
Unsere Methoden kommen überall dort zum Einsatz, wo Entscheidungen datenbasiert getroffen oder Systeme über geschlossene Regelkreise gesteuert werden müssen – z. B. in der Robotik, in der Fertigung oder in der Fahrzeugtechnik.