XVIII. Innováció és Fenntartható Felszíni Közlekedés (IFFK) Konferencia – 2024. augusztus 27-28.
Megerősítéses tanulás alapú robusztus járműirányítás autonóm járművek pályakövetésére
Ezen publikáció egy új módszert mutat be, mellyel megerősítéses tanulás alapú irányítási módszerek ötvözhetők klasszikus robusztus irányítási metódusokkal. A kombináció révén egy magas minőségi kritériumokat teljesítő robusztus irányítási rendszer adódik. Az ismertetett módszer egy autonóm jármű irányításán keresztül kerül bemutatásra. A megerősítéses tanulás során választott jutalom függvény megválasztásával különféle vezetési stílusok valósíthatók meg, pl. köridő minimalizálás, pályakövetés, utazási kényelem. A neurális hálózat tanítása a Proximal Policy Optimization algoritmussal történt, a robusztus irányítás pedig H-végtelen alapú. A két szabályzó egy felügyelő struktúra segítségével kerül kombinálásra, melyben egy kvadratikus optimalizálási feladat valósul meg. A módszer eredményeként egy olyan irányítási struktúra adódik, mely a jármú hossz- és oldalirányú irányítását is megvalósítja a referenciasebesség és a kormányszög előírásával. Az algoritmus hatékonysága szimulációkon keresztül kerül bemutatásra.