GenAI alkalmazása megerősítéses tanulás módszerekben autonóm rendszerek irányítására
A megerősítéses gépi tanulás egy olyan gépi tanulási megközelítés, amelyben az algoritmus egy környezettel interakcióba lépve tanul, tapasztalatai alapján jutalmak és büntetések rendszerén keresztül. Ezzel a módszerrel az algoritmus a cselekvéseinek következményeit kiértékelve folyamatosan optimalizálja a döntéseit, célja pedig a hosszú távú jutalom maximalizálása.
A generatív mesterséges intelligencia (GenAI) képes lehet a megerősítéses tanulás (RL) hatékonyságát javítani azáltal, javítani tudja az alacsony mintavételi hatékonyság és a gyenge általánosíthatóság okozta problémákat. Képes szintetikus tanítási adatokat és szenáriókat generálni, nagy dimenziójú állapotokat tömöríteni, és ritka vagy támadó (security) forgatókönyveket létrehozni a robusztusság javítása érdekében. A GAN-ok, VAE-k és diffúziós folyamatok integrálásával a GenAI lehetővé teszi az RL-ügynökök számára, hogy gyorsabban tanuljanak, alkalmazkodjanak a láthatatlan körülményekhez és stabilabb döntéseket hozzanak. A GenAI és a megerősítéses tanulás ötvözése képes lehet megbízhatóbb autonóm rendszerek létrehozására.
A hallgató feladata a koncepció megvalósítása és vizsgálata egy egyszerű irányítási környezetben.