Elosztott adatfeldolgozó szoftver fejlesztése
Napjainkban a szervezeteknél keletkező adatok jelentős része heterogén formában, egymástól elszigetelt egységekben áll rendelkezésre. A strukturált adatbázisok mellett hatalmas mennyiségű információ rejtőzik strukturálatlan dokumentumokban (szöveges fájlok), amelyek feldolgozása és egységes sémába foglalása komoly kihívást jelent. A modern adatmenedzsment egyik legígéretesebb iránya az adatok gráf alapú reprezentációja, amely lehetővé teszi a rejtett összefüggések feltárását. Ezen rendszerek hatékony működtetéséhez elengedhetetlenek a skálázható, elosztott adatfeldolgozó pipeline-ok és a fejlett természetes nyelvfeldolgozó algoritmusok integrációja. A hallgató feladata egy olyan korszerű, mikroszolgáltatás alapú rendszer megtervezése és implementálása, amely képes különböző forrásokból származó adatok automatizált feldolgozására, dúsítására és gráf adatbázisban történő publikálására.