ENGLISH / MAGYAR
Kövess
minket

Adatfolyam-bányászat

2019-2020/I.
Dr. Pekár Adrián

 

Az adatfolyam (data stream) adatainak kezelése különösen nehéz feladat, mivel folyamatosan, több forrásból és eszközből származnak, és sokféle formátumban kerülnek szállításra. Az egyik legjobb példa az IoT adatok rendszerezése és valós idejű feldolgozása. Az IoT eszközök esetében az adatok folyamatosan áramlanak; nincs kezdet és nincs vég. A folyamatos adatáramlás és a különböző adattípusok miatt a hagyományos feldolgozási megközelítés nem nyújt effektív, költséghatékony és megbízható megoldást.

 

 

Az ilyen, kombinált adatfolyamokból származó információk kinyerése különösen nagy kihívást jelent a nagy sebesség és volumen miatt. A hallgató feladata ezen kombinált adatfolyamokból származó információ kinyerése és feldolgozása lesz, felhasználva hozzá valós idejű adatbányászati és gépi tanulási módszereket is. 

 

 

A téma kidolgozása során a hallgató gyakorlati tapasztalatot szerezhet az adatfolyam-feldolgozás (Apache Kafka, Kafka Streams, stb.) és adatfolyam-bányászat (MOA keretrendszer) területeken amellett, hogy az ehhez szükséges elméleti tudást is megkapja.

 

Szükséges ismeretek: Java vagy Python; kiváló angol nyelvtudás (főleg szövegértelmezéshez).

 


3
0