ENGLISH / MAGYAR
Kövess
minket

Számítógép-hálózatok adatfolyamainak feldolgozása

2019-2020/II.
Dr. Pekár Adrián

Az adatfolyam (data stream) adatainak kezelése különösen nehéz feladat, mivel folyamatosan, több forrásból és eszközből származnak, és sokféle formátumban kerülnek szállításra. A folyamatos adatáramlás és a különböző adattípusok miatt a hagyományos feldolgozási megközelítés nem nyújt effektív, költséghatékony és megbízható megoldást.

Az ilyen, kombinált adatfolyamokból származó információk kinyerése különösen nagy kihívást jelent a nagy sebesség és volumen miatt. A hallgató feladata ezen kombinált adatfolyamokból származó információ kinyerése és feldolgozása lesz, felhasználva hozzá valós idejű adatbányászati és gépi tanulási módszereket is.  

A téma kidolgozása során a hallgató gyakorlati tapasztalatot szerezhet az adatfolyam-feldolgozás (Apache Kafka, Kafka Streams, stb.) és adatfolyam-bányászat (MOA keretrendszer) területeken amellett, hogy az ehhez szükséges elméleti tudást is megkapja.

Szükséges ismeretek: Python; kiváló angol nyelvtudás; alapvető számítógép hálózati ismeretek; virtualizációs ismeretek.


2
2