ENGLISH / MAGYAR
Kövess
minket

Keresési és tárolási hatékonyság növelése nagyon nagy méretű malware adattárakban

2020-2021/I.
Dr. Buttyán Levente

A nagy méretű malware adattárakban, melyeket az anti-vírus és más malware-rel foglalkozó cégek historikus malware minták tárolására használnak, két fontos feladat a gyors keresés a minták között és a minták minél költségtakarékosabb tárolása. Mivel a malware adattárak mérete több száz Terrabyte lehet, ezen feladatok megoldása nem triviális. 

A diplomaterv feladat célja a fenti kontextusban a keresési és tárolási hatékonyság növelésére alkalmas módszerek azonosítása, vizsgálata, majd alkalmas módszerek kiválasztása, és azokra építve egy olyan keretrendszer kifejlesztése, mely prototípusként szolgálhat egy új generációs malware adattár megvalósítás számára. Mind a keresés, mind pedig a tárolás hatékonyságának javításában kihasználható, hogy az egy családba tartozó malware minták sokszor nagy mértékben hasonlítanak egymásra és ez a hasonlóság bináris szinten mérhető. Így a keresés hatékonysága növelhető, ha nem pontos egyezésekre keresünk, hanem megelégszünk egy adott mintához hasonló mintákkal is. Ráadásul ez a fajta keresés önmagában is hasznos lehet egy új malware minta elemzése során. A tárolás hatékonyságának javításában a hasonlóságokat úgy lehet kihasználni, hogy a mintákat nem egyedileg tároljuk, hanem hasonló mintákat tartalmazó minta halmazokat tárolunk úgy, hogy egy reprezentáns elemet a halmazból teljesen tárolunk, még a halmaz többi elemére csak a reprezentáns elemhez képesti különbségeket tároljuk. 

A hallgató feladat tehát a fenti ötletekre épülő keretrendszer megtervezése és prototípus szintű implementációja, az elkészült megvalósítás tesztelése, teljesítményének vizsgálata, használhatóságának értékelése, és esetleges korlátainak azonosítása.


1
1