Merevlemezek élettartamának előrejelzése gépi tanulással
2017-2018/II.
Dr. Horváth Gábor
Napjainkban a különféle műszaki rendszerek, berendezések a normál operáció mellett a háttérben folyamatosan méréseket végeznek, és adatokat gyűjtenek a saját és a környezetük állapotáról. Ha a mérési adatok elegendően nagy mennyiségben állnak rendelkezésre, akkor lehetővé válik ezek adatbányászati eszközökkel való elemzése, melynek során különféle, nem nyilvánvaló összefüggések derülhetnek ki.
A hallgató feladata a merevlemezek S.M.A.R.T adataiból származó "Backblaze" adatsor elemzése, és ennek alapján a merevlemez meghibásodási idejének, hátralévő élettartamának becslése.
A feladatok a következők:
- Végezzen adattisztítást a nem informatív változók, illetve megfigyelések törlésével!
- Végezze el a változók (S.M.A.R.T. adatok) statisztikai vizsgálatát, illetve a változók páronkénti korrelációját!
- Ellenőrizze a meghibásodás előrejelezhetőségét a meghibásodás előtt álló és meghibásodástól időben távol álló adatok statisztikáinak összehasonlításával!
- Válassza ki az erőrejelzés alapjául szolgáló változókat, majd alakítson ki tanuló-, validációs- és teszthalmazt a gépi tanuláshoz!
- Ismertessen és használjon több gépi tanuló algoritmust a meghibásodás előrejelzéséhez, és hasonlítsa össze ezek előrejelzési pontosságát!
1
1