ENGLISH / MAGYAR
Kövess
minket

Analytics and Machine Learning Platform - CDH Configuration Clustering

2018-2019/II.
Dr. Huszák Árpád

A Cloudera Distribution of Hadoop (CDH) egy modern, gépi tanulást és
elemzést támogató platform nagy adatmennyiségek kezelésére. Egy CDH
rendszer akár több mint 25 nyílt forráskódú komponensből tevődhet össze,
melyek így nagy teret adnak a konfigurálhatóságnak. Mivel minden
felhasználó igénye más, ezért eltérő beállításokkal lehet optimális teljesítmény
elérni. A hallgató feladata, hogy a több terrabyte-nyi összegyűjtött
felhasználói beállítás és mért teljesítmény-információ alapján meghatározza,
hogy különböző típusú szolgáltatások esetén milyen rendszerkonfigurációt
érdemes alkalmazni és melyek a legfontosabb teljesítményre ható
konfigurációs paraméterek.


1
1