平台評估

巨量資料分析技術與應用

本課程實作平台分為基本的資料分析程式語言環境與分散式巨量資料處理平台。在基本資料分析程式語言中, 將使用單機版之作業系統, 如 Window, MAC, Linux 等, 學生可以安裝 R/Weka/Pyton 等資料分析程式撰寫環境, 在單機的狀態下, 先習得基本的資料分析實作演練能力。在分散式巨量資料處理平台中,學員將建構 Hadoop 為主的分散式環境,在此環境下, 將進一步安裝及使用 Hbase/MonogoDB, Spark, Mahout 等巨量資料儲存與分析軟體,並在此分散式平台下進行資料分析的實作演練。上述實驗實作平台之規劃,主要考量先由單機環境讓學生快速方便習得R/Weka/Pyton 等最常用之資料分析程式之實作能力。進而,考量目前在巨量資料處理平台中以Hadoop 分散式環境為主流架構,而在巨量資料儲存與分析方面以Hbase/MonogoDB, Spark, Mahout等最具代表性,因此在實驗實作平台上作此選擇搭配,讓學員能接觸學習到這些最具代表性之平台並具其實作能力,以符合學術研究及產業應用上之趨勢與能力需求。