課程綱要

巨量資料分析技術與應用

課程名稱:

(中文)巨量資料分析技術與應用
(英文)Big Data Analytics Techniques and Applications

授課教師:曾新穆

課程大綱 :

  1. Overview of Big Data
  2. Landscape and System Architecture of Big Data
  3. Big Data Techniques Platform
  4. Big Data Analytics Workflow and Techniques
    1. Data Processing
    2. Feature Analysis
    3. Learning and Modeling
    4. Post-Processing
    5. Model Evaluation and Deployment
  5. Parallel and Distributed Data Processing
  6. Data Mining Algorithms
  7. Statistical Methods
  8. Machine Learning Methods
  9. Association Analysis in Big Data
  10. Sequence Patterns Analysis in Big Data
  11. Clustering Analysis in Big Data
  12. Classification Modeling in Big Data
  13. Big Graph and Network Analysis
  14. Big Data Visualization
  15. Applications Study
    1. Mobile and Sensing Networks
    2. Smart Commerce
    3. Social Media
    4. Intelligent Medicine and Healthcare
    5. Advanced Manufacturing
  16. Project Implementation and Demo

 

評量方法 :

本課程之評量主要包含四個實作作業(各佔15%),一個Term Project (30%)專題實作,以及對課程出席及參與討論之Participation (10%)。四個實作作業包含:

  1. 基本的資料分析軟體R /Weka/Sci-learn之實作演練
  2. Map-Reduce 平行化程式實作
  3. Spark分散式巨量資料實作
  4. Mahout 巨量資料探勘Library實作

另外,Term Project 專題實作部分,將讓修習本課程之學生參考如Kaggle (為目前極為熱門之資料科學比賽平台)等平台, 從中選擇如 Mobile and Sensing Networks, Social Media, Smart Commerce, Intelligent Medicine and Healthcare, Advanced Manufacturing等領域之資料及議題作為學期專題, 運用巨量資料分析技術進行分析實作;並於期末以Workshop方式安排學生報告其研究問題,資料來源及描述,所採用的資料分析工具及方法, 評估方式, 以及實作結果呈現等,並依其專題規劃之完整性、深度及創新性評量其成績。