課程簡介

Day One:語言基礎

  • 課程介紹
  • 關於 Data Science
    • Data Science 定義
    • 做的過程 Data Science。
  • 簡介 R Language
  • 變數和類型
  • 控制結構 (Loops / Conditionals)
  • R Scalars、向量和矩陣
    • 定義 R 向量
    • 預科
  • 字串和文本操作
    • 字元數據類型
    • 檔IO
  • 清單
  • 功能
    • 函數介紹
    • 閉包
    • lapply/sapply 函數
  • 數據幀
  • 所有部分的實驗室

第二天:中級 R Programming

  • 數據幀和文件 I/O
  • 從文件中讀取數據
  • 數據準備
  • 內置數據集
  • 可視化
    • 圖形包
    • plot() / barplot() / hist() / boxplot() / scatter plot
    • 熱圖
    • ggplot2 包 (qplot(), ggplot())
  • 使用 Dplyr 進行探索
  • 所有部分的實驗室

第3天:高級 Programming 與 R

  • 使用 R 進行統計建模
    • 統計函數
    • 處理 NA
    • 分佈(Binomial、Poisson、Normal)
  • 回歸
    • 線性回歸介紹
  • 推薦
  • 文本處理(tm 包 / Wordclouds)
  • 聚類
    • 聚類介紹
    • KMeans
  • 分類
    • 分類介紹
    • 朴素貝葉斯
    • 決策樹
    • 使用 caret 包進行訓練
    • 評估算法
  • R 和 Big Data
    • 將 R 連接到數據庫
    • Big Data 生態系統
  • 所有部分的實驗室

最低要求

  • 有基本程式設計背景者優先
  • 最新的R studio 和 R環境已安裝
 21 時間:

人數


每位參與者的報價

客戶評論 (7)

Provisional Upcoming Courses (Require 5+ participants)

課程分類