課程簡介

Data Analysis 和 Big Data 簡介

  • 是什麼讓 Big Data “大”?
    • 速度、體積、多樣性、準確性 (VVVV)
  • 傳統數據處理的限制
  • 分散式處理
  • 統計分析
  • Machine Learning 分析的類型
  • Data Visualization

Big Data 角色和職責

  • 管理員
  • 開發人員
  • 數據分析師

Languages 用於 Data Analysis

  • R Language
    • 為什麼 R 代表 Data Analysis?
    • 數據操作、計算和圖形顯示
  • Python
    • 為什麼 Python 而不是 Data Analysis?
    • 操作、處理、清理和處理數據

接近 Data Analysis

  • 統計分析
    • 時間序列分析
    • Forecasting 使用相關性和回歸模型
    • 推論 Statistics (估計)
    • Big Data 集合中的描述 Statistics (例如,計算平均值)
  • Machine Learning
    • 監督學習與無監督學習
    • 分類和聚類
    • 估算特定方法的成本
    • 濾波
  • 自然語言處理
    • 處理文字
    • 理解文本的含義
    • 自動文字生成
    • 情感分析 / 主題分析
  • Computer Vision
    • 獲取、處理、分析和理解圖像
    • 重建、解釋和理解 3D 場景
    • 使用圖像數據做出決策

Big Data 基礎設施

  • 數據存儲
    • 關係資料庫 (SQL)
      • MySQL
      • Postgres
      • Oracle
    • 非關係資料庫 (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4js
    • 瞭解細微差別
      • 分層資料庫
      • 面向物件的資料庫
      • 面向文件的資料庫
      • 面向圖形的資料庫
      • 其他
  • 分散式處理
    • Hadoop
      • HDFS 作為分散式文件系統
      • 用於分散式處理的 MapReduce
    • 火花
      • 用於大規模數據處理的一體化記憶體集群計算框架
      • 結構化流式處理
      • 火花 SQL
      • Machine Learning 庫:MLlib
      • 使用 GraphX 進行圖形處理
  • Scala能力
    • 公有雲
      • AWS、Google、阿裡雲等。
    • 私有雲
      • OpenStack、Cloud Foundry等。
    • 自動可擴充性

為問題選擇正確的解決方案

Big Data 的未來

總結和後續步驟

最低要求

  • 對數學的一般理解
  • 對程式設計的一般理解
  • 對資料庫的一般理解

觀眾

  • 開發人員/程式師
  • IT 顧問
 35 時間:

人數


每位參與者的報價

客戶評論 (7)

Provisional Upcoming Courses (Require 5+ participants)

課程分類