課程簡介

介紹

  • Spark 和 Hadoop 功能和體系結構概述
  • 了解大數據
  • Python 程式設計基礎

開始

  • 設置 Python、Spark 和 Hadoop
  • 瞭解 Python 中的數據結構
  • 瞭解 PySpark API
  • 瞭解 HDFS 和 MapReduce

將 Spark 和 Hadoop 與 Python 集成

  • 在 Python 中實現Spark RDD
  • 使用MapReduce處理數據
  • 在HDFS中創建分散式數據集

Machine Learning 使用 Spark MLlib

處理 Big Data 和 Spark Streaming

使用推薦系統

使用 Kafka、Sqoop、Kafka 和 Flume

使用 Spark 和 Hadoop 的 Apache Mahout

故障排除

摘要和後續步驟

最低要求

  • 具有 Spark 和 Hadoop 的經驗
  • Python 程式設計經驗

觀眾

  • 數據科學家
  • 開發人員
 21 時間:

人數


每位參與者的報價

客戶評論 (3)

Provisional Upcoming Courses (Require 5+ participants)

課程分類