課程簡介

優化大型模型簡介

  • 大型模型體系結構概述
  • 微調大型模型的挑戰
  • 成本效益優化的重要性

分散式訓練技術

  • 數據和模型並行性簡介
  • 分散式訓練框架:PyTorch 和 TensorFlow
  • 跨多個 GPU 和節點擴展

模型量化和修剪

  • 瞭解量化技術
  • 應用修剪以減小模型大小
  • 準確性和效率之間的權衡

硬體優化

  • 為微調任務選擇合適的硬體
  • 優化 GPU 和 TPU 利用率
  • 對大型模型使用專用加速器

高效 Data Management

  • 管理大型數據集的策略
  • 性能的預處理和批處理
  • 數據增強技術

部署優化的模型

  • 部署微調模型的技術
  • 監控和維護模型性能
  • 優化模型部署的真實示例

高級優化技術

  • 探索低秩適應 (LoRA)
  • 使用適配器進行模組化微調
  • 模型優化的未來趨勢

總結和後續步驟

最低要求

  • 使用 PyTorch 或 TensorFlow 等深度學習框架的經驗
  • 熟悉大型語言模型及其應用程式
  • 了解分散式計算概念

觀眾

  • 機器學習工程師
  • 雲 AI 專家
 21 時間:

人數


每位參與者的報價

Provisional Upcoming Courses (Require 5+ participants)

課程分類