課程簡介

生產部署簡介

  • 部署微調模型的主要挑戰
  • 開發環境和生產環境之間的差異
  • 用於模型部署的工具和平臺

準備用於部署的模型

  • 以標準格式(ONNX、TensorFlow SavedModel 等)導出模型
  • 優化模型的延遲和輸送量
  • 在邊緣案例和真實數據上測試模型

用於模型部署的容器化

  • Docker 簡介
  • 為 ML 模型建立 Docker 個圖像
  • 容器安全性和效率的最佳實踐

使用 Kubernetes 擴展 Deployment

  • 適用於 AI 工作負載的 Kubernetes 簡介
  • 為模型託管設置 Kubernetes 集群
  • 負載均衡和水平擴展

模型監控與維護

  • 使用 Prometheus 和 Grafana 實現監控
  • 用於錯誤跟蹤和性能的自動記錄
  • 針對模型漂移和更新的重新訓練管道

確保生產安全

  • 保護用於模型推理的 API
  • 身份驗證和授權機制
  • 解決數據隱私問題

案例研究和動手實驗

  • 部署情感分析模型
  • 擴展機器翻譯服務
  • 實現對圖像分類模型的監視

總結和後續步驟

最低要求

  • 對機器學習工作流程有深入的理解
  • 微調 ML 模型的經驗
  • 熟悉 DevOps 或 MLOps 原則

觀眾

  • DevOps 名工程師
  • MLOps 從業者
  • AI 部署專家
 21 時間:

人數


每位參與者的報價

客戶評論 (1)

Provisional Upcoming Courses (Require 5+ participants)

課程分類