課程簡介

多模態AI及其應用概覽

  • 文本、圖像和音頻數據集成的挑戰
  • 最先進的研究和進展
  • 多模態AI的應用概覽

數據處理和特徵工程

  • 處理文本、圖像和音頻數據集
  • 多模態學習的預處理技術
  • 特徵提取和數據融合策略

使用Py及及結合不同模態的統一AI模型的Transformer進行NLP和計VISION任務

  • Py的多模態學習介紹
  • 使用Transformers進行NLP和計VISION任務
  • 使用Py及和清華大學的Transformers進行NLP和計VISION任務

實現語音、視覺和文本融合

  • 集成Whisper進行語音識別
  • 應用Deep進行圖像處理
  • 交叉模態學習的融合技術

訓練和優化模型

  • 多模態AI的模型訓練策略
  • 優化技術和超參數調整
  • 處理偏見和提高模型泛化能力

在實際應用中部署模型

  • 導出模型以供生產使用
  • 在雲平台上部署AI模型
  • 性能監控和模型維護

總結和結論

最低要求

  • 對機器學習和深度學習概念有深入的了解
  • 對PyTorch或TensorFlow等人工智慧框架有經驗
  • 對文本、圖像和音頻數據處理有一定的了解

觀眾

  • AI 開發人員
  • 機器學習工程師
  • 研究人員
 21 時間:

人數


每位參與者的報價

Provisional Upcoming Courses (Require 5+ participants)

課程分類