課程簡介

I. 引言和序言

1. 概述

  • 使 R 更友好,R 和可用的 GUI
  • 雷工作室
  • 相關軟體和文件
  • R 和統計資訊
  • 以交互方式使用 R
  • 介紹性會議
  • 獲取有關功能和特性的説明
  • R 命令、區分大小寫等。
  • 調用和更正以前的命令
  • 從檔案執行命令或將輸出轉移到檔中
  • 數據持久性和刪除物件
  • Good 程式設計實踐:自包含腳本,良好的可讀性,例如結構化腳本、文檔、markdown
  • 安裝套件;CRAN 和 Bio 導體

2. 讀取數據

  • Txt 文件 (read.delim)
  • CSV 檔

3. 簡單的操作;數位和向量 + 陣列

  • 向量和賦值
  • 向量算術
  • 生成常規序列
  • 邏輯向量
  • 缺失值
  • 字元向量
  • 索引向量;選擇和修改數據集的子集
    • 陣 列
  • 陣列索引。陣列的子節
  • 索引矩陣
  • array() 函數 + 對數位的簡單操作,例如乘法、轉置
  • 其他類型的物件

4. 列表和資料框

  • 清單
  • 構建和修改清單
    • 連接清單
  • 數據幀
    • 製作數據框
    • 使用數據框
    • 附加任意清單
    • 管理搜尋路徑

5. 資料操作

  • 選擇、子集化觀測值和變數
  • 篩選、分組
  • 重新編碼、轉換
  • 聚合,組合數據集
  • 形成分區矩陣 cbind() 和 rbind()
  • 包含陣列的串聯函數 ()
  • 字元操作、stringr 包
  • grep 和 regexpr 簡介

6. 詳細了解讀取數據

  • XLS、XLSX 檔
  • Readr 和 ReadXL 軟體包
  • SPSS, SAS, Stata,...和其他格式數據
  • 將數據匯出為 txt、csv 和其他格式

6. 分組、循環和條件執行

  • 分組表達式
  • 控制語句
  • 條件執行:if 語句
  • 重複執行:for 迴圈、repeat 和 while
  • apply、lapply、sapply、tapply 簡介

7. 功能

  • 創建函數
  • 可選參數和預設值
  • 參數數量可變
  • 範圍及其後果

8. R 中的簡單圖形

  • 創建圖形
  • 密度圖
  • 點圖
  • 條形圖
  • 折線圖
  • 餅圖
  • 箱線圖
  • 散點圖
  • 組合圖

II. R 中的統計分析

1. 概率分佈

  • R 作為一組統計表
  • 檢查一組數據的分佈

2. 假設檢驗

  • 關於總體均值的檢驗
  • 似然比檢驗
  • 單樣本和雙樣本檢測
  • 卡方 Go 擬合度檢驗
  • Kolmogorov-Smirnov 單樣本統計量
  • Wilcoxon 符號秩檢驗
  • 雙樣本測試
  • Wilcoxon 秩和檢驗
  • Mann-Whitney 檢驗
  • Kolmogorov-Smirnov 測試

3. 假設的多重檢驗

  • I 型錯誤和 FDR
  • ROC 曲線和 AUC
  • 多種測試程式(BH、Bonferroni 等)

4. 線性回歸模型

  • 用於提取模型資訊的通用函數
  • 更新擬合模型
  • 廣義線性模型
    • 家族
    • glm() 函數
  • 分類
    • Logistic 回歸
    • 線性判別分析
  • 無監督學習
    • 主成分分析
    • 聚類方法(k-means、層次聚類、k-medoids)

5. 生存分析(生存包)

  • r 中的生存物件
  • Kaplan-Meier 估計、對數秩檢驗、參數回歸
  • 置信區間
  • 刪失(區間刪失)數據分析
  • Cox PH 模型,常數協變數
  • Cox PH 模型,瞬態協變數
  • 類比模型比較(比較回歸模型)

6. 方差分析

  • 單因數方差分析
  • 方差分析的雙向分類
  • 多元方差分析

三、生物資訊學中的工作問題

  • limma 包簡介
  • 微陣列數據分析工作流程
  • 從 GEO 下載的數據:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • 資料處理(QC、歸一化、差異表達)
  • 火山圖
  • Custering 示例 + 熱圖
 28 時間:

人數


每位參與者的報價

客戶評論 (5)

Provisional Upcoming Courses (Require 5+ participants)

課程分類