国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

R語言 | GEO表達矩陣的數(shù)據(jù)清洗與預處理

這篇具有很好參考價值的文章主要介紹了R語言 | GEO表達矩陣的數(shù)據(jù)清洗與預處理。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

目錄

1.去除///

2.去除重復的基因名

3.表達矩陣自動log2化

4.矯正差異


表達量矩陣的數(shù)據(jù)清洗應該在注釋完成之后進行,并且下列操作最好按順序進行

1.去除///

如下圖的表格所示,同一個探針I(yè)D對應的gene有多個,用///分隔著,而我們想獲得一個探針I(yè)D只對應一個基因symbol的表格。

geo數(shù)據(jù)清洗,GEO,R語言,r語言,開發(fā)語言

2.去除重復的基因名

表達矩陣注釋過后,通常會有一些基因名是重復

matrix <- aggregate(.~Gene.symbol, matrix, mean)  ##把重復的Symbol取平均值
row.names(matrix) <- matrix$gene.name  #把行名命名為SYMBOL
matrix <- subset(matrix, select = -1)  #刪除Symbol列(一般是第一列)

Gene.symbol:是需要去重的所在例名

data:是表達矩陣

geo數(shù)據(jù)清洗,GEO,R語言,r語言,開發(fā)語言

3.表達矩陣自動log2化

qx <- as.numeric(quantile(exprSet, c(0., 0.25, 0.5, 0.75, 0.99, 1.0), na.rm=T))
LogC <- (qx[5] > 100) ||
  (qx[6]-qx[1] > 50 && qx[2] > 0) ||
  (qx[2] > 0 && qx[2] < 1 && qx[4] > 1 && qx[4] < 2)
## 開始判斷
if (LogC) { 
  ex[which(ex <= 0)] <- NaN
  ## 取log2
  exprSet <- log2(ex)
  print("log2 transform finished")
}else{
  print("log2 transform not needed")
}

4.矯正差異

library(limma) 
boxplot(exprSet,outline=FALSE, notch=T, las=2)  ##出箱線圖
### 該函數(shù)默認使用quntile 矯正差異 
exprSet=normalizeBetweenArrays(exprSet)
boxplot(exprSet,outline=FALSE, notch=T, las=2)
## 這步把矩陣轉(zhuǎn)換為數(shù)據(jù)框很重要
class(exprSet)   ##注釋:此時數(shù)據(jù)的格式是矩陣(Matrix)
exprSet <- as.data.frame(exprSet)

更多教學請關注:

????公眾號:LN生物筆記????

????知乎:小宇????文章來源地址http://www.zghlxwxcb.cn/news/detail-547552.html

到了這里,關于R語言 | GEO表達矩陣的數(shù)據(jù)清洗與預處理的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • Spark中數(shù)據(jù)預處理和清洗的方法(python)

    在Spark中進行數(shù)據(jù)分析,數(shù)據(jù)預處理和清洗是必不可少的步驟,以下是一些常用的方法: 去除重復行 去除空值 替換空值 更改數(shù)據(jù)類型 分割列 合并列 過濾行 去除重復行可以使用DataFrame的 dropDuplicates() 方法,例如: 去除空值可以使用DataFrame的 dropna() 方法,例如: 可以通過指

    2024年02月11日
    瀏覽(45)
  • GEO生信數(shù)據(jù)挖掘(六)實踐案例——四分類結(jié)核病基因數(shù)據(jù)預處理分析

    GEO生信數(shù)據(jù)挖掘(六)實踐案例——四分類結(jié)核病基因數(shù)據(jù)預處理分析

    前面五節(jié),我們使用阿爾茲海默癥數(shù)據(jù)做了一個數(shù)據(jù)預處理案例,包括如下內(nèi)容: GEO生信數(shù)據(jù)挖掘(一)數(shù)據(jù)集下載和初步觀察 GEO生信數(shù)據(jù)挖掘(二)下載基因芯片平臺文件及注釋 GEO生信數(shù)據(jù)挖掘(三)芯片探針I(yè)D與基因名映射處理 GEO生信數(shù)據(jù)挖掘(四)數(shù)據(jù)清洗(離群值

    2024年02月07日
    瀏覽(66)
  • 云計算與大數(shù)據(jù)分析:如何實現(xiàn)高效的數(shù)據(jù)清洗與預處理

    隨著互聯(lián)網(wǎng)的普及和數(shù)據(jù)的快速增長,數(shù)據(jù)分析和處理成為了企業(yè)和組織中的重要組成部分。大數(shù)據(jù)分析是指利用大量數(shù)據(jù)來發(fā)現(xiàn)新的信息和洞察,從而為企業(yè)和組織提供決策支持。云計算是一種基于互聯(lián)網(wǎng)的計算資源共享和分配模式,它可以讓企業(yè)和組織更加高效地利用計

    2024年04月11日
    瀏覽(26)
  • 【數(shù)據(jù)預處理】基于Kettle的字符串數(shù)據(jù)清洗、Kettle的字段清洗、Kettle的使用參照表集成數(shù)據(jù)

    【數(shù)據(jù)預處理】基于Kettle的字符串數(shù)據(jù)清洗、Kettle的字段清洗、Kettle的使用參照表集成數(shù)據(jù)

    ?? 本文選自專欄:AI領域?qū)?從基礎到實踐,深入了解算法、案例和最新趨勢。無論你是初學者還是經(jīng)驗豐富的數(shù)據(jù)科學家,通過案例和項目實踐,掌握核心概念和實用技能。每篇案例都包含代碼實例,詳細講解供大家學習。 ??????本專欄

    2024年02月03日
    瀏覽(31)
  • 利用Python進行數(shù)據(jù)清洗與預處理:Pandas的高級用法【第147篇—Pandas的高級用法】

    利用Python進行數(shù)據(jù)清洗與預處理:Pandas的高級用法【第147篇—Pandas的高級用法】

    前些天發(fā)現(xiàn)了一個巨牛的人工智能學習網(wǎng)站,通俗易懂,風趣幽默,忍不住分享一下給大家。【點擊進入巨牛的人工智能學習網(wǎng)站】。 在數(shù)據(jù)科學和機器學習領域,數(shù)據(jù)清洗和預處理是至關重要的步驟。Pandas庫作為Python中最受歡迎的數(shù)據(jù)處理工具之一,提供了強大的功能來處

    2024年04月09日
    瀏覽(37)
  • pytorch入門2--數(shù)據(jù)預處理、線性代數(shù)的矩陣實現(xiàn)、求導

    pytorch入門2--數(shù)據(jù)預處理、線性代數(shù)的矩陣實現(xiàn)、求導

    數(shù)據(jù)預處理是指將原始數(shù)據(jù)讀取進來使得能用機器學習的方法進行處理。 首先介紹csv文件: CSV 代表逗號分隔值(comma-separated values),CSV 文件就是使用逗號分隔數(shù)據(jù)的文本文件。 一個 CSV 文件包含一行或多行數(shù)據(jù),每一行數(shù)據(jù)代表一個記錄。每個記錄包含一個或多個數(shù)值,

    2024年02月04日
    瀏覽(31)
  • 利用chatgpt大語言模型來做數(shù)據(jù)預處理

    數(shù)據(jù)預處理是機器學習中的一個重要步驟,包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、特征選擇等。這些步驟通常需要人工進行,或者使用專門的數(shù)據(jù)預處理工具和庫,如Python的Pandas庫、Scikit-learn庫等。 今天我們將利用chatgpt(國內(nèi)版本-小策智能問答)的輔助幫我們進行數(shù)據(jù)預處理,本文將用

    2024年02月06日
    瀏覽(33)
  • Less預處理——繼承、導入、條件表達式和函數(shù)

    1、extend 的使用 extend 是 Less 的一個偽類,它可繼承所匹配聲明中的全部樣式 index.less 文件 index.css 文件 自動轉(zhuǎn)義后的 css 文件內(nèi)容如下 2、all 全局搜索替換 使用選擇器匹配到的全部聲明 index.less 文件 index.css 文件 自動轉(zhuǎn)義后的 css 文件內(nèi)容如下 3、減少代碼的重復性

    2024年02月20日
    瀏覽(25)
  • 【C語言】程序環(huán)境和預處理|預處理詳解|定義宏(下)

    【C語言】程序環(huán)境和預處理|預處理詳解|定義宏(下)

    主頁:114514的代碼大冒 qq:2188956112(歡迎小伙伴呀hi?(。???。)??) Gitee:莊嘉豪 (zhuang-jiahaoxxx) - Gitee.com 文章目錄 目錄 文章目錄 前言 2.5帶副作用的宏參數(shù) 2.6宏和函數(shù)的對比 3#undef ?編輯 4 命令行定義 5 條件編譯 6 文件包含 總結(jié) 咱們書接上回 2.5帶副作用的宏參數(shù) 先來

    2024年01月17日
    瀏覽(33)
  • C語言——程序環(huán)境和預處理(再也不用擔心會忘記預處理的知識)

    C語言——程序環(huán)境和預處理(再也不用擔心會忘記預處理的知識)

    先簡單了解一下程序環(huán)境,然后詳細總結(jié)翻譯環(huán)境里的編譯和鏈接,然后在總結(jié)編譯預處理。 在 ANSI C 的任何一種實現(xiàn)中,存在兩個不同的環(huán)境 翻譯環(huán)境:這個環(huán)境中源代碼被轉(zhuǎn)換為可執(zhí)行的機器指令。 執(zhí)行環(huán)境:執(zhí)行二進制代碼。 計算機如何執(zhí)行二進制指令? 我們寫的C語

    2024年02月09日
    瀏覽(36)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包