用R和BioConductor进行基因芯片数据分析(三):计算median
  TnD0WQEygW8e 2023年11月14日 26 0

接前一篇:

 

我们已经知道要分析的数据对每个基因有3个重复测定值,经过缺失值填充后,每个基因都有3个可用值。

这一步很简单,就是取这3个值的中位数,即median。

方法很多,在excel中可以用median函数;

在R中以下代码进行操作:

get_median<-function(i,j){     
num_vec<-c(imputeddata[i*3-2,j],imputeddata[i*3-1,j],imputeddata[i*3,j])      
median(num_vec)      
}      
#A simple function to calculate median value of three replicatesdimrow<-(dim(imputeddata)[1])/3     
mediandata<-matrix(data = NA, nrow =dimrow, ncol = dim(imputeddata)[2], byrow = TRUE, dimnames = NULL)      
#Create a blank matrix to store median valuesfor (i in 1:dimrow){     
for (j in 1:dim(imputeddata)[2]){      
mediandata[i,j]<-get_median(i,j)      
}      
}      
#Assign median value using the function get_median()

 

现在我们得到了中位数的数据,储存在mediandata对象里,行数是缺失值填充数据imputeddata的1/3,double check一下:

> dim(imputeddata)     
[1] 11571 20    
> dim(mediandata)     
[1] 3857 20

 

from: http://azaleasays.com/tag/r/



【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月14日 0

暂无评论

推荐阅读
TnD0WQEygW8e