R语言是在1991年由新西兰奥克兰大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发的语言系统。因为这两个开发者的名字都是以字母R开头,所以就叫做R语言,R是一个功能强大、用途广泛的统计分析、绘图的语言和操作环境。
为生物统计而生的语言
生物数据分析当中很多地方都需要用到统计分析,R的开发最初就是要解决生物统计方面的问题,其创始人之一的Robert Gentleman就是一位生物学家。R是一个全面的统计研究平台,丰富的数据分析工具几乎可以完成任何类型的数据分析工作。
比如Bioconductor包,已经收录了包括做转录组差异分析的常用包DEseq2,edgeR,芯片数据分析相关的limma、affy包等等约2000个包。当然R语言不止只有Bioconductor,还有CRAN也收录了很多R包。
开源免费
市面上也有很多其他流行的统计和绘图软件,例如微软的Excel、SAS,IBM的SPSS、Stata、S-PLUS以及Matlab等。但这些软件大多是商业软件,需要支付高昂的费用才能使用,而R语言则是免费的。
优秀的绘图功能
数据在统计分析之后,最重要的就是要把结果可视化的展示出来,R拥有顶尖的绘图功能,可以绘制非常专业精美的图形,很多顶级杂志当中漂亮的图都是应用R语言绘制的。
相关文章