R 语言简介
R 语言是一种用于统计计算和图形展示的语言和环境。它是一个 GNU 项目,与贝尔实验室(前身为 AT&T,现为朗讯科技)的约翰·钱伯斯(John Chambers)及其同事开发的 S 语言和环境类似。R 可以看作是 S 的不同实现。虽然两者之间存在一些重要差异,但许多为 S 编写的代码在 R 下无需修改即可运行。
R 语言提供了广泛的统计(线性和非线性建模、经典统计检验、时间序列分析、分类、聚类等)和图形技术,并且具有高度可扩展性。S 语言通常是统计方法研究中的首选工具,而 R 语言为参与此类研究提供了开源途径。
R 语言的优势之一在于,它能轻松生成设计精良、符合出版标准的图表,包括在需要时添加数学符号和公式。尽管 R 在图形设计中的细微选择上已经对默认设置进行了细致处理,但用户仍保留着完全的控制权。
R 语言是遵循自由软件基金会 GNU 通用公共许可证条款的自由软件,以源代码形式提供。它可在多种 UNIX 平台及类似系统(包括 FreeBSD 和 Linux)、Windows 和 MacOS 上编译和运行。
R 环境
R 是一套集数据操作、计算和图形展示于一体的软件设施。它包括
- 一个高效的数据处理和存储设施,
- 一套用于数组(尤其是矩阵)计算的运算符,
- 一个庞大、连贯、集成的数据分析中间工具集合,
- 用于数据分析和显示的图形工具,可在屏幕上或硬拷贝上使用,以及
- 一种开发完善、简单且高效的编程语言,包含条件语句、循环语句、用户定义的递归函数以及输入输出功能。
“环境”一词旨在将其描述为一个全面规划且连贯的系统,而非像其他数据分析软件那样,常常是由一系列非常具体且缺乏灵活性的工具逐步累积而成。
R 与 S 一样,是围绕一种真正的计算机语言设计的,它允许用户通过定义新函数来添加额外功能。系统的大部分本身是用 S 的 R 方言编写的,这使得用户很容易理解所做的算法选择。对于计算密集型任务,可以在运行时链接和调用 C、C++ 和 Fortran 代码。高级用户可以编写 C 代码来直接操作 R 对象。
许多用户将 R 视为一个统计系统。我们更倾向于将其视为一个实施统计技术的环境。R 可以通过包(轻松)进行扩展。R 发行版中提供了大约八个包,而通过 CRAN 系列互联网站点可以获得更多包,这些包涵盖了非常广泛的现代统计领域。
R 拥有自己的类 LaTeX 文档格式,用于提供全面的文档,这些文档既可以在线以多种格式查看,也可以获取纸质版。
下载安装
R 语言的源代码、二进制文件和文档可通过 CRAN(“综合 R 存档网络”)获取,其当前列表见 https://CRAN.R-project.org/mirrors.html。
获取并解压源代码
最简单的方法是下载最新的 R-x.y.z.tar.gz 文件,并用解压工具将其解压
tar -xf R-x.y.z.tar.gz在已安装了合适的 tar 的系统上。在其他系统上,你需要安装 gzip 程序,然后你就可以使用了
gzip -dc R-x.y.z.tar.gz | tar -xf -源代码解压后所在的目录路径名不应包含空格,因为大多数 make 程序(特别是 GNU make)都不支持空格。
如果你希望构建的版本可供一组用户使用,请在解压前设置 umask,以确保文件对目标用户组是可读的(例如,将 umask 设置为022,则所有用户均可使用)。在构建和安装过程中,请保持 umask 的这一设置。
如果你使用的是较新版本的 GNU tar,并且以 root 账户(在 Windows 上包括具有管理员权限的账户)执行此操作,你可能会看到许多关于更改所有权的警告。在这种情况下,你可以使用
tar --no-same-owner -xf R-x.y.z.tar.gz并且可能还包括选项 --no-same-permissions。(这些选项也可以在 TAR_OPTIONS 环境变量中设置:如果包含多个选项,应使用空格分隔。)