R 编程 – 语言的改进

R 有了显着的改进。

来源:与此有关的是什么

作者:安迪·梅

这是关于使用 R 读取 IGRA2 无线电探空仪数据、处理数据并生成数据图和地图的系列文章的介绍性文章。我十多年前开始使用 R,主要是因为它是一种免费且非常强大的统计分析语言(在此处下载当前的 64 位 Windows 版本)。当时,它是一种笨重的编程语言并且难以使用,但最近情况发生了变化。在开发新的 R 程序来分析无线电探空仪数据时,我看到了自 2020 年左右以来添加的语言的许多实质性改进。它现在是一种非常令人印象深刻的语言,并且更易于使用和阅读。在我们开始无线电探空仪分析之前,我想先介绍一下该语言的最新改进。本系列的后续文章将提供有关 R 语言的更多详细信息以及我对 IGRA2 的分析。

读写数据

我使用原始的“base”R“readLines”函数来读取 IGRA2 文件,因为每个记录都必须作为文本字符串读取,然后解析为其组件值。为此,readLines 是理想且高效的。然而,为了提高效率,一旦记录被解析并准备好在 R 中处理,我就使用 data.table R 包中的“fwrite”将生成的数据帧(数据帧是包含混合数据类型的 R 矩阵结构)或 tibbles(更现代的变量数据帧结构)写入磁盘。数据框和小标题都组织为表格,其中观察值是行,变量或测量值是列。不同的列可以具有不同的变量类型,例如字符、浮点或整数数据类型。

函数 fwrite 由 Otto Seiskari 和 Matt Dowle 编写,于 2016 年首次发布。到 2020 年,它变得完全并行;它比其他写入功能快 10-100 倍。对于读取逗号分隔文件(CSV 文件),配套的 fread 函数也非常快速和高效。

dplyr:数据操作

用于使代码更具可读性的管道 (%>%)