sparklyr.sedona: A sparklyr extension for analyzing geospatial data
我们很高兴地宣布 sparklyr.sedona 现已推出,这是一个 sparklyr 扩展,可让 Apache Sedona 库的地理空间功能从 R 轻松访问。
Sparklyr 1.7 提供了备受期待的改进,包括用于图像和二进制数据源的 R 接口、几个新的 spark_apply() 功能以及与 sparklyr 扩展的更好集成。
sparklyr 1.6: weighted quantile summaries, power iteration clustering, spark_write_rds(), and more
sparklyr 1.6 版本引入了加权分位数摘要、用于支持迭代聚类的 R 接口、spark_write_rds(),以及许多与 dplyr 相关的改进。
sparklyr 1.5: better dplyr interface, more sdf_* functions, and RDS-based serialization routines
与之前的所有三个 sparklyr 版本不同,最近发布的 sparklyr 1.5 更注重增强现有的 sparklyr 功能,而不是创建新功能。因此,我们采纳了许多来自 sparklyr 用户的宝贵建议,并在一系列错误修复和改进中成功解决了这些问题。
sparklyr.flint 0.2: ASOF Joins, OLS Regression, and additional summarizers
我们很高兴地宣布,许多强大的新功能和改进现已成为 sparklyr.flint 0.2 的一部分!
sparklyr 1.4: Weighted Sampling, Tidyr Verbs, Robust Scaler, RAPIDS, and more
Sparklyr 1.4 现已推出!此版本具有令人愉悦的新功能,例如对 Spark 数据帧的加权采样和 tidyr 动词支持、基于中位数和四分位距标准化数据的稳健缩放器、RAPIDS GPU 加速插件的 spark_connect 接口,以及许多与 dplyr 相关的改进。
Introducing sparklyr.flint: A time-series extension for sparklyr
我们很高兴地宣布,sparklyr.flint 现已在 CRAN 上可用,它是使用 Flint 大规模分析时间序列的 sparklyr 扩展。Flint 是一个用于处理 Apache Spark 中时间序列的开源库,支持对时间序列数据集进行聚合和连接。
sparklyr 1.3: Higher-order Functions, Avro and Custom Serializers
Sparklyr 1.3 现已推出,具有令人兴奋的新功能,例如集成 Spark 高阶函数以及以 Avro 和用户定义的序列化格式导入/导出数据。
sparklyr 1.2: Foreach, Spark 3.0 and Databricks Connect
新的 sparklyr 版本现已推出。此 sparklyr 1.2 版本具有新功能,例如对 Databricks Connect 的支持、用于“foreach”包的 Spark 后端、与 Spark 3.0 预览版配合使用的互操作改进,以及许多错误修复和解决用户可见痛点的改进。