许多组织都在努力管理和挖掘来自现代技术平台的数据。进入组织的数据可能是少量的非常大的文件,也可能是每天甚至每分钟到达的数百万个非常小的文件。数据科学家将 Apache Spark™ 等平台视为管理和处理这些海量数据的首选解决方案,以便快速从分布式文件系统中的数据中获取洞察力。它能够在内存中处理极大的数据集,这也是 Spark 被纳入大数据架构的原因之一。Altair 的工作负载管理工具(如 Altair® PBS Professional®)使组织能够在高性能计算、现代处理和存储平台以及云环境中高效处理大数据。
主要关键词