apache关键词检索结果

优化 PySpark 中的数据处理性能

Optimizing the Data Processing Performance in PySpark

PySpark 技术和策略解决常见的性能挑战:实践演练Apache Spark 近年来凭借其强大的分布式数据处理能力成为领先的分析引擎之一。PySpark 是 Spark 的 Python API,通常用于个人和企业项目以解决数据挑战。例如,我们可以使用 PySpark 高效地实现时间序列数据的特征工程,包括提取、提取和可视化。然而,尽管它能够处理大型数据集,但在极端数据分布和复杂的数据转换工作流等各种情况下仍然会出现性能瓶颈。本文将研究使用 Databricks 上的 PySpark 进行数据处理时的各种常见性能问题,并介绍各种微调策略以实现更快的执行速度。照片由 Veri Ivanova

使用 AWS Glue for Apache Spark 大规模使用 RAG 为您的 LLM 充电

Super charge your LLMs with RAG at scale using AWS Glue for Apache Spark

在本文中,我们将探讨在 LangChain(一个基于 LLM 构建应用程序的开源框架)上构建可重复使用的 RAG 数据管道,并将其与 AWS Glue 和 Amazon OpenSearch Serverless 集成。最终解决方案是可扩展 RAG 索引和部署的参考架构。

Perfectl 恶意软件

Perfectl Malware

完美地融入了令人印象深刻的恶意软件:该恶意软件至少从 2021 年开始流传。Aqua Security 的研究人员表示,它通过利用 20,000 多个常见的错误配置来安装,这种能力可能会使数百万台连接到互联网的机器成为潜在目标。它还可以利用 CVE-2023-33246,这是一个严重等级为 10 分(满分 10 分)的漏洞,去年在 Apache RocketMQ 中进行了修补,Apache RocketMQ 是一个在许多 Linux 机器上发现的消息传递和流媒体平台。研究人员将恶意软件称为 Perfctl,这是一个秘密挖掘加密货币的恶意组件的名称。恶意软件的未知开发者给该进程起了一个名字,结合

Apache Avro 濒临崩溃:黑客找到了夺取代码控制权的方法

Apache Avro на грани: хакеры нашли способ захватить контроль над кодом

CVE-2024-47561 漏洞允许数千个系统遭到黑客攻击。

使用 Amazon Managed Service for Apache Flink 通过在线学习对流式时间序列数据进行异常检测

Anomaly detection in streaming time series data with online learning using Amazon Managed Service for Apache Flink

在本文中,我们演示了如何使用 Amazon Managed Service for Apache Flink 和其他 AWS 托管服务为流式传输时间序列数据构建强大的实时异常检测解决方案。

Muhstik:僵尸服务器大军已准备好应对新的 DDoS 攻击

Muhstik: армия зомби-серверов готова к новой DDoS-атаке

更新您的 Apache RocketMQ 实例以避免泄露。

Apache HugeGraph 漏洞的利用可免费获取

Эксплоиты для уязвимости Apache HugeGraph в свободном доступе

管理员登录后会提示,因此建议他们在登录和注销时提供密码。

政府机构遭受攻击:Apache Flink bug已被积极利用3年

Госорганы под ударом: ошибка Apache Flink активно используется уже 3 года

CISA 将该漏洞添加到其目录中,呼吁采取紧急行动来保护联邦系统。

秘密项目和尖端技术:韦斯特兰飞机和旋翼机(书评)

Secret Projects & Cutting Edge Technology: Westland Aircraft & Rotorcraft (book review)

杰里米·格雷厄姆和罗恩·史密斯合著的书 罗恩·史密斯博士于 1975 年加入英国直升机公司 Westland,从事空气动力学研究,并遥控直升机(在它们流行之前),后来成为未来项目负责人。他对 NH90 直升机的设计产生了很大的影响,并参与了对 Apache […] 的评估

Grok-1 的崛起——一款改变游戏规则的新法学硕士

The rise of Grok-1 – a new game-changing LLM

埃隆·马斯克 (Elon Musk) 的 xAI Corp 推出了 Grok-1,这是一款配备 3140 亿个参数和混合专家架构的新 LLM。Grok-1 在 Apache 2.0 许可下作为开源发布,旨在催化人工智能研究的进步。

最新版本的 Apache 完成首飞

Newest version of Apache completes first flight

阿拉巴马州红石兵工厂 — 最新版本的 AH-64E 阿帕奇于 10 月 11 日在亚利桑那州梅萨成功试飞。版本 6.5 (V6.5) 是下一个配置...

直接聘用权威职位 - 项目经理(助理 PM) - Apache

Direct Hire Authority position - Program Manager (Assistant PM) - Apache

关于根据直接雇佣授权 #21 (DHA) AcqDemo 业务和技术管理职业道路 (NH) 填补职位的公开通知

完整的 Apache Airflow 教程:使用 Python 构建数据管道

A complete Apache Airflow tutorial: building data pipelines with Python

了解 Apache Airflow 以及如何使用它来开发、编排和维护机器学习和数据管道

使用 Apache Beam 进行大型医学图像预处理 | 分步指南

Big Medical Image Preprocessing With Apache Beam | A Step-by-Step Guide

本文将引导您了解如何使用 Apache Beam 高效处理大型医学图像 — 我们将使用一个具体示例来探索以下内容:- 如何在 ML/AI 中使用大型图像- 用于处理上述图像的不同库- 如何创建高效的并行处理管道准备好进行一些严肃的知识共享了吗?文章使用 Apache Beam 进行大型医学图像预处理 | 分步指南由 DLabs.AI 服务。

Apache 产品办公室迎来新领导;彼得森退休

Apache Product Office welcomes new leader; Peterson Retires

航空项目执行办公室的阿帕奇开发和现代化 (DevMod) 产品办公室在包机变更期间迎来了一位新领导...

什么是 Apache Log4J 漏洞以及如何使用 CDNetworks 的 WAF 服务缓解它

What is Apache Log4J Vulnerability and How to Mitigate It with CDNetworks’ WAF Service

2021 年 12 月 9 日,发现了一个影响流行 Apache 软件包的关键远程代码执行 (RCE) 漏洞。这个称为 Apache Log4J 的零日软件漏洞对全球数百万个应用程序和设备构成了潜在威胁。它的全球影响促使美国国家标准与技术研究所 (NIST) 发布了关键 […]The post 什么是 Apache Log4J 漏洞以及如何使用 CDNetworks 的 WAF 服务缓解它首先出现在 CDNetworks 上。

Apache产品管理办公室进行未来技术演示

Apache Product Management Office conducts future technology demonstration

由 Apache 传感器产品办公室PEO Aviation 的 Apache 传感器产品办公室与红石测试中心 (RTC) 协调,未来垂直 L...

sparklyr.sedona:用于分析地理空间数据的 sparklyr 扩展

sparklyr.sedona: A sparklyr extension for analyzing geospatial data

我们很高兴地宣布 sparklyr.sedona 现已推出,这是一个 sparklyr 扩展,可让 Apache Sedona 库的地理空间功能从 R 轻松访问。