Python关键词检索结果

10 个 GitHub 存储库助您掌握数学

10 GitHub Repositories to Master Math

通过路线图、课程、教程、用于解方程的 Python 框架、指南、练习、教科书等学习数学。

随机游走的历史

The history of random walks

. 既有趣又信息量大。太棒了!如果您懂一点 Python,您可以尝试一下我编写的这段小代码片段,用来模拟和绘制一种称为“布朗运动”的特殊随机游走。

使用 Amazon Bedrock Data Automation 简化多模式生成 AI

Simplify multimodal generative AI with Amazon Bedrock Data Automation

Amazon Bedrock Data Automation 公开预览版为所有技能组合的开发人员提供了统一的体验,使他们能够轻松地自动从文档、图像、音频和视频中提取、转换和生成相关见解,以构建生成式 AI 驱动的应用程序。在本文中,我们将演示如何在 AWS 管理控制台中使用 Amazon Bedrock Data Automation 和 AWS SDK for Python (Boto3) 进行媒体分析和智能文档处理 (IDP) 工作流。

用于数据预处理的 10 个基本 Pandas 命令

10 Essential Pandas Commands for Data Preprocessing

查看这份初学者指南,了解如何使用 Python 高效地清理和准备数据。

直接从 Numpy 数组可视化数据

Visualizing Data Directly from Numpy Arrays

正在寻找 DIY 示例以获取在 Python 中高效可视化数据的基础?那么本教程适合您。

在 SageMaker Inference 中引入快速模型加载器:加速大型语言模型 (LLM) 的自动扩展 - 第 2 部分

Introducing Fast Model Loader in SageMaker Inference: Accelerate autoscaling for your Large Language Models (LLMs) – Part 2

在本文中,我们提供了在 LLM 部署中实施 Fast Model Loader 的详细实践指南。我们探讨了两种方法:使用 SageMaker Python SDK 进行编程实现,以及使用 Amazon SageMaker Studio UI 获得更直观、更具交互性的体验。无论您是喜欢使用代码的开发人员还是喜欢图形界面的人,您都将学习如何利用这一强大功能来加速您的 LLM 部署。

安全事务恶意软件新闻通讯 - 第 22 轮

SECURITY AFFAIRS MALWARE NEWSLETTER – ROUND 22

Security Affairs Malware 时事通讯收集了国际范围内有关恶意软件的最佳文章和研究。 一项用于衡量组织中恶意软件遭遇行为风险的病例对照研究 PyPI Python 库“aiocpa”被发现通过 Telegram Bot 泄露加密密钥 Bootkitty:分析第一个适用于 Linux 的 UEFI 启动套件 Hudson Rock 宣布首次全面 […]

数据科学的 10 个基本 Conda 命令

10 Essential Conda Commands for Data Science

这是 10 个最常用的 Conda 命令的集合,每个数据科学家、机器学习工程师或 Python 开发人员都应该掌握这些命令。

数据职业的四大支柱

The Four Pillars of a Data Career

获得入门级数据分析师职位的技术基础照片由 Jon Tyson 在 Unsplash 上拍摄TLDR;电子表格 (Excel)SQL 可视化工具 (Tableu 或 Power BI)脚本语言 (Python 或 R)简介试图进入数据领域的人经常问我,他们需要学习哪些技能才能获得第一份数据工作,以及他们应该在哪里学习这些技能。这篇文章是我在过去 5 年里为有抱负的数据科学家、分析师和工程师提供的建议的提炼。本文主要面向希望获得第一份数据工作机会的自学成才的数据骑师。如果你正在阅读这篇文章,那么你的第一份工作很可能就是分析师。数据领域的大多数入门级职位都是分析师,我不认为数据科学家或数据工程师是入

成为数据科学家的路线图

Roadmap for Becoming a Data Scientist

从学习 Python 到创建分析报告,了解成为数据科学家的十个简单步骤。

优化 PySpark 中的数据处理性能

Optimizing the Data Processing Performance in PySpark

PySpark 技术和策略解决常见的性能挑战:实践演练Apache Spark 近年来凭借其强大的分布式数据处理能力成为领先的分析引擎之一。PySpark 是 Spark 的 Python API,通常用于个人和企业项目以解决数据挑战。例如,我们可以使用 PySpark 高效地实现时间序列数据的特征工程,包括提取、提取和可视化。然而,尽管它能够处理大型数据集,但在极端数据分布和复杂的数据转换工作流等各种情况下仍然会出现性能瓶颈。本文将研究使用 Databricks 上的 PySpark 进行数据处理时的各种常见性能问题,并介绍各种微调策略以实现更快的执行速度。照片由 Veri Ivanova

Microsoft AutoGen:具有高级自动化功能的多代理 AI 工作流

Microsoft AutoGen: Multi-Agent AI Workflows with Advanced Automation

微软研究院于 2023 年 9 月推出了 AutoGen,这是一个开源 Python 框架,用于构建能够进行复杂多代理协作的 AI 代理。AutoGen 已经在研究人员、开发人员和组织中获得了关注,截至 2024 年 5 月,GitHub 上有超过 290 名贡献者,下载量接近 90 万次。在此成功的基础上,微软推出了 AutoGen Studio,这是一款低代码 […]文章 Microsoft AutoGen:具有高级自动化功能的多代理 AI 工作流首先出现在 Unite.AI 上。

超越技能:释放数据科学家的全部潜力

Beyond Skills: Unlocking the Full Potential of Data Scientists

图片由作者通过 DALL-E / OpenAI 创建。超越技能:释放数据科学家的全部潜力。通过赋予数据科学家超越技术任务的能力来推动创新和战略洞察,释放数据科学家的隐藏价值。[本文转载自 O’Reilly Radar]简介现代组织将数据视为推动效率、增强决策能力并为客户创造新价值的战略资产。整个组织(产品管理、营销、运营、财务等)的团队都充满了关于数据如何提升业务的想法。为了将这些想法变成现实,公司热切地聘请数据科学家来发挥他们的技术技能(Python、统计、机器学习、SQL 等)。尽管热情高涨,但许多公司的数据科学家利用率却远远不足。组织仍然只专注于雇用数据科学家来执行现有的想法,而忽视了他

使用 PCA 进行异常值检测的简单示例

A Simple Example Using PCA for Outlier Detection

在异常值检测之前执行 PCA 转换可提高准确性、速度和内存使用率本文继续介绍使用 PCA(主成分分析)进行异常值检测的一系列应用,紧随其后的是使用 PCA 进行异常值检测。那篇文章描述了 PCA 本身,并介绍了使用 PCA 进行异常值检测的两种主要方法:评估重构误差,以及在 PCA 转换空间上运行标准异常值检测器。它还给出了第一种方法的示例,即使用重构误差,使用 PyOD 提供的 PCA 和 KPCA 检测器可以轻松完成。本文介绍了第二种方法,我们首先使用 PCA 转换数据空间,然后在此上运行标准异常值检测。正如上一篇文章所述,在某些情况下,这可能会降低可解释性,但在准确性、执行时间和内存使用

每周回顾 2024 年 11 月 1 日

Weekly Review 1 November 2024

我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):我认为这是不使用 AI 生成重要代码或材料的最大原因——不良行为者太容易将恶意代码注入所使用的模型中:https://arstechnica.com/tech-policy/2024/10/bytedance-intern-fired-for-planting-malicious-code-in-ai-models/Google 的 AI 调解员,有助于引导人们达成一致:https://arstechnica.com/ai/2024/10/goo

LLM 评估、AI 附带项目、用户友好型数据表和其他 10 月必读内容

LLM Evaluation, AI Side Projects, User-Friendly Data Tables, and Other October Must-Reads

是否想写出您的第一篇 TDS 文章?我们始终欢迎新作者的投稿。我们似乎正处于日历上的一个甜蜜点,即夏末和假期来临前的最后高峰之间——换句话说,这是一年中学习、修修补补和探索的最佳时机。我们 10 月份阅读次数最多的文章反映了这种专注的精神,涵盖了一系列实践主题。从可行的 AI 项目想法和数据科学收入流到易于理解的时间序列分析和 LLM 指南,这些故事很好地代表了我们作者的专业知识广度以及他们(和我们的读者)兴趣的多样性。如果您还没有阅读它们,现在就是最佳时机?每月亮点您可以在本周末构建的 5 个 AI 项目(使用 Python)如果您还没有撸起袖子,那么很快就会撸起袖子:我们 10 月份阅读次

ARIMA:预测时间序列数据的模型

ARIMA: A Model to Predict Time Series Data

了解 ARIMA 模型的工作原理以及如何在 Python 中实现它们以实现准确预测继续阅读 Towards Data Science »

使用 Google Mesop 进行数据可视化

Hands-On Data Visualization with Google Mesop

Google Mesop 是一个易于使用的 Python UI 框架。我们将了解如何使用它来创建带有 Plotly 的数据可视化应用程序。继续阅读 Towards Data Science »