4 YAML Files Instead of PySpark: How We Let Analysts Build Data Pipelines Without Engineers
我们如何用 dlt、dbt 和 Trino 取代 Python 管道,并将交付时间从几周缩短到一天。帖子 4 YAML 文件代替 PySpark:我们如何让分析师在没有工程师的情况下构建数据管道首先出现在走向数据科学上。
PyTorch NaNs Are Silent Killers — So I Built a 3ms Hook to Catch Them at the Exact Layer
NaN 不会破坏你的训练——它们会悄悄地破坏它。在 ResNet 训练运行中因无声故障而损失了几个小时后,我构建了一个轻量级检测器,可以精确定位出现问题的确切层和批次。使用前向钩子和梯度检查,它可以以最小的开销尽早发现问题,而不会减慢模型的速度。PyTorch NaNs 是无声杀手——所以我构建了一个 3ms 的钩子来在精确层捕获它们,该文章首先出现在《走向数据科学》上。
10 Python Libraries for Building LLM Applications
了解 LLM 应用程序的顶级 Python 框架,涵盖微调、模型加载、服务、RAG 管道、多代理系统和评估。
来自秘鲁的 Mygalomorph 蜘蛛(Araneae、Pycnothelidae、Rhytidicolidae):两个新物种的描述和 Rhytidicolidae 科的第一个秘鲁记录摘要两种以前未知的 mygalomorph 蜘蛛物种属于两个科,来自秘鲁安第斯山脉中南部地区。在Pycnothelidae科中,Acanthogonatus goloboffi sp。名词是根据一位来自库斯科 Ccochirhuay 的女性进行描述、诊断和说明的。该物种的雌性与大多数已知的棘齿龙的不同之处在于受精囊的形状,其具有两个缺乏额外突起或腔室的单个容器。它与共享单个容器的同类产品的进一步不同之处在于,它
5 Free Ways to Host a Python Application
探索五个适合初学者的平台,让您免费托管 Python 应用程序,比较它们的限制,然后选择合适的平台。
How to Learn Python for Data Science Fast in 2026 (Without Wasting Time)
我希望在旅程开始时做的事情《如何在 2026 年快速学习 Python 进行数据科学(不浪费时间)》一文首先出现在《走向数据科学》上。
5 Useful Python Scripts for Advanced Data Validation & Quality Checks
从缺失值到架构不匹配,数据问题以多种形式出现。这五个 Python 脚本为现代数据工作流程提供智能、自动的验证。
Python Project Setup 2026: uv + Ruff + Ty + Polars
这个简单的 Python 堆栈将使您的项目更快、更干净、更易于维护。
Docker for Python & Data Projects: A Beginner’s Guide
管理 Python 数据项目的依赖关系可能会很快变得混乱。 Docker 可帮助您创建一致的环境,您可以轻松构建、共享和部署。
Transcript: Mike Pyle, BlackRock’s Portfolio Management Group
本周 MiB 的文字记录:贝莱德投资组合管理团队 Mike Pyle,如下。您可以在 Apple Podcasts、Spotify、YouTube(视频)、YouTube(音频)和 Bloomberg 上流式传输和下载我们的完整对话,包括任何播客附加内容。 ~~~ [00:00:16] Barry Ritholtz:本周的播客——哇,这又是一个大问题。系好安全带。迈克……阅读更多 文章文字记录:贝莱德投资组合管理团队迈克·派尔 (Mike Pyle) 首先出现在《The Big Picture》上。
A Survival Analysis Guide with Python: Using Time-To-Event Models to Forecast Customer Lifetime
通过 Kaplan-Meier 曲线和 Cox 比例风险回归对客户保留进行建模来理解生存分析。Python 生存分析指南:使用事件时间模型预测客户生命周期一文首先出现在 Towards Data Science 上。
All About Pyjanitor’s Method Chaining Functionality, And Why Its Useful
干净的代码,干净的数据:为什么 Pyjanitor 的方法链接方法是实现这一双重目标的途径。
MiB: Mike Pyle, BlackRock’s Portfolio Management Group
本周,我与贝莱德投资组合管理集团 (PMG) 副主管兼贝莱德全球执行委员会成员迈克·派尔 (Mike Pyle) 进行了交谈。我们讨论与伊朗的战争可能造成的持久经济冲击,包括能源安全。我们还讨论了他在拜登政府担任副国家安全顾问的经历……阅读更多 MiB 的帖子:贝莱德投资组合管理集团迈克·派尔 (Mike Pyle) 首先出现在《大图片》上。
5 Useful Python Scripts to Automate Boring Excel Tasks
合并电子表格、清理导出和拆分报告是必要但乏味的任务。这些 Python 脚本处理重复部分,以便您可以专注于实际工作。
Python Supply-Chain Compromise
这是新闻:Python 包索引包 litellm 版本 1.82.8 中已发现恶意供应链危害。发布的wheel包含一个恶意的.pth文件(litellm_init.pth,34,628字节),该文件在每次启动时由Python解释器自动执行,不需要显式导入litellm模块。我们需要做很多非常无聊的事情来帮助保护所有这些关键库:SBOM、SLSA、SigStore。但我们必须这样做。
Building a Python Workflow That Catches Bugs Before Production
使用现代工具在软件生命周期的早期识别缺陷。构建在生产之前捕获错误的 Python 工作流程一文首先出现在 Towards Data Science 上。
Building Robust Credit Scoring Models with Python
衡量信用评分中特征选择变量之间关系的实用指南。用 Python 构建稳健的信用评分模型一文首先出现在 Towards Data Science 上。