depyf: Open the Opaque Box of PyTorch Compiler for Machine Learning Researchers
PyTorch \texttt{2.x} 引入了一个旨在加速深度学习程序的编译器。然而,对于机器学习研究人员来说,充分发挥 PyTorch 编译器的潜力可能具有挑战性。编译器在 Python 字节码级别运行,使其看起来像一个不透明的盒子。为了解决这个问题,我们引入了 \texttt{depyf},这是一个旨在揭开 PyTorch 编译器内部工作原理的工具。 \texttt{depyf} 将 PyTorch 生成的字节码反编译回等效的源代码,并在内存中的代码对象与其磁盘上的源代码之间建立连接...
The Evolving Role of the ML Engineer
Stephanie Kirmer 讲述了 2000 亿美元的投资泡沫、人工智能公司如何重建信任,以及她的日常工作如何随着法学硕士的兴起而发生变化。机器学习工程师的角色演变一文首先出现在《走向数据科学》上。
Machine Learning Meets Markowitz
Yijie Wang、Hao Gau、Campbell R. Harvey、Yan Liu 和 Xinyuan Tao 在这篇新的 NBER 论文中让机器学习与 Harry Markowitz 相遇:投资组合选择的标准方法包括两个阶段:预测资产回报,然后将其插入优化器。我们认为这种分离是有严重问题的。第一阶段处理横截面 [...]
A Machine Learning-Enabled Venom Peptide Platform for Rapid Drug Discovery
用于快速药物发现的机器学习毒液肽平台摘要背景/目标:大自然已进化出数百万种具有多种生物功能的毒液衍生肽,其中很大一部分靶向复杂的膜蛋白,例如 G 蛋白偶联受体和离子通道。许多这些肽通过多个二硫键稳定,赋予它们优异的结构稳定性和有利的药理学特性。方法:利用这种自然多样性,我们开发了一个基于噬菌体展示技术的强大的毒液肽治疗发现系统,并使用大约 482 个毒液衍生支架构建了一个库。该文库设计以机器学习 (ML) 模型为指导,该模型能够预测耐受突变的残基,从而保留肽的可折叠性,最大限度地提高结构完整性和序列多样性。结果:通过筛选四种不同靶标(CD47、DLL3、IL33 和 P2X7R)对所得 VCX
Unlock Growth With AI And Machine Learning
通过人工智能和机器学习解锁增长——信息图 标题为“通过人工智能和机器学习解锁增长”的信息图清晰、结构化地概述了企业如何通过增长人工智能实现可持续成功。它强调了人工智能和机器学习可以改变运营、改进决策和推动创新的五个核心领域。旅程始于[…]《用人工智能和机器学习解锁增长》一文首先出现在电子学习信息图表上。
The Machine Learning Lessons I’ve Learned Last Month
一月延迟:截止日期、停机时间和流程时间《我上个月学到的机器学习课程》一文首先出现在《走向数据科学》上。
Is Your Machine Learning Pipeline as Efficient as it Could Be?
以下是需要审核的五个关键管道领域,以及节省团队时间的实用策略。
Forthcoming machine learning and AI seminars: February 2026 edition
本文包含计划于 2026 年 2 月 4 日至 3 月 31 日期间举行的人工智能相关研讨会的列表。此处详细介绍的所有活动都是免费开放的,任何人都可以虚拟参加。 2026 年 2 月 4 日“公共”,被颠覆:技术对民主的变革性影响 演讲者:Neli Frost 组织者:[…] 研究所
Machine Learning in Production? What This Really Means
从笔记本电脑到现实世界的系统生产中的后机器学习?这到底意味着什么首先出现在《走向数据科学》上。
Modeling Urban Walking Risk Using Spatial-Temporal Machine Learning
根据现实世界的事件数据估计社区级行人风险使用时空机器学习对城市步行风险进行建模的帖子首先出现在走向数据科学上。
Causal ML for the Aspiring Data Scientist
对因果推理和机器学习的简单介绍《面向有抱负的数据科学家的后因果机器学习》首先出现在《走向数据科学》上。
Why it’s critical to move beyond overly aggregated machine-learning metrics
新研究发现了错误相关性的隐藏证据,并提供了一种提高准确性的方法。
Google Trends is Misleading You: How to Do Machine Learning with Google Trends Data
Google Trends 是用于大规模分析人类行为的最广泛使用的工具之一。记者使用它。数据科学家使用它。整篇论文都是建立在它的基础上的。但 Google 趋势数据有一个基本属性,使其很容易被滥用,特别是当您正在处理时间序列或尝试构建模型时,而大多数人从未意识到他们正在这样做。Google 趋势误导了您:如何使用 Google 趋势数据进行机器学习一文首先出现在《走向数据科学》上。
DopFone app can accurately track fetal heart rate using only a smartphone
由华盛顿大学研究人员领导的团队创建了 DopFone,该系统使用现成智能手机的现有扬声器和麦克风来准确估计胎儿心率。这款手机模仿多普勒超声波,发出声音并聆听胎儿心跳引起的回声的细微变化。然后机器学习模型估计心率。
Scaling Feature Engineering Pipelines with Feast and Ray
在生产机器学习系统中利用 Feast 等特征存储和 Ray 等分布式计算框架使用 Feast 和 Ray 扩展特征工程管道的帖子首先出现在《走向数据科学》上。
Tech Is Taking Over Olympic Curling
在今年的意大利冬奥会上,争议从指尖开始。一次有争议的双触——冰壶运动员是否刷过一块移动的石头两次——引发了抗议、充满脏话的交流以及关于体育精神的激烈争论。在一项以相互信任和将竞争作为共同技能测试理念为荣的游戏中,即使是不当行为的暗示也可能远远超出单一结果。但如果双击可以动摇这项运动,那么当争议不是关于指尖而是关于算法时会发生什么?这个问题掩盖了由机器学习和新一代人工智能驱动的机器人驱动的分析的兴起,这些机器人可以扔石头,读冰,并以机器精度计算策略。相关:米兰-科尔蒂纳冬奥会首次亮相的下一代运动智能机器人中的一些机器人,例如“Curly”,已经在正面竞争中击败了人类精英对手。其他人的设计要么是为
Lockheed Martin tests new F-35 AI capabilities
在内华达州内利斯空军基地进行的“守望先锋”项目试飞期间,洛克希德·马丁公司构建和训练的人工智能/机器学习模型解决了发射器之间的 ID 模糊性,提高了态势感知并减少了飞行员决策延迟。
5 Python Data Validation Libraries You Should Be Using
这五个库从非常不同的角度进行验证,这正是它们重要的原因。每个问题都解决了现代数据和机器学习工作流程中反复出现的一类特定问题。