在计算化学中,分子通常表示为分子图,必须将其转换为多维向量才能进行处理,特别是在机器学习应用中。这是使用将分子结构编码为向量的分子指纹特征提取算法实现的。这些指纹对于化学信息学中的任务至关重要,例如化学空间多样性、聚类、虚拟筛选、Scikit-fingerprints:用于高效分子指纹计算和与机器学习管道集成的高级 Python 库首先出现在 AI Quantum Intelligence 上。
Machine learning has its limits when studying hard-to-see galaxies
南美和意大利的科学家发现,天文学家通常用来分析大型数据集的机器学习算法对天空中物体的分类能力不如研究相同数据的人类科学家。
Machine learning unlocks secrets to advanced alloys
麻省理工学院的一个团队使用计算机模型来测量金属中的原子模式,这对于设计用于航空航天、生物医学、电子等领域的定制材料至关重要。
随着数字商务的扩展,欺诈检测已成为保护参与在线交易的企业和消费者的关键。实施机器学习 (ML) 算法可以实时分析大量交易数据,以快速识别欺诈活动。这种先进的功能有助于降低金融风险并在不断扩展的数字市场中保护客户隐私。德勤是一家全球战略 […]
美国国家标准协会 (ANSI) 将于 2024 年 7 月举办两次单独的头脑风暴会议,探讨与关键和新兴技术 (CET) 相关的挑战和机遇。第一场活动,启用人工智能
How to Succeed as a Machine Learning Engineer in the Industry
5 条帮助我在 BigTech 不断超越期望的提示您是否想过要成为一名成功的机器学习工程师需要什么?您是否很难确定自己在这个充满活力的领域中的角色?我也有过这样的经历!嗨!我是 Kartik Singhal,Meta 的高级机器学习工程师。凭借在该领域的六年经验,我仍然发现自己每天都在学习。今天,我将分享五条秘诀,这些秘诀帮助我在 BigTech 担任高级机器学习工程师期间获得了“超出预期”的评级。💻 构建基础图片作者,来自 ChatGPT 4o 您需要很好地理解机器学习基础知识,并意识到其在实际应用中的局限性。了解核心概念:掌握监督学习与无监督学习、分类与回归的基础知识,以及深度学习的基础知
Fraud Prediction with Machine Learning in the Financial Industry: A Data Scientist’s Experience
一位一线数据科学家的见解和经验照片由 Growtika 在 Unsplash 上拍摄 各位数据爱好者们,大家好!我想通过几篇文章与大家分享我 3 年开发机器学习模型来预测金融行业欺诈行为的经验。因此,如果您在欺诈检测项目中扮演项目经理、数据科学家、ML 工程师、数据工程师、Mlops 工程师、欺诈分析师或产品经理的任何角色,您可能会发现这篇文章很有帮助。在本系列的第一篇文章中,我想讨论以下几点:要解决的业务问题是什么项目的高级步骤业务问题每天,全球有数百万人使用汇款服务。这些服务帮助我们向亲人汇款,并使购物变得更容易。但欺诈者利用这些系统诱骗他人向他们汇款或接管他们的账户进行欺诈。这会伤害受害
International Conference on Machine Learning (ICML) 2024
Apple 赞助了 2024 年国际机器学习会议 (ICML),该会议将于 7 月 21 日至 27 日在奥地利维也纳的 Messe Wien 展览和会议中心举行。ICML 因展示和发表机器学习各个方面的前沿研究而闻名全球,这些研究用于密切相关的领域,如人工智能、统计学和数据科学,以及机器视觉、计算生物学、语音识别和机器人技术等重要应用领域。以下是我们在 ICML 2024 上赞助的研讨会和活动的时间表。
Physics + Machine Learning Provide a Better Map of Ocean Measurements
一项新研究提供了一个引人注目的例子,其中动态建模、机器学习和海洋测量的结合增强了对海洋学的理解、监测和测绘。
The Future Of Learning: How AI And Machine Learning Are Shaping Education
探索人工智能和机器学习如何通过个性化学习、增强的教师能力和面向未来的学习环境的道德考虑来彻底改变教育。这篇文章首次发表于 eLearning Industry。
How to Test Machine Learning Systems
从概念到实用的代码片段,实现有效测试图片来自作者软件开发中的测试至关重要,因为它可以保证交付给客户的价值。交付成功的产品不是一次性的努力;而是一个持续的过程。为了确保持续交付,我们必须定义成功,整理数据,然后训练和部署我们的模型,同时持续监控和测试我们的工作。为了持续交付,我们必须定义成功,整理数据,然后训练和部署我们的模型,同时持续监控和测试我们的工作。机器学习系统中的“信任”不仅仅需要测试;它必须集成到整个生命周期中(如我的另一篇博客所示)。TRUST 的机器学习流程可以在“如何以合理的方式在机器学习中构建 TRUST”中描述(图片来自作者)。在深入讨论详细部分之前,这里有一个简短的 TL
Julia for Development, Machine Learning, and Data Analysis
大家好,在我之前的博客中,我们介绍了 Julia 是什么、它的应用程序以及如何安装它。现在,让我们深入了解 Julia 并探索它的软件包。Julia 是科学计算领域的新星,它提供了速度、优雅和丰富的软件包生态系统的完美结合。但它的影响范围不仅限于 […]Julia 用于开发、机器学习和数据分析的文章首先出现在 Spritle 软件上。
作为 IBM 的 AI 工程师,Marie de Groot 拥有双硕士学位,在初创公司和跨国公司工作了五年,积累了丰富的经验。她因在为大型银行和电信公司开发和完善生成式 AI 和机器学习模型方面的专业知识而受到认可。作为公众演讲者和 […] 主席
生成流网络 (GFlowNets) 解决了机器学习中从非正则化概率分布中采样的复杂挑战。通过在构造的图上学习策略,GFlowNets 通过一系列步骤促进有效采样,近似目标概率分布。这种创新方法通过提供强大的框架来处理帖子这项机器学习研究试图在 GFlowNets 的背景下形式化泛化并将泛化与稳定性联系起来,首次出现在 AI Quantum Intelligence 上。
The Machine Learning Guide for Predictive Accuracy: Interpolation and Extrapolation
评估训练数据之外的机器学习模型简介近年来,机器学习 (ML) 和深度学习 (DL) 等数据驱动方法已应用于广泛的任务,包括机器翻译和个性化定制推荐。这些技术通过分析大量数据揭示了给定训练数据集中的一些模式。但是,如果给定的数据集存在一些偏差并且不包含您想要了解或预测的数据,则可能很难从训练模型中获得正确答案。照片由 Stephen Dawson 在 Unsplash 上拍摄让我们考虑一下 ChatGPT 的情况。ChatGPT 目前的最新版本是 ChatGPT 4o,该模型使用的数据训练到 2023 年 6 月(本文撰写时)。因此,如果您询问 2024 年发生的事情,而这些事情未包含在训练数据