拉米纸牌 AI 的分步指南作者使用 DALL-EMotivation 生成的图像当我正在为拉米纸牌游戏开发强化学习 (RL) 模型时,我到了需要 AI 对手进行环境设置并为模型训练做出贡献的阶段。然而,在网上搜索后,我发现为拉米纸牌游戏创建 AI 的资源有限,而且可用的少数解决方案对我来说太慢了。由于 AI 将用于训练,(没有它,训练时间已经很长),因此 AI 需要在处理速度和内存使用方面快速高效地运行。不用说,蛮力解决方案根本行不通,所以我不得不尝试各种算法和优化技术来实现适合训练的复杂性和速度。那么为什么要阅读这些文章?我们将在这里构建的是通用的、适应性强的,适用于您可能正在开发的几乎任何
Top Data Science Career Questions, Answered
我做数据科学家已经 3 年多了。这是大多数人想了解的关于这个领域的事情。继续阅读《走向数据科学》»
How to Query a Knowledge Graph with LLMs Using gRAG
Google、Microsoft、LinkedIn 和许多其他科技公司都在使用 Graph RAG。为什么?让我们通过从头开始构建一个来理解它。继续阅读 Towards Data Science »
Rethinking LLM Benchmarks: Measuring True Reasoning Beyond Training Data
Apple 的新 LLM 基准 GSM-Symbolic继续阅读 Towards Data Science »
Exploring Recursive Art: Fractals with Context Free
使用简单规则和形状生成复杂图像继续阅读 Towards Data Science »
Watermarking for AI Text and Synthetic Proteins: Fighting Misinformation and Bioterrorism
Nataliya Smirnova 在 UnSplash 上拍摄的彩色病毒突变图像 人工智能文本和合成蛋白的水印 机器学习工程师了解人工智能在生物领域的应用 错误信息和生物恐怖主义并不是新威胁,但它们的规模和易用性迅速增加。法学硕士让制造挑拨离间自主聊天机器人变得轻而易举,而生成蛋白质设计模型则大大扩大了能够进行生物战的参与者的数量。作为一个社会,我们需要的工具多种多样,但一个重要的组成部分是我们检测它们存在的能力。这就是水印的作用所在。水印或数字水印与用来劫持您孩子的学校照片的物理水印不同,是一种用于识别所有权的秘密信号。有效的水印必须坚固耐用,经得起修改,同时在没有专门方法的情况下无法被检
现有的人工智能可能有知觉吗?如果没有,那还缺少什么?当今的大型语言模型 (LLM) 已经非常擅长生成听起来深思熟虑且聪明的类似人类的响应。许多人都认为 LLM 已经达到了艾伦·图灵著名测试的门槛,该测试的目标是在对话中表现得与人无异。这些 LLM 能够生成听起来深思熟虑且聪明的文本,并且可以令人信服地模仿情绪的表现。智能的幻觉尽管它们能够令人信服地模仿人类的对话,但当前的 LLM 不具备思考或情感的能力。它们产生的每个单词都是基于从大量文本数据中学习到的统计模式的预测。随着每个单词一次生成,此预测过程会重复发生。与人类不同,LLM 无法记忆或自我反思。它们只是按顺序输出下一个单词。预测下一个单
Beyond Math and Python: The Other Key Data Science Skills You Should Develop
想要写出你的第一篇 TDS 文章吗?我们随时欢迎新作者的投稿。通往数据科学成功的路线图提供了许多不同的路径,但其中大多数都重点关注数学和编程技能(例如:Saankhya Mondal 本周早些时候发布的这份针对有抱负的数据专业人士的优秀指南)。但是,一旦你在这些领域打下了基础,下一步是什么?数据科学家需要在哪些主题上积累专业知识,才能在拥挤的就业市场中脱颖而出?我们每周的亮点将聚焦于你可能希望在未来几周和几个月内探索的一些领域,并提供来自广泛行业和学术角色的作者的可行建议。从掌握数据基础设施的来龙去脉到拓展讲故事的技能,让我们仔细看看其中一些边缘但仍然至关重要的潜在增长领域。超越技能:释放数据
Random Forest, Explained: A Visual Guide with Code Examples
集成学习使用随机树进行复杂的预测决策树分类器说明:带有代码示例的可视化指南,适合初学者决策树是机器学习的一个很好的起点 — — 它们清晰且有意义。但有一个问题:它们在处理新数据时往往效果不佳。预测可能不一致且不可靠,这在您尝试构建有用的东西时是一个真正的问题。这就是随机森林的用武之地。它吸收了决策树的优点,并通过将多棵树组合在一起使它们更好地工作。它已成为许多数据科学家最喜欢的工具,因为它既有效又实用。让我们看看随机森林是如何工作的,以及为什么它可能正是您下一个项目所需要的。现在是时候停止迷失在树木中,看看森林的真面目了 — — 这是您在机器学习中的下一个可靠工具。所有视觉效果:作者使用 Ca
Classify Jira Tickets with GenAI On Amazon Bedrock
使用快速工程和大型语言模型 (LLMS) 替代传统的 NLP 方法,用于 Jira 票证文本分类。代码示例演练照片由 Annie Spratt 在 Unsplash 上拍摄还记得分类文本意味着踏上机器学习之旅的日子吗?如果您在 ML 领域待的时间足够长,您可能已经目睹了至少一个团队在构建“完美”文本分类系统的兔子洞中消失。故事通常是这样的:第 1 个月:“我们只需快速训练一个 NLP 模型!”第 2 个月:“我们需要更多的训练数据……”第 3 个月:“这已经足够好了”多年来,文本分类已经落入了经典 ML 的范畴。在我职业生涯的早期,我记得训练了一个支持向量机 (SVM) 来进行电子邮件分类。大
Reducing the Size of AI Models
在边缘设备上运行大型 AI 模型使用 Pixlr 创建的图像AI 模型,尤其是大型语言模型 (LLM),需要大量的 GPU 内存。例如,对于 2024 年 7 月发布的 LLaMA 3.1 模型,内存要求如下:80 亿参数模型需要 16 GB 内存(16 位浮点权重)更大的 4050 亿参数模型需要 810 GB(使用 16 位浮点数)在全尺寸机器学习模型中,权重表示为 32 位浮点数。现代模型具有数亿到数百亿(甚至数千亿)的权重。训练和运行如此大的模型非常耗费资源:它需要大量的计算(处理能力)。它需要大量的 GPU 内存。它会消耗大量的能源,特别是,造成这种能源消耗的最大因素是:- 使用 3
Let There Be Light! Diffusion Models and the Future of Relighting
在这篇关于场景编辑的深入博客中,了解尖端扩散模型如何处理重新照明、协调和阴影消除。照片由 Brian Aitkenhead 在 Unsplash 上拍摄。重新照明是在给定输入场景的情况下,在指定的目标照明条件下渲染场景的任务。这是计算机视觉和图形学中的关键任务。然而,这是一个不适定问题,因为场景中物体的外观是由光源、几何形状和表面材料属性等因素之间的复杂相互作用产生的。这些相互作用产生了歧义。例如,给定一个场景的照片,物体上的黑点是由于照明投射的阴影造成的,还是材料本身的颜色很暗?区分这些因素是有效重新照明的关键。在这篇博文中,我们讨论了不同的论文如何通过扩散模型解决重新照明问题。重新照明包含
Using Offline Reinforcement Learning To Trial Online Platform Interventions
离线强化学习和模拟以制定在线参与策略继续阅读数据科学 »
让您的 AI 任务区分困难和简单问题在这篇立场文件中,我讨论了一个前提,即许多潜在的性能增强都被搁置了,因为我们通常不解决动态执行的潜力。我想我需要首先定义在这种情况下什么是动态执行。正如你们许多人无疑知道的那样,我们经常通过仔细研究模型本身以及可以做些什么来使该模型的处理更高效(可以通过更低的延迟、更高的吞吐量和/或节能来衡量)来解决性能优化问题。这些方法通常解决模型的大小问题,因此我们会寻找压缩模型的方法。如果模型较小,则内存占用和带宽要求会得到改善。一些方法还解决了模型中的稀疏性问题,从而避免了无关紧要的计算。不过……我们只关注模型本身。这绝对是我们想要做的事情,但是还有其他机会可以利用
What I Learned from Teaching Tech for the Past 2 Years
为教师和导师提供有关技术教学的提示和技巧继续阅读《走向数据科学》»
When Machines Think Ahead: The Rise of Strategic AI
战略人工智能探索战略人工智能的进步以及大型语言模型如何融入大局作者使用 Canva Magic Studio 生成的图片序言1997 年 5 月 11 日,纽约市。纽约市春光明媚。天空晴朗,气温攀升至 20 摄氏度。洋基队准备在洋基体育场与堪萨斯城皇家队比赛,游骑兵队则在麦迪逊广场花园与魔鬼队对决。一切似乎都不寻常,然而,聚集在曼哈顿中城公平中心的人们即将体验到真正独特的体验。他们即将见证这一历史性事件:一台计算机将首次在标准比赛条件下击败国际象棋卫冕世界冠军。代表人类的是加里·卡斯帕罗夫,他当时被公认为世界顶级国际象棋选手。代表机器的是深蓝——IBM 开发的国际象棋计算机。进入比赛的最后一局