torch, tidymodels, and high-energy physics
今天我们介绍 tabnet,这是“TabNet:专注可解释表格学习”的 torch 实现,与 tidymodels 框架完全集成。从本质上讲,tabnet 的设计只需要很少的数据预处理;多亏了 tidymodels,超参数调整(在深度学习中通常很麻烦)变得方便甚至有趣!
Some interesting links that I Tweeted about in the last week (I also post these on Mastodon, Threads, Newsmast, and Bluesky):How you can use AI to help when you are made redundant: https://www.informationweek.com/machine-learning-ai/7-ways-generative-ai-can-help-you-survive-a-layoff No mention of wh
Llama 4 family of models from Meta are now available in SageMaker JumpStart
今天,我们很高兴地宣布亚马逊萨吉式制造商Jumpstart的Llama 4 Scout和MaverickModels的可用性。在这篇博客文章中,我们将带您了解如何使用SageMaker Jumpstart进行部署和提示Allama-4-Scout-17b-16e-Inscruct模型。
IEEE Transactions on Artificial Intelligence, Volume 6, Issue 4, April 2025
1)通过异常控制和数据相干要求一致的反事实解释:Maria Movin,Federico Siciliano,Rui Ferreira,Fabrizio Silvestri,Gabriele tolomeipages,Gabriele tolomeipages:794-8042) Desai, Marimuthu PalaniswamiPages: 805 - 8153) Generation With Nuanced Changes: Continuous Image-to-Image Translation With Adversarial PreferencesAuthor(s): Yi
DreamerV3:AI som behärskar Minecraft och 150+ uppgifter med världsmodeller
Dreamer是一种强化算法,可以通过建立世界模型来掌握各种控制任务。与需要为每个新任务进行大量微调的专业算法不同,Dreamer可以使用固定的超级参数执行各种域。该算法由三个主要组成部分组成:一种世界模型,可以预测可能的文档的结果,[…] Dreamerv 3:AI掌握Minecraft和150多个具有世界模型的150多个数据的AI首次出现在AI新闻上。
我在上周发推文的一些有趣链接(我还将这些链接发布在Mastodon,Threads,NewsMast和Bluesky上):缺乏数据准备工作是使AI无法在癌症治疗方面发挥潜力:https://dataConomy.com/2025/2025/2025/03/03/13/13/why-13/why-13/why-cant-cant-yet-cant-yet-yet-yet-yet-yeat-yeatiment: https://www.theregister.com/2025/03/11/minja_attack_poisons_ai_model_memory/Outdated IT is hin
OpenAI, Anthropic, and Google Urge Action as US AI Lead Diminishes
Leading US artificial intelligence companies OpenAI, Anthropic, and Google have warned the federal government that America's technological lead in AI is “not wide and is narrowing” as Chinese models like Deepseek R1 demonstrate increasing capabilities, according to documents submitted to the US gove
Some interesting links that I Tweeted about in the last week (I also post these on Mastodon, Threads, Newsmast, and Bluesky):AI aren't empathetic, but they are starting to be able to fake it: https://dataconomy.com/2025/02/27/ai-is-advancing-but-can-chatbots-understand-human-feelings/Event-driven AI
Customize DeepSeek-R1 distilled models using Amazon SageMaker HyperPod recipes – Part 1
在这个两部分的系列中,我们讨论了如何通过使用deepSeek-R1模型及其蒸馏变量的预先构建的微调工作流(也称为“食谱”)来减少DeepSeek模型的自定义复杂性,并作为亚马逊SageMaker HyproPod食谱的一部分发布。 In this first post, we will build a solution architecture for fine-tuning DeepSeek-R1 distilled models and demonstrate the approach by providing a step-by-step example on customizing t
Weekly Review 28 February 2025
我在上周发推文(我还将这些链接发布在Mastodon,Threads,NewsMast和Bluesky上):使用刮擦数据来训练AI并不是出于版权法的目的“变革性”: https://techcrunch.com/2025/02/17/what------us-first-major-ai-copyright-ruling-might-might-meant-mean-for-ip-----------------------for-ip-law/seems像AI不断学习的后果是,他们经历了类似于年龄的人的衰落: https://www.extremetech.com/computing/ai-
The Method of Moments Estimator for Gaussian Mixture Models
音频处理是数字信号处理 (DSP) 和机器学习最重要的应用领域之一。对声学环境进行建模是开发数字音频处理系统(例如:语音识别、语音增强、声学回声消除等)的重要步骤。声学环境中充满了背景噪音,这些噪音可能来自多个来源。例如,[…]The post The Method of Moments Estimator for Gaussian Mixture Models appeared first on Towards Data Science.
我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):如何将机器学习模型部署到生产中:https://www.kdnuggets.com/guide-deploying-machine-learning-models-productionAI 公司在与军方打交道时走着一条细线:https://techcrunch.com/2025/01/19/the-pentagon-says-ai-is-speeding-up-its-kill-chain/AI 是英国零售商将用来降低员工成本的一项技术:http
Amazon Nova Foundation Models: Redefining Price and Performance in Generative AI
生成式 AI 通过实现独特的内容创建、自动化任务和引领创新来改变行业。在过去十年中,人工智能 (AI) 取得了显著进展。OpenAI 的 GPT-4 和谷歌的 Bard 等技术为生成式 AI 功能设定了新的基准。这些进步使企业能够简化复杂的运营、增强客户参与度并提高效率。[…] 文章 Amazon Nova Foundation Models:重新定义生成式 AI 的价格和性能首先出现在 Unite.AI 上。
我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):使用 AI 提高编程效率:https://arstechnica.com/ai/2025/01/how-i-program-with-llms/ 大多数公众并不了解同行评审与预印本的概念。作为研究人员,我们真的应该尽量避免使用预印本作为我们向公众所说的话的基础:https://www.science.org/content/article/preprints-often-make-news-many-people-don-t-know-what-
Weekly Review 27 December 2024
我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):为什么人工智能仍然无法处理大块文本:https://arstechnica.com/ai/2024/12/why-ai-language-models-choke-on-too-much-text/一旦经过训练,人工智能就会固守自己的观点,即使经过再训练也是如此:https://techcrunch.com/2024/12/18/new-anthropic-study-shows-ai-really-doesnt-want-to-be-force
Weekly Review 20 December 2024
我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):如果人们一直说他们已经实现了通用人工智能,那么最终这可能是真的:https://futurism.com/openai-employee-claims-agi 看起来 OpenAI 还没有学会使用受版权保护的数据来训练其人工智能:https://www.extremetech.com/gaming/openai-appears-to-have-trained-sora-on-game-content 微软希望在澳大利亚和新西兰培训一百万人掌握人工
已宣布今年或明年初将发布几款日本主题的新套件。日本的 Platz 发布了珍珠港外观的 Eduard 1/48 A6M2(上图),图片表明他们正在遵循零式战斗机颜色方面的最新潮流/理论,稍后会详细介绍。该套件主题是 BII-120,我很荣幸能够检查和分析 BII-124(由 Bob Alford 提供)零件上实际存在的油漆层,因此对此有一些看法。模型的侧面图(下图)看起来也有点奇怪。另一款 A6M2 零式战斗机套件,这次是 Border Models 的 1/35 比例,将于 1 月发布,将具有令人印象深刻的内部驾驶舱和发动机细节以及炸弹装备。包装盒艺术(上图)描绘的是 1945 年 4 月九州
Meshy AI Review: How I Generated 3D Models in One Minute
您是否曾花费数小时(甚至数天)精心创建 3D 模型,却感觉创作过程陷入了繁琐的技术细节中?作为有使用 Blender 进行项目经验的人,您并不孤单!耗时的工作流程是设计师和开发人员的常见痛点。事实上,平均 3D 模型创建 […]The post Meshy AI Review: How I Generated 3D Models in One Minute appeared first on Unite.AI.