From Multimodal LLMs to Generalist Embodied Agents: Methods and Lessons
我们研究了多模式大语言模型(MLLM)的能力,以解决超出传统语言和视觉任务的不同领域,这些模型通常受到培训。具体而言,我们的重点在于体现的AI,游戏,UI控制和计划等领域。为此,我们引入了将MLLM适应通才体现的代理(GEA)的过程。 GEA是一个单一的统一模型,能够通过多物种作用令牌将自己跨越这些各种领域的自身地接地。 GEA在大量的体现经验数据集中接受了监督学习和…
Trump’s vision for dismantling the Department of Education
教育部即将被特朗普裁撤。 细节尚未完全公布,但总统已表示计划解散教育部,并将其一些关键职能转移到其他地方。 教育部负责监督学生贷款、低收入学生的联邦基金、特殊教育项目等。杰夫·贝内特 (Geoff Bennett) 与《华盛顿邮报》的劳拉·梅克勒 (Laura Meckler) 进行了更多讨论。
Oklahoma Plan to Check Parents’ Citizenship Could Keep Kids from Going to School
四个月前,俄克拉荷马州共和党州督学 Ryan Walters 称赞塔尔萨公立学校逆转了全国城市学区入学趋势。学生人数不仅呈上升趋势,而且该学区还迎来了前所未有的英语学习者涌入。“这是对塔尔萨所做工作的极大证明,”他在一次 […] 上说道
Learning opportunities lost: COVID-19's impact on healthcare education
一项针对全国临床教育工作者的调查发现,在 Covid-19 大流行期间,许多放射学和放射治疗专业的学生尚未做好进入职场的准备。临床教育工作者(负责监督学生在医疗机构实习的高级医护人员)认为学生已准备好达到专业标准的比例从大流行前的 90% 下降到 2020 年和 2021 年的不到 25%。
Why school police officers may not be the most effective way to prevent violence
1975 年,只有 1% 的公立学校有自己的警察。如今,这一比例达到 44%。警察数量增加的主要原因是 1994 年的《暴力犯罪控制和执法法案》,该法案促成了联邦社区警务服务的成立,以监督学校雇用警察的资金。另一个原因是 1999 年的哥伦拜恩高中屠杀事件。从联邦政府到各个地区,学校需要警察来保护孩子们安全的想法很普遍。
Enhancing JEPAs with Spatial Conditioning: Robust and Efficient Representation Learning
这篇论文被 NeurIPS 2024 的自监督学习 - 理论与实践 (SSLTP) 研讨会接受。基于图像的联合嵌入预测架构 (IJEPA) 为使用蒙版图像建模框架进行表示学习提供了一种有吸引力的蒙版自动编码器 (MAE) 替代方案。IJEPA 通过在潜在空间而非输入空间中进行预测来驱动表示以捕获有用的语义信息。然而,IJEPA 依赖于精心设计的上下文和目标窗口来避免表示崩溃。IJEPA 中的编码器模块无法自适应地调节类型……
John Thompson: Ryan Walters Wants to be a Pea in Trump’s Pod
约翰·汤普森 (John Thompson) 描述了瑞安·沃尔特斯 (Ryan Walters) 为当选特朗普教育部长而展开的疯狂竞选。在担任州督学的俄克拉荷马州,沃尔特斯早在选举前就一直在推动特朗普的议程。他希望宗教进入学校,他希望解散教育部,他希望摧毁公立学校,他希望 [...]
Jointly learning rewards and policies: an iterative Inverse Reinforcement Learning framework with…
联合学习奖励和策略:具有排序合成轨迹的迭代逆强化学习框架一种新颖的可处理和可解释算法,用于从专家演示中学习照片由 Andrea De Santis 在 Unsplash 上拍摄简介模仿学习最近在机器学习社区中引起了越来越多的关注,因为它能够通过观察到的行为将专家知识转移到自主代理。第一类算法是行为克隆 (BC),旨在直接复制专家演示,将模仿过程视为监督学习任务,其中代理尝试匹配专家在给定状态下的行为。虽然 BC 简单且计算效率高,但它经常受到过度拟合和泛化能力差的影响。相比之下,逆强化学习 (IRL) 通过推断奖励函数来瞄准专家行为的潜在意图,该奖励函数可以解释专家的行为在考虑的环境中是最佳的
Former Superintendent Defeats MAGA Homeschooler for North Carolina Schools Chief
在领导北卡罗来纳州学校的竞选中,一位前学区负责人击败了一位参加 2021 年 1 月 6 日在华盛顿举行的“停止偷窃”集会的在家教育母亲。莫里斯“莫”格林 (Maurice “Mo” Green) 是一家进步基金会的退休领导人,他被民主党州长罗伊库珀 (Roy Cooper) 招募来竞选州督学,他击败了米歇尔 […]
How to Get Started on Your Data Science Career Journey
初学者在选择数据科学和 AI/ML 技能提升资源时需要考虑的六个方面照片由 Zach Graves 在 Unsplash 上拍摄简介照片由 Jonathan Kemper 在 Unsplash 上拍摄显而易见,在过去十年中,数据科学已发展成为市场上最抢手的技能之一。传统企业、科技公司、咨询公司、初创公司 — — 随便什么 — — 都在不断招聘数据科学专业人士。该领域对经验丰富的专家的需求量大,而供应相对短缺,使其成为一个非常有利可图的职业机会。要进入该领域并取得成功,您不仅需要深入了解可用的算法和软件包,还需要培养对哪些方法适用于哪些用例的直觉。此外,您还需要学习如何将现实世界的问题转化为数据
Fine-Tuning BERT for Text Classification
一个带有 Python 代码的可破解示例尽管当今的 100B+ 参数转换器模型是 AI 领域最先进的模型,但我们仍然可以使用较小的(<1B 参数)模型完成很多工作。在本文中,我将介绍一个这样的示例,即微调 BERT(1.1 亿个参数)以对网络钓鱼 URL 进行分类。我将首先介绍关键概念,然后分享示例 Python 代码。图片来自 Canva。微调微调涉及通过额外的训练将预训练模型调整到特定用例。预训练模型是通过无监督学习开发的,从而无需大规模标记数据集。然后,与从头开始训练相比,经过微调的模型可以利用预先训练的模型表示来显着降低训练成本并提高模型性能 [1]。微调大型语言模型 (LLM)将训练
A Novel Approach to Detect Coordinated Attacks Using Clustering
揭示隐藏的模式:对恶意行为进行分组聚类是无监督机器学习中的一种强大技术,它根据给定数据的固有相似性对其进行分组。与分类等依赖预先标记的数据来指导学习过程的监督学习方法不同,聚类对未标记的数据进行操作。这意味着没有预定义的类别或标签,相反,算法会在不事先知道分组应该是什么样子的情况下发现数据的底层结构。聚类的主要目标是将数据点组织成簇,其中同一簇内的数据点彼此之间的相似性高于不同簇中的数据点。这种区别使聚类算法能够形成反映数据中自然模式的组。本质上,聚类旨在最大化簇内相似性,同时最小化簇间相似性。这种技术在需要查找数据中隐藏的关系或结构的用例中特别有用,这使得它在欺诈检测和异常识别等领域很有价值
Hands-On Imitation Learning: From Behavior Cloning to Multi-Modal Imitation Learning
最突出的模仿学习方法概述,并在网格环境中进行测试照片由 Possessed Photography 在 Unsplash 上拍摄强化学习是机器学习的一个分支,它涉及通过标量信号(奖励)的引导进行学习;与监督学习相反,监督学习需要目标变量的完整标签。一个直观的例子来解释强化学习,可以用一所有两个班级的学校来解释,这两个班级有两种类型的测试。第一节课解决了测试并获得了完全正确的答案(监督学习:SL)。第二节课解决了测试并只获得了每个问题的成绩(强化学习:RL)。在第一种情况下,学生似乎更容易学习正确的答案并记住它们。在第二节课中,任务更难,因为他们只能通过反复试验来学习。然而,它们的学习更加稳健,
IEEE Transactions on Neural Networks and Learning Systems, Volume 35, Number 9, September 2024
1) 特邀编辑:图学习专题作者:Feng Xia、Renaud Lambiotte、Neil Shah、Hanghang Tong、Irwin King页数:11630 - 116332) 用于异质图学习的置换等变图框架作者:Jianfei Li、Ruigang Zheng、Han Feng、Ming Li、Xiaosheng Zhuang页数:11634 - 116483) MARML:多层网络中基于主题感知的深度表示学习作者:Da Zhang、Mansur R. Kabuka页数:11649 - 116604) 面向极端数据稀缺的稳健图半监督学习作者:Kaize Ding、Elnaz No
How to Succeed as a Machine Learning Engineer in the Industry
5 条帮助我在 BigTech 不断超越期望的提示您是否想过要成为一名成功的机器学习工程师需要什么?您是否很难确定自己在这个充满活力的领域中的角色?我也有过这样的经历!嗨!我是 Kartik Singhal,Meta 的高级机器学习工程师。凭借在该领域的六年经验,我仍然发现自己每天都在学习。今天,我将分享五条秘诀,这些秘诀帮助我在 BigTech 担任高级机器学习工程师期间获得了“超出预期”的评级。💻 构建基础图片作者,来自 ChatGPT 4o 您需要很好地理解机器学习基础知识,并意识到其在实际应用中的局限性。了解核心概念:掌握监督学习与无监督学习、分类与回归的基础知识,以及深度学习的基础知
快速启动和运行的概述,避免混淆照片由 Pao Dayag 在 Unsplash 上拍摄我们时不时都会考虑是否要尝试新的工具或尝试一个包,而这其中存在一些风险。如果该工具无法满足我的需求,或者需要几天时间才能运行,或者需要我没有的复杂知识,该怎么办?今天,我将分享我自己使用 PyTorch Tabular 启动和运行模型的经验的简单回顾,并提供代码示例,这些示例应该可以帮助其他考虑使用它的用户以最少的麻烦快速上手。这个项目始于一个相当高维的 CatBoost 模型,这是一个具有多类分类结果的监督学习用例。数据集有大约 30 个高度不平衡的类,我将在以后的文章中更详细地描述它们。我想尝试将神经网络
Omnipredictors for Regression and the Approximate Rank of Convex Functions
考虑监督学习设置,其目标是学习根据分布中的点 x 预测标签 y。损失函数类 L 和假设类 C 的全能预测器是这样的预测器,对于 L 中的每个损失,其预测的预期损失小于 C 中的最佳假设。自从 [GKR+21] 的工作引入这一概念以来,在 y∈{0,1} 的二元标签设置中已经有大量工作,但对于 y∈[0,1] 可以是连续的回归设置,人们知之甚少。我们的主要概念贡献是充分的概念……
Why Clustering Fails. And how to fix it | by Ryan Feather | Jul, 2024
以及如何解决它 您遇到了数据解释问题,因此尝试了聚类。现在您遇到了聚类解释问题!怀疑数据中可能存在模式。合理的是,希望通过无监督学习添加一些结构会带来一些见解。集群是查找帖子“为什么聚类失败。以及如何解决它”的首选工具 | 作者 Ryan Feather | 2024 年 7 月首次出现在 AI Quantum Intelligence 上。