Robot Gets Up Close to the Seabed Without Disturbing It
海底观测在保护海洋系统方面发挥着重要作用,它可以监测不同深度海底的物种和栖息地。这项工作主要由水下机器人完成,它们使用光学成像收集高质量数据,这些数据可输入环境模型,并在大规模海洋观测中补充通过声纳获得的数据。多年来,人们试用了不同的水下机器人,但许多机器人在进行近海底观测时都遇到了困难,因为它们会破坏珊瑚和破坏沉积物,从而扰乱当地海床。中国哈尔滨工程大学的王刚和他的研究团队最近开发了一种机动性水下航行器,它更适合海底作业,因为它不会干扰当地环境,因为它漂浮在海床上方,并拥有一个专门设计的螺旋桨系统来操纵。这些机器人可用于在研究海床的同时更好地保护海床,并改善保护海洋生物多样性和探索水下资源(
Optimizing LLM test-time compute involves solving a meta-RL problem
TL;DR:训练模型以优化测试时间计算并学习“如何发现”正确答案,而不是学习“输出什么答案”的传统学习范式,这可以使模型更好地利用数据。迄今为止,改进大型语言模型 (LLM) 的主要策略是使用越来越多的高质量数据进行监督微调 (SFT) 或强化学习 (RL)。不幸的是,这种扩展形式似乎很快就会遇到障碍,预训练的扩展定律会趋于稳定,并且有报告称,用于训练的高质量文本数据可能在 2028 年耗尽,特别是对于更困难的任务,例如解决推理问题,这似乎需要将当前数据扩展约 100 倍才能看到任何显着的改进。LLM 在这些困难任务中的问题上的当前表现仍然令人失望(见示例)。因此,迫切需要数据高效的方法来训练
什么是 Deepmode? DeepMode 是一个尖端的 AI 平台,专门用于创建个性化的数字克隆并生成独特的 AI 驱动图像。凭借其先进的人工智能技术,DeepMode 使用户能够将个人照片转换为逼真的“AI 双胞胎”。此功能使个人能够看到自己或他人的栩栩如生的图像,从而提供了一种与 AI 互动的创造性和创新性方式。该平台旨在满足初学者和有经验的用户的需求,提供直观、无缝的体验,只需极少的技术知识。无论您是寻求高质量数字表示的专业人士,还是探索 AI 功能的普通用户,DeepMode 都是 […]
Monetizing Research for AI Training: The Risks and Best Practices
随着对生成式 AI 的需求不断增长,对用于训练这些系统的高质量数据的需求也在增长。学术出版商已开始将其研究内容货币化,以提供大型语言模型 (LLM) 的训练数据。虽然这一发展为出版商创造了新的收入来源,并为生成式 AI 赋能,但它 […]文章《将研究货币化用于 AI 训练:风险和最佳实践》首次出现在 Unite.AI 上。
LexisNexis Launches Data+ API For AI Training
LexisNexis 宣布推出 Nexis Data+,它通过单一应用程序编程提供“对大量可信、高质量数据的直接访问...
Precision mass measurements of atomic nuclei reveal proton halo structure
中国科学院现代物理研究所 (IMP) 的研究人员及其合作者首次对几个奇异原子核进行了精确的质量测量。利用这些质量数据,他们确定了铝、磷、硫和氩元素的质子滴线,并提出了一种揭示质子晕结构的新方法。
Ensemble Learning for Anomaly Detection
深入研究隔离森林模型以检测时间序列数据中的异常异常检测是任何组织必备的功能。通过检测异常和离群值,我们不仅可以识别看似可疑(或可能错误)的数据,还可以确定“正常”数据是什么样子。异常检测可以识别数据错误,从而成为强大数据治理系统的重要功能。对于分析而言,异常值在某些情况下(例如欺诈检测和预测性维护)可能是一个关注点。然而,随着数据的增长,异常检测会变得越来越困难。高维数据带有噪声,难以用于分析和洞察。大型数据集也可能存在错误和/或特殊情况。值得庆幸的是,集成学习带来了速度和效率,帮助我们处理高维数据并检测异常。什么是集成学习?集成学习是一种机器学习技术,它结合了多个单独模型的预测,以获得比任何
Enhanced Sequencing Results from Liquid Biopsies
使用针对无细胞 DNA (cfDNA) 优化的文库制备试剂盒可为早期癌症检测提供高质量数据。
Data Preparation and Quality for AI Projects- FuseBytes S2E3 Recap
在 FuseBytes 第 2 季第 3 集中,主持人 Nate Rackiewicz 与数据耳语者 Scott Taylor 携手。他们共同探索确保 AI 计划建立在高质量数据坚实基础之上的关键策略。文章《AI 项目的数据准备和质量 - FuseBytes S2E3 回顾》首先出现在 Fusemachines 上。
Как «приготовить» Data Quality
数据质量正在成为俄罗斯公司的热门话题。 KORUS Consulting 的数据治理专家 Maria Rusina 谈论如何实现高质量数据。
Military Justice: Actions Needed to Help Ensure Success of Judge Advocate Career Reforms
GAO 的发现2021 年,国防部 (DOD) 要求军队建立军事司法职业道路,允许军事律师(即法官辩护人)专门担任诉讼律师(例如审判律师、辩护律师、和军事法官)。海军自 2007 年起就实施了此类计划,到 2022 年,陆军、海军陆战队和空军已提交了各自的职业道路计划。然而,政府问责局发现了可能阻碍这些法官律师职业改革取得成功的问题。具体来说,服务:没有沟通策略。陆军、海军陆战队和空军已经开始推广他们新建立的职业道路。然而,在这次审查中接受采访的法官辩护人告诉政府问责办公室,总的来说,这三个部门的诉讼律师不相信这会导致整个部门的文化变革。制定和实施一项策略来传达职业道路的建立和领导支持可能有助
Ukraine: DOD Should Improve Data for Both Defense Article Delivery and End-Use Monitoring
GAO 发现自 2022 年 2 月俄罗斯开始全面入侵以来,美国已向乌克兰政府提供了超过 420 亿美元的安全援助,包括国防物品、培训和服务。原产于美国的国防物品主要通过总统提款授权 (PDA) 和乌克兰安全援助计划 (USAI) 提供,前者允许总统从美国库存中转移物品和服务,后者是美国政府可用于提供物品和服务的乌克兰安全援助计划 (USAI)。向乌克兰提供服务。国防部 (DOD) 建立了新实体,利用 PDA 和 USAI 在短时间内向乌克兰交付数量空前的国防物品。然而,国防部尚未完整记录这些新实体的角色和职责。这样做将有助于明确在当前和潜在的未来冲突中快速交付国防物品的流程......从飞机
GAO 的发现几十年来,小企业创新研究 (SBIR) 计划一直为小企业提供联邦资金,用于技术开发和商业化。 2022 财年 (FY),11 个参与的联邦机构向小企业颁发了 5,000 多个 SBIR 奖项,价值近 40 亿美元。 2011 年,国会修订了《小企业法》,赋予参与机构向由多家风险投资运营公司 (VCOC)、对冲基金或私募股权公司(即“合格的小企业”)多数股权的某些小企业颁发 SBIR 奖励的权力。企业”)。使用此权力的机构必须首先向负责监督 SBIR 计划的小企业管理局 (SBA) 和某些国会委员会提交书面决定。四个机构已利用这一权力将合格的小企业纳入其 SBIR 计划。其中只有两
Rethinking the Role of PPO in RLHF
重新思考 PPO 在 RLHF 中的作用TL;DR:在 RLHF 中,奖励学习阶段(以比较的形式使用人类偏好)与 RL 微调阶段(优化单一的非比较奖励)之间存在矛盾。如果我们以比较的方式执行 RL 会怎么样?图 1:此图说明了绝对反馈和相对反馈的强化学习之间的区别。通过合并新组件 - 成对策略梯度,我们可以统一奖励建模阶段和 RL 阶段,从而实现基于成对响应的直接更新。大型语言模型 (LLM) 为功能越来越强大的虚拟助手提供支持,例如 GPT-4、Claude-2、Bard 和 Bing Chat。这些系统可以响应复杂的用户查询、编写代码,甚至创作诗歌。这些令人惊叹的虚拟助手背后的技术是带人类
Leading Practices: Iterative Cycles Enable Rapid Delivery of Complex, Innovative Products
为什么这很重要 代理商越来越多地采购复杂的产品,例如硬件和软件的组合网络,这需要新的流程来设计、生产和交付。 GAO 发现,为了始终如一地向用户快速交付产品,这些网络(称为网络物理系统,例如飞机和无人驾驶车辆)的采办计划必须采用新方法来评估绩效和评估执行风险。不过,解决方案不太可能完全来自政府内部。相反,识别领先公司所依赖的创建网络物理产品的实践可以为政府采购领导者提供关键的前沿信息,进而最终帮助制定机构采购流程的变革。 20 多年来,GAO已向国防部 (DOD) 和国土安全部 (DHS) 以及美国国家航空航天局 (NASA) 提出了许多建议,以实施其主要采购计划的最佳实践,从而支持领先公司的
How to Choose the Right Off-the-Shelf AI Training Data Provider?
为机器学习算法构建一个提供准确结果的高质量数据集是一项挑战。开发精确的机器学习代码来提供用户预期的结果需要大量的时间和精力。然而,许多组织试图通过为人工智能训练计划提供现成的内容来简化这一挑战。现成的训练数据本质上是一种解决方案,由 [...]
GAO 的发现美国有多种机器学习 (ML) 技术可用于协助诊断过程。由此带来的好处包括更早发现疾病;医疗数据分析更加一致;以及增加获得护理的机会,特别是对于服务不足的人群。 GAO 确定了针对五种选定疾病(某些癌症、糖尿病视网膜病变、阿尔茨海默病、心脏病和 COVID-19)的各种基于 ML 的技术,其中大多数技术依赖于 X 射线或磁共振成像 (MRI) 等成像数据)。然而,这些机器学习技术普遍没有被广泛采用。学术界、政府和私营部门的研究人员正在努力扩展基于机器学习的医疗诊断技术的能力。此外,GAO 还确定了三种更广泛的新兴方法——自主、自适应和面向消费者的机器学习诊断——可用于诊断各种疾病。
Estimating the Effect of Physical Infrastructure on Economic Growth
我有一篇新的工作论文,与世界银行的 Govinda Timilsina 和我的博士生 Debasish Das 合著。这是一项面板数据研究,研究各种形式的基础设施对 GDP 水平的影响。与现有研究相比,我们使用了更新的数据,包括移动电话等新型基础设施,并为发展中国家和发达国家提供了单独的估计值。我们发现的影响比大多数以前的研究都要大。我们还发现,基础设施在最近几年(1992-2017 年)的影响比前几年(1970-1991 年)更大,基础设施在发展中经济体的影响高于工业化经济体。长期影响似乎比最初的影响大得多。我们还试图估计基础设施对经济增长率的影响。控制初始人均 GDP 水平,我们发现结果为