用于训练关键词检索结果

超越手动标签:使用自动数据合成

Beyond Manual Labeling: How ProVision Enhances Multimodal AI with Automated Data Synthesis

人工智能(AI)改变了行业,使过程更加聪明,更快,效率。用于训练AI的数据质量对于其成功至关重要。为了使这些数据有用,必须准确地标记它,这是传统上手动完成的。但是,手动标记通常很慢,容易出错且昂贵。需要精确的[…]超出手动标签的帖子:提供如何增强具有自动数据合成的多模式AI,首先出现在Unite.ai上。

扩散模型预测 3D 基因组结构

Diffusion model predicts 3D genomic structures

此图显示了 Dip-C 研究中报告的几条染色体的三维基因组结构,这些染色体用于训练新的 ChromoGen 模型。图片来源:研究人员提供,由 MIT News 编辑。作者:Anne Trafton 您体内的每个细胞都包含相同的基因序列,但每个细胞仅表达其中的一部分 […]

优化 LLM 测试时间计算涉及解决元 RL 问题

Optimizing LLM test-time compute involves solving a meta-RL problem

TL;DR:训练模型以优化测试时间计算并学习“如何发现”正确答案,而不是学习“输出什么答案”的传统学习范式,这可以使模型更好地利用数据。迄今为止,改进大型语言模型 (LLM) 的主要策略是使用越来越多的高质量数据进行监督微调 (SFT) 或强化学习 (RL)。不幸的是,这种扩展形式似乎很快就会遇到障碍,预训练的扩展定律会趋于稳定,并且有报告称,用于训练的高质量文本数据可能在 2028 年耗尽,特别是对于更困难的任务,例如解决推理问题,这似乎需要将当前数据扩展约 100 倍才能看到任何显着的改进。LLM 在这些困难任务中的问题上的当前表现仍然令人失望(见示例)。因此,迫切需要数据高效的方法来训练

减少大型语言模型偏差以实现更好的 AI 的关键

The key to reducing Large Language Model bias for better AI

根据英国的分析,一个利用人文和社会科学见解的新框架可以帮助防止人工智能 (AI) 工具传播错误信息和歧视性内容。为了解决大型语言模型 (LLM) 系统(如 ChatGPT)的缺点,研究人员瞄准了用于训练 AI 的数据库并整合了相关原则 […]

美国空军的 F-22 猛禽噩梦刚刚到来

The Air Force’s F-22 Raptor Nightmare Has Just Arrived

要点和总结:美国空军面临一个关键的决定:资助下一代空中优势 (NGAD) 计划或对老化的 F-22 猛禽进行现代化改造。退役 32 架用于训练的老式 F-22 可以在四年内节省 18 亿美元,用于重新分配用于 NGAD 开发。 -NGAD 承诺提供无与伦比的隐身、人工智能驱动的态势感知和无人机协调能力。 -然而,[…]空军的 F-22 猛禽噩梦刚刚到来一文首先出现在 19FortyFive 上。

Aero-News:每日行情 (01.01.25)

Aero-News: Quote of the Day (01.01.25)

“波兰首架 F-35 战机的抵达对于我们的国家和盟友来说都是一个重要的里程碑,他们将在埃宾空军国民警卫队基地接受这款第五代战斗机的训练。我为 188 联队的整个团队以及 Razorback Range 和 Fort Chaffee 联合机动训练中心的工作人员感到非常自豪,他们的规划和工作使得自由之声今天重回河谷......” 来源:阿肯色州副官查德·布里奇斯准将评论道,波兰第五代 F-35 Lightning II 战斗机中的前两架于 2024 年 12 月 23 日抵达阿肯色州史密斯堡的埃宾空军国民警卫队基地,他们将在那里用于训练波兰战斗机飞行员驾驶最新一代战斗机。

奥地利宣布收购 M-346FA

Austria Announces Acquisition of M-346FA

奥地利国防部目前正在与意大利政府谈判采购合同,这 12 架飞机将用于训练和防空任务。奥地利已决定购买 Leonardo M-346FA,这是 M-346 高级喷气教练机 (AJT) 的轻型战斗机变体。奥地利报纸 Krone 援引军方消息人士的话称,一封信 […]The post 奥地利宣布收购 M-346FA 首先出现在 The Aviationist 上。

AI 训练研究货币化:风险和最佳实践

Monetizing Research for AI Training: The Risks and Best Practices

随着对生成式 AI 的需求不断增长,对用于训练这些系统的高质量数据的需求也在增长。学术出版商已开始将其研究内容货币化,以提供大型语言模型 (LLM) 的训练数据。虽然这一发展为出版商创造了新的收入来源,并为生成式 AI 赋能,但它 […]文章《将研究货币化用于 AI 训练:风险和最佳实践》首次出现在 Unite.AI 上。

每周回顾 2024 年 12 月 20 日

Weekly Review 20 December 2024

我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):如果人们一直说他们已经实现了通用人工智能,那么最终这可能是真的:https://futurism.com/openai-employee-claims-agi 看起来 OpenAI 还没有学会使用受版权保护的数据来训练其人工智能:https://www.extremetech.com/gaming/openai-appears-to-have-trained-sora-on-game-content 微软希望在澳大利亚和新西兰培训一百万人掌握人工

由于 F-16 战鹰战机,中国和俄罗斯失去了一笔大额战斗机销售

China and Russia Lost a Big Fighter Sale Thanks to the F-16 Fighting Falcon

F-16 交易要点:阿根廷空军 (FAA) 已从丹麦接收其首架 F-16B 战隼,标志着其在时隔八年后重振超音速能力的重要里程碑。Block 10 战斗机通过 KC-130H 货机拆解交付,最初将用于训练目的。-在未来五年内,23 […]文章《中国和俄罗斯因 F-16 战隼而失去大量战斗机销售》首次出现在 19FortyFive 上。

每周回顾 2024 年 12 月 13 日

Weekly Review 13 December 2024

我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):虽然我对将 AI 推向一切持怀疑态度,但这可能实际上是有用的:https://www.extremetech.com/computing/creators-of-arc-browser-tease-new-ai-browser所以 OpenAI 暂时不会运行广告支持的 AI:https://www.theregister.com/2024/12/02/openai_mulls_other_revenue_streams/AGI 六年后?我想,如果

不要让 NGAD 战斗机犯下 F-22 猛禽的“错误”

Don’t Let the NGAD Fighter Make the F-22 Raptor ‘Mistake’

要点:F-22 猛禽的动荡历史为美国空军在开发下一代空中优势 (NGAD) 战斗机时提供了教训。-由于 F-22 机队最多有 183 架飞机,关于是否退役用于训练的 32 架旧型号或以高达 35 亿美元的成本对其进行升级的争论仍在继续。-与此同时,NGAD 面临[…]文章《不要让 NGAD 战斗机犯下 F-22 猛禽的“错误”》首次出现在 19FortyFive 上。

Airborne 12.02.24:Electra FG EIS、Prez Osprey 问题、Starship 想要 25

Airborne 12.02.24: Electra FG EIS, Prez Osprey Problems, Starship Wants 25

还有:EAA Ray Foundation、MagniX Records、Ruko U11MINI Drone、RCAF PC-21s Elektra Solar 最近将其 Elektra Trainer 固定起落架 (FG) 系列的第一架飞机投入使用。这架电动飞机将用于训练德国兰茨胡特的 Lorenzen 飞行学校的学生。Elektra Trainer 自 2011 年以来一直在飞行,是德国超轻型飞机的一员。它是该公司 Elektra One 的改进版,机身更长,机翼加固。这架飞机拥有令人印象深刻的 25:1 滑翔比、1969 fpm 爬升率和 75 mph 巡航速度。一架 V-22 Osp

使用 vLLM 和带有 AWS AI 芯片的 Amazon EC2 实例提供 LLM

Serving LLMs using vLLM and Amazon EC2 instances with AWS AI chips

在过去一年中,大型语言模型 (LLM) 和生成式 AI 的使用呈爆炸式增长。随着强大的公开基础模型的发布,用于训练、微调和托管您自己的 LLM 的工具也变得民主化。在 AWS Trainium 和 Inferentia 上使用 vLLM 可以托管 LLM 以实现高性能 [...]

空客向德国武装部队交付首架 H145M“轻型战斗直升机”

Airbus delivers first H145M “Light Combat Helicopter” to German Armed Forces

空中客车直升机公司向德国武装部队交付了第一架 H145M“轻型战斗直升机”(Leichter Kampfhubschrauber),这距离签署最多 82 架的合同不到一年。此次交付标志着德国联邦国防军的一个里程碑,德国联邦国防军将部署这款多功能直升机用于训练、侦察、特种部队行动和轻型攻击任务。关键 […]

Kempner AI 集群被评为世界上最快的“绿色”超级计算机之一

Kempner AI cluster named one of world’s fastest ‘green’ supercomputers

计算能力可用于训练和运行人工神经网络,在理解自然和人工系统中智能基础方面取得关键进展

音频 AI 接受充满偏见和攻击性语言的数据训练

Audio AIs are trained on data full of bias and offensive language

用于训练音频生成 AI 模型的七个主要数据集使用“男人”或“男人”字眼的可能性是使用“女人”或“女人”字眼的三倍,引发了人们对偏见的担忧

适用于任何拉米牌变体的核心 AI

Core AI For Any Rummy Variant

拉米纸牌 AI 的分步指南作者使用 DALL-EMotivation 生成的图像当我正在为拉米纸牌游戏开发强化学习 (RL) 模型时,我到了需要 AI 对手进行环境设置并为模型训练做出贡献的阶段。然而,在网上搜索后,我发现为拉米纸牌游戏创建 AI 的资源有限,而且可用的少数解决方案对我来说太慢了。由于 AI 将用于训练,(没有它,训练时间已经很长),因此 AI 需要在处理速度和内存使用方面快速高效地运行。不用说,蛮力解决方案根本行不通,所以我不得不尝试各种算法和优化技术来实现适合训练的复杂性和速度。那么为什么要阅读这些文章?我们将在这里构建的是通用的、适应性强的,适用于您可能正在开发的几乎任何