Serving LLMs using vLLM and Amazon EC2 instances with AWS AI chips
在过去一年中,大型语言模型 (LLM) 和生成式 AI 的使用呈爆炸式增长。随着强大的公开基础模型的发布,用于训练、微调和托管您自己的 LLM 的工具也变得民主化。在 AWS Trainium 和 Inferentia 上使用 vLLM 可以托管 LLM 以实现高性能 [...]
Airbus delivers first H145M “Light Combat Helicopter” to German Armed Forces
空中客车直升机公司向德国武装部队交付了第一架 H145M“轻型战斗直升机”(Leichter Kampfhubschrauber),这距离签署最多 82 架的合同不到一年。此次交付标志着德国联邦国防军的一个里程碑,德国联邦国防军将部署这款多功能直升机用于训练、侦察、特种部队行动和轻型攻击任务。关键 […]
Kempner AI cluster named one of world’s fastest ‘green’ supercomputers
计算能力可用于训练和运行人工神经网络,在理解自然和人工系统中智能基础方面取得关键进展
Audio AIs are trained on data full of bias and offensive language
用于训练音频生成 AI 模型的七个主要数据集使用“男人”或“男人”字眼的可能性是使用“女人”或“女人”字眼的三倍,引发了人们对偏见的担忧
拉米纸牌 AI 的分步指南作者使用 DALL-EMotivation 生成的图像当我正在为拉米纸牌游戏开发强化学习 (RL) 模型时,我到了需要 AI 对手进行环境设置并为模型训练做出贡献的阶段。然而,在网上搜索后,我发现为拉米纸牌游戏创建 AI 的资源有限,而且可用的少数解决方案对我来说太慢了。由于 AI 将用于训练,(没有它,训练时间已经很长),因此 AI 需要在处理速度和内存使用方面快速高效地运行。不用说,蛮力解决方案根本行不通,所以我不得不尝试各种算法和优化技术来实现适合训练的复杂性和速度。那么为什么要阅读这些文章?我们将在这里构建的是通用的、适应性强的,适用于您可能正在开发的几乎任何
Royal Canadian Air Force to get 19 Airbus H135 military training helicopters
空中客车直升机公司与加拿大国防领军企业 CAE 和 KF Aerospace 的合资企业 SkyAlyne 签署了一项具有里程碑意义的合同,为加拿大皇家空军 (RCAF) 提供 19 架空中客车 H135 直升机,用于训练下一代 RCAF 飞行员。该合同是加拿大未来机组人员培训 (FAcT) 计划的一部分,标志着空中客车直升机首次作为加拿大武装部队的一部分飞行。双引擎直升机将在位于加拿大安大略省伊利堡的空中客车直升机工业基地完成和交付。它们将使用加拿大开发的多项补充型号合格证进行定制,包括对航空电子设备和通信系统的修改,以及对驾驶舱的定制开发。预计交付将于 2026 年上半年开始。“SkyAl
On the Programmability of AWS Trainium and Inferentia
使用自定义运算符加速 AI/ML 模型训练 — 第 4 部分照片由 Agata Bres 在 Unsplash 上拍摄在这篇文章中,我们继续探索通过自定义运算符开发来优化机器学习 (ML) 工作负载运行时的机会。这一次,我们重点介绍 AWS Neuron SDK 提供的工具,用于在 AWS Trainium 和 AWS Inferentia 上开发和运行新内核。随着推动 AI 革命的低级模型组件(例如注意层)的快速发展,用于训练和运行 ML 模型的加速器的可编程性至关重要。专用 AI 芯片必须为广泛使用且影响深远的通用 GPU (GPGPU) 开发框架(例如 CUDA 和 Triton)提供有
我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):我认为这是不使用 AI 生成重要代码或材料的最大原因——不良行为者太容易将恶意代码注入所使用的模型中:https://arstechnica.com/tech-policy/2024/10/bytedance-intern-fired-for-planting-malicious-code-in-ai-models/Google 的 AI 调解员,有助于引导人们达成一致:https://arstechnica.com/ai/2024/10/goo
Data Leakage in Preprocessing, Explained: A Visual Guide with Code Examples
数据预处理预处理管道泄漏的 10 种隐秘方式在我教授机器学习的经验中,学生经常会遇到同样的问题:“我的模型表现很好——准确率超过 90%!但是当我将其提交给隐藏数据集进行测试时,它现在不那么好了。哪里出了问题?”这种情况几乎总是指向数据泄漏。当测试数据中的信息在数据准备步骤中潜入(或泄漏)到您的训练数据中时,就会发生数据泄漏。这通常发生在常规数据处理任务中,而您没有注意到。当发生这种情况时,模型会从它不应该看到的测试数据中学习,从而使测试结果具有误导性。让我们看看常见的预处理步骤,看看数据泄漏时究竟会发生什么——希望您可以在自己的项目中避免这些“管道问题”。所有视觉效果:作者使用 Canva
William Falcon, Founder and CEO of Lightning AI – Interview Series
Lightning AI 是 PyTorch Lightning 的创造者,PyTorch Lightning 是一个用于训练和微调 AI 模型的框架,也是 Lightning AI Studio 的创造者。PyTorch Lightning 最初由 William Falcon 于 2015 年在哥伦比亚大学就读时开发。后来,他在纽约大学和 Facebook AI Research 攻读博士学位期间于 2019 年开源,由 […]The post William Falcon, Founder and CEO of Lightning AI – Interview Series 首次出现在
How healthcare is tackling the problem of fairness in AI data
一位国际专家在阿德莱德举行的一次健康会议上概述了用于训练医疗保健领域人工智能 (AI) 的数据所涉及的风险和道德考虑。英国伯明翰大学监管科学与创新中心主任阿拉斯泰尔·丹尼斯顿教授表示,问题在于 […]
ВВС Боливии получили вертолет Robinson R44 Raven II
玻利维亚空军司令部接收了罗宾逊 R44 Raven II 直升机,该直升机成为第 22 空中训练大队的一部分。带 r.n. 的机器FAB-769将用于训练直升机飞行员。
Towards Data-Centric RLHF: Simple Metrics for Preference Dataset Comparison
将语言模型与人类偏好相一致的目标需要能够揭示这些偏好的数据。理想情况下,可以花费时间和金钱仔细收集和定制针对每个下游应用程序的定制偏好数据。然而,在实践中,少数几个公开可用的偏好数据集通常用于训练奖励模型,以从人类反馈 (RLHF) 进行强化学习。虽然新的偏好数据集正在以越来越高的频率被引入,但目前还没有对它们进行测量和比较的努力。在本文中,我们系统地研究了…
Arma Hobby Announce New Hayabusa II Kit in 1/72 Scale
Arma Hobby 宣布推出一款 1/72 比例的新型 Nakajima Ki-43-II Hayabusa “Oscar” 套件,预计将于 11 月上市。下面显示了两个预期的浇口框架。这表明包括朝外排气管和推力排气管。整流罩似乎是多部分的,尽管前轮辋和发动机部件并未显示出来。套件中包含的初始标记选项针对以下三个主题。1. 1943-44 年新几内亚 Hiko Dai 59 Sentai 第三中队的 Nakajima Ki-43-II Hayabusa。据推测由中队领导人 Kenjiro Kobayashi 上尉驾驶2。中岛 Ki-43-II 隼鸟,隶属于第 54 飞鹰队第 3 中雷,由中雷
How many drones does the Army need? A lot more.
两个旅的经验表明,实际购买的数量远远超过实际购买的数量——而且这还只是用于训练。
Contrastive Localized Language-Image Pre-Training
对比语言-图像预训练 (CLIP) 是一种广受赞誉的方法,用于训练视觉编码器生成图像/文本表示,以促进各种应用。最近,CLIP 已被广泛用作多模态大型语言模型 (MLLM) 的视觉主干,以连接图像输入以进行语言交互。CLIP 作为视觉语言基础模型的成功依赖于在图像级别对齐网络爬取的嘈杂文本注释。然而,这样的标准可能不足以满足需要细粒度视觉表示的下游任务,尤其是……
Fort Stewart hails several conservation milestones
斯图尔特堡拥有近 280,000 英亩的土地,主要用于训练第 3 步兵师、装甲部队的战斗准备……
Weekly Review 27 September 2024
我上周在推特上发布了一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):这是人工智能的真正危险,它可以用于增强监控,大型科技公司可以通过这样做赚很多钱:https://www.theregister.com/2024/09/16/oracle_ai_mass_surveillance_cloud/除了需要大量能源外,人工智能还需要大量水来冷却:https://www.techrepublic.com/article/generative-ai-data-center-water-use/使用人工智能消除招聘中的偏见。但人工智能会继