FastVLM: Efficient Vision encoding for Vision Language Models
缩放输入图像分辨率对于增强视觉语言模型(VLM)的性能至关重要,尤其是在文本丰富的图像理解任务中。但是,由于大量令牌和高度编码延迟,流行的视觉编码器(例如VIT)在高分辨率下效率低下。在不同的操作分辨率下,可以沿两个轴优化VLM的视觉编码器:减少编码延迟并最小化传递给LLM的视觉令牌的数量,从而降低整体延迟。基于对互动的综合效率分析…
Exploring the Architecture of Large Language Models
人工智能(AI)不再是遥远的概念;这是当前的变革力量。从Netflix帐户到语言的实时翻译,几乎所有内容都有AI的提示。这些智能系统的核心是一个强大的工具:...阅读更多»探索大语言模型架构的帖子首先出现在大数据分析新闻中。
Scaling Laws for Native Multimodal Models
建立可以通过多模式信号有效地感知世界的通用模型一直是一个长期目标。当前的方法涉及分别整合预训练的组件,例如将视觉编码器连接到LLMS和持续的多模式训练。尽管这种方法表现出显着的样本效率,但仍然是一个悬而未决的问题,这是否本质上是优越的。在这项工作中,我们重新审视了本地多模型(NMM)的建筑设计 - 从头开始训练的人 - 并进行广泛的……
在他们的工作中:在AAAI 2025年提出的对抗性攻击下,可证明是安全的机器学习模型认证,陈Feng,陈芬,Ziquan liu,Zhuo Zhi,Zhuo Zhi,iLija Bogunovic,Carsten Gerner-Beuerle和Miguel Rodrigues和Miguel Rodrigues开发了一种新的进攻方式,以确认型号的绩效模型 - 在机器学习中的新方法。在这里,陈[…]
Language Models Know More Than They Show: Exploring Hallucinations From the Model's Viewpoint
大型语言模型(LLM)通常会产生错误,包括事实上的不准确性,偏见和推理失败,共同称为“幻觉”。最近的研究表明,LLMS的内部状态编码有关其产出真实性的信息,并且可以利用此信息来检测错误。在这项工作中,我们表明LLMS的内部表示与以前所认识的更多有关真实性的信息要多。我们首先发现真实信息集中在特定的令牌上,并利用这一点……
Gartner: растет интерес к малым ИИ-моделям
K2 Cloud Expert-关于俄罗斯大数据技术市场,实施项目的特征,选择解决方案的标准以及云服务的可能性。
RelCon: Relative Contrastive Learning for a Motion Foundation Model for Wearable Data
我们提出了RERCON,这是一种新型的自我监督的相对对比学习方法,用于训练从可穿戴加速度计量学传感器的运动基础模型。首先,对可学习的距离度量进行了训练,以捕获主题相似性和特定于域的语义信息,例如旋转不变性。然后,学到的距离提供了一对加速度计时序列之间语义相似性的测量,我们用来训练我们的基础模型,以对跨时间和主体进行相对关系模型。基础模型接受了87,376的10亿个细分市场的培训…
Simple ReFlow: Improved Techniques for Fast Flow Models
扩散和流程匹配模型实现了显着的生成性能,但以许多抽样步骤的成本为代价,这会减慢推理并将适用性限制在关键任务中。回流过程可以通过拉直产生轨迹加速采样。但是,反流是一种迭代过程,通常需要对模拟数据进行培训,并导致样品质量降低。为了减轻样品恶化,我们检查了反流的设计空间,并在先前的启发式实践中突出了潜在的陷阱。然后,我们提出了七个训练动态的改进……
The Rise of Small Reasoning Models: Can Compact AI Match GPT-Level Reasoning?
近年来,大型语言模型(LLMS)的成功吸引了AI领域。这些模型最初是为自然语言处理而设计的,已演变为强大的推理工具,能够通过类似人类的逐步思考过程来解决复杂问题。但是,尽管LLM具有出色的推理能力,但具有很大的缺点,包括高计算[…]小推理模型的兴起:紧凑的AI可以匹配GPT级级别的推理吗?首先出现在unite.ai上。
Nissan приостановит заказы на мексиканские модели Infiniti из-за пошлин Трампа
日产汽车的日本制造商由于墨西哥在墨西哥的进口关税而暂时拒绝为美国市场订购两辆Infiniti SUV。这是路透社于4月4日报道的。
How Fast Can Helicopters Fly? (Comparison Of Top Models)
直升机多年来的技术越来越多 - 顶级型号的速度令人印象深刻,但是它们实际上可以飞得多快呢?
H&M planerar att använda AI-kloner av mänskliga modeller
瑞典时尚巨头H&M最近宣布,他们正在尝试使用人工智能(AI)创建人类模型的数字克隆。这些数字二氧化二二杆黑帮将用于营销和社交媒体,这引起了时尚和技术界的兴趣和争议。它的数字克隆始于H&M […] H&M计划使用人类模型的AI克隆首次出现在AI新闻中。
H&M:s planerar att använda AI-kloner av mänskliga modeller
瑞典时尚巨头H&M最近宣布,他们正在尝试使用人工智能(AI)创建人类模型的数字克隆。这些数字二氧化二二杆黑帮将用于营销和社交媒体,这引起了时尚和技术界的兴趣和争议。数字克隆始于H&M […] H&M使用人类模型的AI克隆的计划首先出现在AI新闻中。
VibE: A Visual Analytics Workflow for Semantic Error Analysis of CVML Models at Subgroup Level
有效的错误分析对于成功开发和部署CVML模型至关重要。理解模型错误的一种方法是总结误差样本的共同特征。在利用非结构化,复杂数据(例如图像)的任务中,这可能尤其具有挑战性,而模式并不总是显而易见的。另一种方法是分析跨预定义类别的错误分布,这要求分析师提前假设潜在的错误原因。形成此类假设,无需访问明确的标签或注释,因此很难……
Anthropic can now track the bizarre inner workings of a large language model
AI公司的人类拟人化已经开发了一种在大型语言模型中凝视的方法,并在响应中观察其所做的事情,从而揭示了有关该技术如何运作的关键新见解。要点:LLM甚至比我们想象的陌生。拟人团队对一些违反直觉感到惊讶……
Amazon SageMaker JumpStart adds fine-tuning support for models in a private model hub
今天,我们宣布了一项增强的私人枢纽功能,并具有几种新功能,可为组织提供更大的控制权。这些增强功能包括直接在私人枢纽内微调SageMaker JumpStart模型的能力,支持和管理定制训练的模型,为关联笔记本电脑的深层链接功能以及改进的模型版本管理。
Text-to-Speech Solutions with Contemporary Models
近年来,基于音频的模型已经迅速发展,企业越来越多地将现代的文本到语音功能纳入其运营中。