lm领域信息情报检索---XiaoMi-AI

Science 2.0

2026年7月6日 22:01

HFO-1234yf 环境替代品被宣布为有毒化学品

HFO-1234yf Environmental Alternative Declared A Toxic Chemical

HFO-1234yf 环境替代品被宣布为有毒化学品HFO-1234yf 是环保人士吹捧的一种用于汽车空调系统的气候友好型替代制冷剂，但实际上可能比他们坚称造成污染的产品更严重。Hank CampbellMon，07/06/2026 - 18:01类别大气

EX-YU航空新闻

2026年7月6日 20:39

国航开始布加勒斯特-萨格勒布销售

Air China begins Bucharest - Zagreb sales

NEWS FLASHAir China, which last week commenced sales for its upcoming new Beijing - Bucharest - Zagreb service has now put ticket on sales for the short intra-European sector.该航空公司已从 9 月 4 日起获得往返这两个城市的第五航权。机票可通过 Trip.com 和 Expedia 等在线旅行社购买，目前单程经济舱票价为 228 欧元起。 Fifth freedom rights are those enabling

EX-YU航空新闻

2026年7月6日 21:00

随着第三架喷气式飞机谈判继续进行，威兹航空将图兹拉基地运力削减 22%

Wizz Air cuts Tuzla base capacity by 22% as third jet talks continue

Wizz Air 已将驻扎在图兹拉基地的 239 座空客 A321neo 飞机替换为 180 座空客 A320neo 飞机，与最初计划相比，运力减少了约 22%。这家低成本航空公司于去年 12 月以一架 A321neo 重新开放其图兹拉基地，并计划于 6 月部署第二架同类型飞机。然而，它选择了较小的 A320neo，并在 7 月初用较小的型号取代了原来的 A321neo。因此，该航空公司平均每次轮换提供的座位数将减少近 60 个。 In July alone, this equates to 11.024 fewer seats.The Minister of Trade, Tourism a

Apple机器学习研究

2026年7月7日 00:00

Weblica：可视化 Web 代理的可扩展且可重复的培训环境

Weblica: Scalable and Reproducible Training Environments for Visual Web Agents

网络复杂、开放且不断变化，这使得扩展可视网络代理的训练数据变得具有挑战性。现有的数据收集尝试仍然仅限于用于监督微调的离线轨迹或用于 RL 训练的少数模拟环境，因此无法捕获网络多样性。我们提出了Weblica（Web Replica），一个用于构建可复制和可扩展的Web环境的框架。我们的框架利用 1) HTTP 级缓存来捕获和重播稳定的视觉状态，同时保留交互行为，以及 2) 基于 LLM 的环境合成......

Apple机器学习研究

2026年7月7日 00:00

LensVLM：用于文本压缩视觉表示的选择性上下文扩展

LensVLM: Selective Context Expansion for Compressed Visual Representation of Text

视觉语言模型 (VLM) 提供了将文本处理为渲染图像的令人兴奋的可能性，无需将文本标记为长标记序列。由于 VLM 图像编码器将固定大小的图像映射到固定数量的视觉标记，因此不同的渲染分辨率提供了细粒度的压缩旋钮。然而，随着压缩率的增加，准确性会迅速下降：字符缩小到低于视觉编码器的有效分辨率，使它们难以区分。为了解决这个问题，我们提出了 LensVLM，这是一个推理框架和训练后配方，使 VLM 能够扫描……

Apple机器学习研究

2026年7月7日 00:00

FlowEval：生成的用户界面的基于参考的评估

FlowEval: Reference-Based Evaluation of Generated User Interfaces

虽然大型语言模型 (LLM) 和编码代理通常应用于用户界面 (UI) 开发，但开发人员发现很难可靠地评估他们在视觉和交互设计方面的熟练程度。现有的评估要么依靠人类专家，他们可以通过测试关键流程来准确评估可用性，但速度慢且成本高；要么依靠自动化法官，虽然可扩展，但准确性较差且不透明。我们提出了 FlowEval，一个基于参考的框架，通过比较真实网站的导航轨迹与轨迹来衡量生成的 UI 是否支持真实的交互流......

走向数据科学

2026年7月7日 15:00

代理指针 RAG：无需语义预编译的时间推理

Proxy-Pointer RAG: Temporal Reasoning Without Semantic Precompilation

Proxy-Pointer 和 LLM-Wiki 的技术比较后 Proxy-Pointer RAG：无需语义预编译的时间推理首先出现在 Towards Data Science 上。

Trending In Education

2026年7月7日 09:00

发自内心的领导 | D Ivan Young 博士谈自我同理心和领导力神经科学

Leading from the Heart | Dr. D Ivan Young on Self-Empathy and the Neuroscience of Leadership

主持人迈克·帕尔默 (Mike Palmer) 与行为神经科学专家兼执行教练 D. Ivan Young 博士讨论了他的书《Leading from the Heart》。他们分析了人工智能和人类情感之间的平衡，详细说明了自我同理心、同情心和心理安全感如何影响领导力。杨博士还分享了关于管理情绪信号、导航媒体驱动的多巴胺循环以及使用元认知重置消极思维模式的实用见解。关键讨论主题：自我同理心第一：如果领导者自己不首先拥有同理心或同情心，就无法有效地向他人提供同理心或同情心。恒温器与温度计：有效的领导者积极调节环境的能量和心理安全，而不仅仅是反映现有的温度。武器化的同理心：现代社交媒体算法和政治信息

eLearning Infographics

2026年7月8日 09:35

远程学习设计师工作空间：它是什么样子？

Remote Learning Designer Workspace: What Does It Look Like?

远程学习设计师工作空间：它是什么样子？—信息图表学习设计师工作中的远程工作机会已大大增加。组织越来越多地聘请可以在任何地方设计、开发和管理数字学习体验的专业人员。常见的远程职位包括：学习设计师电子学习设计师学习设计专家 LMS 设计师数字学习设计师数字学习经理学习内容 [...]帖子远程学习设计师工作空间：它是什么样子？首先出现在电子学习信息图表上。

Shake Up Learning博客

2026年7月7日 14:00

NotebookLM：您的新人工智能教学助手

NotebookLM: Your New AI Teaching Assistant

帖子 NotebookLM：您的新 AI 教学助理首先出现在 Shake Up Learning 上。如果您听说过 NotebookLM，但还没有真正坐下来弄清楚它的用途，那么这个会议值得观看。 Ashley Shanley 详细介绍了如何将其用作闭环人工智能研究和内容工具，该工具仅从您上传的文档中提取数据，这意味着没有幻觉，没有随机的互联网结果，继续阅读后 NotebookLM：您的新人工智能教学助理首先出现在 Shake Up Learning 上。

俄罗斯技术国有集团新闻频道

2026年7月3日 12:39

第一届全俄放射光子学会议在莫斯科举行

В Москве состоялась первая всероссийская конференция по радиофотонике

负责开发这一前景广阔的领域的基础组织是以其名字命名的 Polyus 研究所。 M. F. Stelmakha，Shvabe 控股公司的一部分

走向数据科学

2026年7月3日 13:30

LLM Wiki 过度设计 - 我用纯 Python 编译器替换了我的

LLM Wikis Are Over-Engineered — I Replaced Mine With a Pure Python Compiler

大多数“LLM wiki”使用代理、嵌入和重复模型调用来组织本地注释。我构建了一个确定性的替代方案：一个纯 Python 编译器，仅使用标准库将杂乱的 Markdown 转换为链接的、经过 linted 的 wiki。在此过程中，我修复了两个真正的错误，在两个操作系统上对管道进行了基准测试，并展示了为什么编译器通常比代理更适合机械文本组织。LLM 维基百科过度设计——我用纯 Python 编译器替换了我的编译器首先出现在《走向数据科学》上。

Apple机器学习研究

2026年7月2日 00:00

多代理团队阻碍专家

Multi-Agent Teams Hold Experts Back

多代理 LLM 系统越来越多地部署为自主协作者，其中代理可以自由交互，而不是执行固定的、预先指定的工作流程。在这种情况下，有效的协调无法提前完全设计，而必须通过互动来实现。然而，大多数先前的工作都是通过固定的角色、工作流程或聚合规则来强制协调，从而留下了一个问题：当协调不受限制时，自组织团队的表现如何。借鉴组织心理学，我们研究自组织法学硕士团队是否能实现强大的协同作用，其中......

Apple机器学习研究

2026年7月2日 00:00

残余上下文扩散语言模型

Residual Context Diffusion Language Models

扩散大型语言模型 (dLLM) 已成为纯自回归语言模型的有前途的替代方案，因为它们可以并行解码多个标记。然而，最先进的分块 dLLM 依赖于“重新屏蔽”机制，该机制仅解码最有信心的令牌并丢弃其余令牌，从而有效地浪费了计算。我们证明，从丢弃的令牌中回收计算是有益的，因为这些令牌保留了对后续解码迭代有用的上下文信息。有鉴于此，我们提出了残余上下文扩散（RCD），该模块......

Apple机器学习研究

2026年7月2日 00:00

学习扩散语言模型的揭露策略

Learning Unmasking Policies for Diffusion Language Models

扩散（大型）语言模型 (dLLM) 现在在许多任务上与自回归模型的下游性能相匹配，同时有望在推理过程中提高效率。 dLLM 的一个关键设计方面是采样程序，该程序选择在每个扩散步骤中揭开哪些标记。事实上，最近的工作发现，与随机揭露相比，置信度阈值等启发式策略可以提高样本质量和令牌吞吐量。然而，这种启发式方法也有缺点：它们需要手动调整，而且我们观察到它们的性能......

Apple机器学习研究

2026年7月2日 00:00

共形思维：计算预算推理的风险控制

Conformal Thinking: Risk Control for Reasoning on a Compute Budget

推理大型语言模型 (LLM) 可实现测试时间扩展，随着令牌预算的增加，数据集级别的准确性也会提高，从而激励自适应推理——在可靠性提高时使用令牌，并在额外计算不太可能有帮助时提前停止。然而，设置代币预算以及自适应推理的阈值是一项实际挑战，需要进行基本的风险与准确性权衡。我们将预算设置问题重新定义为风险控制，限制错误率，同时最大限度地减少计算量。我们的框架引入了一个上限，可以阻止......

Apple机器学习研究

2026年7月2日 00:00

MemoryLLM：用于 Transformer 的即插即用可解释前馈存储器

MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers

了解变压器组件在法学硕士中的工作原理非常重要，因为它是人工智能最新技术进步的核心。在这项工作中，我们重新审视了与前馈模块（FFN）的可解释性相关的挑战，并提出了 MemoryLLM，其旨在将 FFN 与自注意力解耦，并使我们能够将解耦的 FFN 作为上下文无关的 token-wise 神经检索记忆来研究。详细地，我们研究了输入标记如何访问 FFN 参数内的内存位置以及 FFN 内存在不同下游任务中的重要性。 MemoryLLM 实现...

Apple机器学习研究

2026年7月2日 00:00

关于 RL 微调 VLM 的鲁棒性和思想链一致性

On Robustness and Chain-of-Thought Consistency of RL-Finetuned VLMs

强化学习 (RL) 微调已成为增强推理密集型任务的大型语言模型 (LLM) 的关键技术，并推动其扩展到视觉语言模型 (VLM)。虽然经过 RL 调整的 VLM 改进了视觉推理基准，但它们仍然容易受到视觉基础薄弱、幻觉和过度依赖文本提示的影响。我们证明，简单的、受控的文本扰动——误导性的标题或不正确的思维链 (CoT) 痕迹——会导致鲁棒性和置信度大幅下降，并且当 CoT 一致性为……时，这些影响会更加明显。

lm关键词检索结果