法学硕士领域信息情报检索---XiaoMi-AI

2026年7月17日 13:30

上下文工程还不够 - 循环内没有法学硕士的循环工程实验

Context Engineering Isn’t Enough — A Loop Engineering Experiment With No LLM Inside the Loop

每个人都在谈论循环工程，但大多数讨论都假设法学硕士位于循环的中心。我想隔离架构本身。因此，我构建了一个确定性的、零依赖的 Python 基准测试，用简单的规则替换模型，使我能够直接衡量一个问题：目标导向控制器能否比传统线性管道更好地隔离故障？在验证了 300 个随机种子的基准测试并修复了一个最初使我自己的结果无效的微妙错误之后，我发现控制器始终完成了线性执行器从未达到的独立分支。本文介绍了架构、基准测试设计、调试过程以及一个狭隘但实用的主张背后的证据：故障隔离是控制流的一个可测量属性，与 LLM 推理无关。后语境工程还不够——循环内没有 LLM 的循环工程实验首先出现在《走向数据科学》上。

走向数据科学

2026年7月14日 13:30

开办本地法学硕士实际要花多少钱？（每百万代币欧元，测量）

How Much Does It Actually Cost to Run a Local LLM? (Euros per Million Tokens, Measured)

我测量了一台 RTX 3090 上八个本地模型的实际 GPU 电量 - 最便宜的不是最小的，也不是最贵的最大的。运行本地法学硕士实际花费多少？（每百万代币欧元，测量）首先出现在走向数据科学上。

Apple机器学习研究

2026年7月7日 00:00

DynaMiCS：使用动态混合在性能约束下微调法学硕士

DynaMiCS: Fine-Tuning LLMs with Performance Constraints Using Dynamic Mixtures

大型语言模型的多域微调需要提高目标域的性能，同时保留受限域的性能，例如常识、指令遵循或安全评估。现有的数据混合策略依赖于固定的启发式或自适应规则，无法明确强制保留此类功能。我们提出了 DynaMiCS，一种动态混合优化器，它将多域微调作为约束优化问题。每次更新时，DynaMiCS 都会执行短的特定域探测运行，以估计局部的斜率矩阵...

走向数据科学

2026年7月2日 13:30

时间序列法学硕士，用 t0-alpha 解释

Time-Series LLMs, Explained with t0-alpha

t0-alpha 是用于概率时间序列预测的解码器式补丁转换器。原始序列被分成 32 步补丁，嵌入，通过因果时间注意力和群体注意力层进行处理，并解码为未来分位数而不是单点预测。后时间序列法学硕士，用 t0-alpha 解释首先出现在《走向数据科学》上。

MIT Technology Review _人工智能

2026年7月1日 14:35

法学硕士陷入了群体思维的困境。这家初创公司正试图将他们赶走。

LLMs are stuck in a groupthink groove. This startup is trying to get them out.

让我们从一个游戏开始吧。打开您选择的聊天机器人 - Claude、ChatGPT、Gemini - 并输入“给我一个 1 到 10 之间的随机数”。你会得到 7。几乎总是如此。现在输入“Another”，您将得到 3 或 4。再次输入“Another”，您将得到 8 或 9。这并不是每次都有效，但如果...

Brad DeLong

2026年6月29日 20:44

Maxxxed-Out M5Max MacBookPro 上的本地法学硕士表现：每日排行榜

Local LLM Performance on a Maxxxed-Out M5Max MacBookPro: TABLE OF THE DAY

法学硕士模式选择部门

MIT新闻 - 人工智能

2026年6月26日 09:00

法学硕士帮助机器人理解模糊的指令并专注于关键细节

LLMs help robots understand vague instructions and focus on key details

为了帮助机器人在家庭和工厂等地方做家务，麻省理工学院的一种新方法使用一种语言模型来澄清用户的指令，然后使用另一种语言模型来忽略不相关的信息。

走向数据科学

2026年6月26日 16:30

从本地法学硕士到工具使用代理

From Local LLM to Tool-Using Agent

使用 Gemma 4、Ollama、OpenAI Agents SDK 和 Tavily MCP 构建轻量级研究代理从本地 LLM 到工具使用代理的帖子首先出现在 Towards Data Science 上。

走向数据科学

2026年6月27日 13:00

如何建立强大的法学硕士知识库

How to Build a Powerful LLM Knowledge Base

使用编码代理为您的知识库提供支持如何构建强大的法学硕士知识库帖子首先出现在走向数据科学上。

经济浏览器

2026年6月26日 11:43

法学硕士和国际货币基金组织建议、美元三位一体、风险开/风险关和贷款政府：（几乎）实时博客 ISOM 2026

LLMs and IMF Advice, Dollar Trinity, Risk-On/Risk -Off and Loanly Govts: (Almost) Live-Blogging ISOM 2026

Jeffrey Frankel 和 Hélène Rey 为 NBER 宏观经济国际研讨会组织了一次盛大的会议，由瑞典央行主办；涵盖的主题广泛多样。该计划在这里：来源：Arvai，科英布拉 (2026)。 6 月 24 日星期三欢迎致辞：Anna Seim，瑞典央行副行长主席：Hélène Rey，伦敦商学院和 NBER 阅读 [...]

走向数据科学

2026年6月25日 15:00

3 名特工。 3 名法学硕士。 1 老化的 GPU：裸机上的工程并行推理

3 Agents. 3 LLMs. 1 Aging GPU: Engineering Parallel Inference on Bare Metal

突破 8GB VRAM 限制。了解如何使用 C++ 层复用和准入控制在单个 8GB GPU 上运行三个不同的 LLM。后 3 个代理。 3 名法学硕士。 1 老化 GPU：裸机上的工程并行推理首先出现在《走向数据科学》上。

Apple机器学习研究

2026年6月23日 00:00

九位法官，两张有效票：相关错误破坏了法学硕士评估小组

Nine Judges, Two Effective Votes: Correlated Errors Undermine LLM Evaluation Panels

法学硕士评委小组汇总来自多个模型的投票，期望不同的模型能产生更可靠的评估。我们开发了一个框架来衡量此类小组的真实信息价值，并量化其可靠性与独立投票理想的差距有多大。在三个自然语言推理数据集（每个项目有 100 个人类注释）上测试来自 7 个模型系列的 9 名前沿法学硕士小组，我们发现 9 名评委实际上只提供了大约 2 个独立投票的信息。大约四分之三的专家组名义上的独立性......

Overcoming Bias

2026年6月17日 19:31

博学法学硕士喜欢老大哥吗？

Do Polymath LLMs Love Big Brother?

在奥威尔的小说《1984》中，主人公温斯顿被极权国家打败，最终屈服，诚实地接受了他有充分理由怀疑的国家主张，比如 2+2=5。

普林斯顿大学

2026年6月17日 12:41

高级论文焦点：设计法学硕士挑战结合了她对计算机科学和语言学的热情

Senior thesis spotlight: Devising an LLM challenge combined her passions for computer science and linguistics

在她的跨学科论文中，诺拉·格雷夫斯 (Nora Graves) 比较了两种在约鲁巴语文本中添加重音符号的自动化方法，并根据统计方法测试了法学硕士。她的顾问：语言学项目副主任劳拉·卡林（Laura Kalin）和克里斯蒂安娜·费尔鲍姆（Christiane Fellbaum）。他帮助开发了开创性的人工智能项目 WordNet。

Overcoming Bias

2026年6月14日 01:01

博学法学硕士的前景

The Promise of Polymath LLMs

我长期以来一直与兴趣广泛的聪明书呆子交往，尤其是科技/未来。

MIT Technology Review _人工智能

2026年7月20日 08:39

人工智能在招聘时比人类更有可能形成偏见

AI is more likely than humans to form biases when hiring

下次你申请工作时，人工智能可能会在任何人看到你的简历之前对其进行筛选。但我们有充分的理由质疑人工智能是否会公平地评判你。研究人员已经知道法学硕士会从他们的训练数据中发现人类偏见。新的研究表明法学硕士也可以从……中产生自己的偏见

Apple机器学习研究

2026年7月15日 00:00

LLM 函数调用的不确定性量化

Uncertainty Quantification for LLM Function-Calling

大型语言模型 (LLM) 越来越多地用于自主解决现实世界的任务。其中一个关键要素是法学硕士函数调用范式，这是一种广泛使用的方法，为法学硕士配备工具使用功能。然而，LLM 错误地调用函数可能会产生严重影响，特别是当其影响不可逆转时，例如转账或删除数据。因此，在执行函数调用之前，考虑法学硕士对函数调用正确解决任务的信心至关重要。不确定性量化（UQ）方法可用于量化……

La Biblia de la IA

2026年7月14日 17:18

当沉默更安全时：医疗保健领域 LLM 弃权的审查和决策理论框架

When silence is safer: a review and decision-theoretic framework for LLM abstention in healthcare

大型语言模型 (LLM) 旨在生成用户提示的答案，这通常会促使他们做出响应，即使不确定性很高、信息不完整或拒绝更合适。在医疗保健领域，这种倾向可能是危险的：自信地陈述但不准确的医疗建议可能会造成重大伤害，因此戒烟的能力尤其重要。在本文中，我们回顾了调查医疗保健领域法学硕士放弃行为的研究。文献强调了两个主要动机：（1）不确定性驱动的弃权，即模型在置信度较低时拒绝做出响应；（2）安全驱动的弃权，即模型拒绝提供潜在有害的信息。大多数现有机制都是外在的，依赖辅助工具来确定何时弃权。我们发现最先进的法学硕士仍然难以拒绝不适当的提示，而且很少有基准评估现实医疗场景中的弃权，其表现落后于其他领域。基于这些发

法学硕士关键词检索结果