AAA General Contractors, LLC--Reconsideration
AAA General Contractors, LLC 是一家位于德克萨斯州埃尔帕索的伤残退伍军人拥有的小企业,要求我们重新考虑我们在 AAA 中的决定...
vLLM vs Triton vs TGI: Choosing the Right LLM Serving Framework
将公共 MCP 服务器部署为 API 端点,并使用函数调用将其工具集成到 LLM 工作流程中。
The malleable mind: context accumulation drives LLM’s belief drift
在接受了包含 80,000 个保守政治哲学单词的数据集的训练后,Grok-4 在超过四分之一的时间里改变了其输出对政治问题的立场。这没有任何对抗性提示——训练数据的变化就足够了。由于记忆机制和研究代理 [1, 2] 使法学硕士能够积累 [...]
Hey ChatGPT, write me a fictional paper: these LLMs are willing to commit academic fraud
研究发现,主流聊天机器人对故意制造请求表现出不同程度的抵制
The Top 10 LLM Evaluation Tools
LLM 评估工具可帮助团队衡量模型在各种任务中的执行情况,包括推理、总结、检索、编码和指令遵循。他们分析性能趋势,检测幻觉,根据实际情况验证输出,并在微调或即时工程期间对改进进行基准测试。如果没有强大的评估框架,组织就会面临部署不可预测或有害人工智能的风险……阅读更多»“十大法学硕士评估工具”一文首先出现在《大数据分析新闻》上。
Zero-Waste Agentic RAG: Designing Caching Architectures to Minimize Latency and LLM Costs at Scale
通过验证感知的多层缓存将 LLM 成本降低 30% 后零浪费代理 RAG:设计缓存架构以最大限度地减少延迟和大规模 LLM 成本首先出现在《走向数据科学》上。
Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments
大型商业搜索系统优化相关性以推动成功的会话,帮助用户找到他们正在寻找的内容。为了最大化相关性,我们利用两个互补的目标:行为相关性(用户倾向于点击或下载的结果)和文本相关性(结果的语义适合查询)。一个持续存在的挑战是相对于丰富的行为相关性标签而言,专家提供的文本相关性标签的稀缺。我们首先通过系统地评估 LLM 配置来解决这个问题,发现一个专门的、经过微调的模型显着......
Cracking the cellular code with APOLLO
APOLLO 是一种新的人工智能框架,它将跨测量类型的共享生物信号与每种技术特有的信号分开。这可以让我们更清晰地了解细胞状态,预测未测量的特征,更准确地发现疾病生物标志物,并可以加快癌症、阿尔茨海默病等领域的发现。
AtechGov, LLC (Atech) 是马里兰州贝塞斯达的一家小型企业,对授予 Blackwatch International Corporation 的合同提出质疑,Blackwatch International Corporation 是一家小型…
Solutions71, LLC--Reconsideration
Solutions71, LLC 是弗吉尼亚州利斯堡的一家小型企业,要求重新考虑我们于 2025 年 12 月 30 日在 Solutions71, LLC, B-423671.2 中做出的决定。
New method could increase LLM training efficiency
通过利用空闲计算时间,研究人员可以在保持准确性的同时将模型训练速度提高一倍。
Efficiently serve dozens of fine-tuned models with vLLM on Amazon SageMaker AI and Amazon Bedrock
在这篇文章中,我们将解释如何在 vLLM 中为专家混合 (MoE) 模型实现多 LoRA 推理,描述我们执行的内核级优化,并向您展示如何从这项工作中受益。我们在这篇文章中使用 GPT-OSS 20B 作为我们的主要示例。
Google Just Created A New AI Tool That Is Perfect For Teachers Of ELL Newcomers
谷歌一直在设置某种方式来创建最大数量的绝对无用的人工智能工具,我在博客中介绍了他们的许多失败中的一些。公平地说,他们还开发了两个非常有用的——NotebookLM 和 Google Storybook。 (也许谷歌的新“学习你的方式”可能非常有用[...]
八年前,我开始做这个定期专题,分享一些来自网络的与 ESL/EFL 或引起我注意的一般语言相关的帖子和资源。您可能还对我所有关于 ELL 教学的最佳列表感兴趣。另外,请查看我最好的资源集合 [...]
COLLEGE 102 and algorithmic justice in ‘Mercy,’ starring Chris Pratt
在《COLLEGE 102》和 2026 年的电影《Mercy》中,算法承诺公平,但取决于一个决定:在哪里划定界限。无论系统多么先进,总有人会选择这条线。 克里斯·普拉特主演的《天使》中的后《COLLEGE 102》和算法正义首先出现在《斯坦福日报》上。
Beyond a Single Extractor: Re-thinking HTML-to-Text Extraction for LLM Pretraining
构建网络规模的 LLM 预训练数据集的首要预处理步骤之一涉及从 HTML 中提取文本。尽管网络内容多种多样,但现有的开源数据集主要对所有网页应用单个固定提取器。在这项工作中,我们调查这种做法是否会导致互联网数据的覆盖和利用不理想。我们首先表明,虽然不同的提取器可能会在标准语言理解任务上产生相似的模型性能,但在固定过滤管道中幸存的页面可能会有很大差异。这表明一个简单的...