LLM领域信息情报检索---XiaoMi-AI

走向数据科学

2025年11月9日 16:00

LLM 支持的时间序列分析

LLM-Powered Time-Series Analysis

第 2 部分：高级模型开发提示由法学硕士支持的时间序列分析首先出现在《走向数据科学》上。

KDnuggets

2025年11月4日 17:11

使用 LangExtract 和 LLM 进行数据提取的初学者指南

Beginner’s Guide to Data Extraction with LangExtract and LLMs

如果您需要从文本中提取特定数据，LangExtract 提供了一种快速、灵活且适合初学者的方法。

Apple机器学习研究

2025年11月3日 00:00

政策地图：指导 LLM 行为无限空间的工具

Policy Maps: Tools for Guiding the Unbounded Space of LLM Behaviors

人工智能政策为人工智能模型的可接受行为设定了界限，但这在大型语言模型 (LLM) 的背景下具有挑战性：如何确保覆盖广阔的行为空间？我们引入了政策地图，这是一种受物理地图制作实践启发的人工智能政策设计方法。政策地图不是以全面覆盖为目标，而是通过有意识的设计选择来帮助有效导航，了解哪些方面要捕获，哪些方面要抽象。借助政策投影仪（一种用于设计法学硕士政策地图的交互式工具），人工智能从业者可以调查模型的情况……

走向数据科学

2025年10月30日 17:23

使用 Datapizza AI 更快地构建 LLM 代理

Build LLM Agents Faster with Datapizza AI

新的 GenAI 框架“意大利制造”使用 Datapizza AI 更快地构建 LLM 代理一文首先出现在 Towards Data Science 上。

走向数据科学

2025年10月29日 19:56

优化 LLM 成本、延迟和性能提示的 4 种技巧

4 Techniques to Optimize Your LLM Prompts for Cost, Latency and Performance

了解如何大幅提高 LLM 申请的性能帖子 4 条优化 LLM 提示成本、延迟和性能的技术首先出现在《走向数据科学》上。

Apple机器学习研究

2025年10月27日 00:00

用于在资源受限的移动设备上微调 LLM 的内存高效反向传播

Memory-Efficient Backpropagation for Fine-Tuning LLMs on Resource-Constrained Mobile Devices

使用反向传播对大型语言模型 (LLM) 进行微调（即使对于 LoRA 等参数子集）可能比推理更消耗内存，并且对于资源受限的移动设备来说通常被认为是不切实际的。零阶优化 (ZO) 等替代方法可以大大减少内存占用，但代价是模型收敛速度显着减慢（比反向传播多 10 倍到 100 倍的步骤）。我们提出了一种在移动设备上实现反向传播 (MeBP) 的内存高效实现，它可以在内存使用和计算之间提供更好的权衡……

Clarifai博客 | 实际应用中的人工智能

2025年10月24日 17:47

使用安全的公共 API 在本地运行 vLLM 模型

Run vLLM Models Locally with a Secure Public API

使用 vLLM 在本地运行 LLM，并使用 Clarifai Local Runners 通过安全的公共 API 公开它们。

AI新闻

2025年10月23日 04:30

一个新的超级提示可能会增加 LLM 的创造力

En ny super prompt kan potentiellt öka kreativiteten i LLM

无聊的人工智能答案问题一项新的研究技术可以使像 ChatGPT 这样的语言模型显着更具创造性，而您所需要的只是一个智能提示。当您向 ChatGPT 询问问题时，您通常会得到一个“典型”答案。这是由于研究人员所谓的“模式崩溃”，语言模型陷入了安全且可预测的答案中，而不是[…]这篇文章《一种新的超级提示可能会增加法学硕士的创造力》首先出现在人工智能新闻上。

OSP网站大数据新闻

2025年10月14日 12:53

中国开源LLM挑战市场领导者

Китайская LLM с открытым кодом бросает вызов лидерам рынка

阿里巴巴声称其 Qwen3-Omni 在一系列标准测试中均表现出色。

亚马逊云科技 _机器学习

2025年10月14日 16:33

Amazon Bedrock 自定义模型导入如何简化 Salesforce 的 LLM 部署

How Amazon Bedrock Custom Model Import streamlined LLM deployment for Salesforce

本文展示了 Salesforce 如何将 Amazon Bedrock 自定义模型导入集成到其机器学习操作 (MLOps) 工作流程中，在不更改应用程序的情况下重用现有终端节点，以及如何对可扩展性进行基准测试。我们分享有关运营效率和成本优化收益的关键指标，并提供简化部署策略的实用见解。

KDnuggets

2025年10月14日 14:00

LLM 应用程序中跟踪令牌使用情况的初学者指南

The Beginner’s Guide to Tracking Token Usage in LLM Apps

如果你不跟踪代币，那么每次你的应用程序与法学硕士对话时，你基本上都是在烧钱。

Clarifai博客 | 实际应用中的人工智能

2025年10月10日 06:38

顶级 LLM 推理提供商比较 - GPT-OSS-120B

Top LLM Inference Providers Compared - GPT-OSS-120B

比较顶级 GPT‑OSS‑120B 推理提供商的吞吐量、延迟和成本。了解 Clarifai、Vertex AI、Azure、AWS 等如何处理推理繁重的工作负载和实际应用程序。

Spritle 博客

2025年10月9日 12:38

如何根据实际用例微调 LLM 模型

What It Really Takes to Fine-Tune a LLM Model for a Real-World Use Case

了解如何为现实世界的应用程序安全地微调 LLM 帖子“为真实世界用例微调 LLM 模型真正需要什么”一文首先出现在 Spritle 软件上。

Apple机器学习研究

2025年11月7日 00:00

ExpertLens：激活控制功能具有高度可解释性

ExpertLens: Activation Steering Features Are Highly Interpretable

本文在 NeurIPS 2025 的统一神经模型表示研讨会 (UniReps) 上被接受。大语言模型 (LLM) 中的激活引导方法已成为执行有针对性的更新以增强生成语言的有效方法，而无需大量适应数据。我们询问激活引导方法发现的特征是否可以解释。我们使用激活控制研究中的“寻找专家”方法来识别负责特定概念（例如“猫”）的神经元，并表明 ExpertLens，即检查这些......

KDnuggets

2025年11月7日 18:00