LLM关键词检索结果

如何基准LLMS - ARC AGI 3

How to Benchmark LLMs – ARC AGI 3

了解如何对LLM进行基准测试,然后尝试新发布的ARC AGI 3 THE THE THE POST如何基准LLMS - ARC AGI 3首先出现在数据科学方面。

LLM和心理健康

LLMs and Mental Health

LLM对我们的心理健康好还是坏?比这更复杂。LLM和心理健康首先出现在数据科学方面。

我什么时候需要使用LLM?

When Do I Need to Use an LLM?

本文旨在将有关LLM的对话带回地球,不仅探索LLM可以增加实际价值的广泛用例,而且还探讨了它们所面临的局限性。

优化企业AI助手:Crypto.com如何使用LLM推理和反馈来提高效率

Optimizing enterprise AI assistants: How Crypto.com uses LLM reasoning and feedback for enhanced efficiency

在这篇文章中,我们探讨了Crypto.com如何使用用户和系统反馈来不断改进和优化我们的说明提示。这种反馈驱动的方法使我们能够创建更有效的提示,以适应各种子系统,同时在不同用例中保持高性能。

Sapient Intelligence的新AI体系结构提供的推理速度比LLMS

Ny AI-arkitektur från Sapient Intelligence ger 100 gånger snabbare resonemang än LLM:er

智慧智能开发了一种新的AI体系结构,称为层次推理模型(HRM),其实现的推理比传统的大型语言模型(LLM)快100倍。人力资源管理(HRM)模仿了人脑的推理和计划方式,这意味着它在同一级别上的性能,有时比在复杂的推理任务上的语言模型更好,即使它[…] Sapient Intelligence的新帖子AI阶段的新AI架构提供了比LLM更快的100倍:您的首次出现在AI新闻中。

在AWS Trainium上使用VLLM提高冷启动建议

Boost cold-start recommendations with vLLM on AWS Trainium

在这篇文章中,我们演示了如何使用VLLM进行可扩展推理,并使用AWS深度学习容器(DLC)来简化模型包装和部署。我们将通过结构化的提示来产生兴趣扩展,将其编码为嵌入,用Faiss检索候选者,应用验证以保持结果的扎根,并以科学实验的形式构成寒冷的挑战 - 对LLM和编码器配对进行基础,并在建议级别上快速迭代,并显示出清晰的ROI

外部验证工具可以改善LLM-AS-A-Gudge的注释质量

Can External Validation Tools Can Improve Annotation Quality for LLM-as-a-Judge

对模型响应的成对偏好被广泛收集,以评估和提供大型语言模型(LLMS)的反馈。给定两个对同一输入的替代模型响应,人类或AI注释者选择``更好''响应。这样的数据可以在很难获得传统硬编码指标的域中提供反馈信号(例如,聊天互动的质量),从而帮助衡量模型进度或模型微调(例如,通过从人类反馈中的增强型RLHF学习,RLHF)。但是,对于某些域而言,在…

将LITELLM用于LLM应用的好处

Benefits of Using LiteLLM for Your LLM Apps

在本文中,我们将探讨为什么Litellm对构建LLM应用程序有益。

在LLM个性化的途中:学习记住用户对话

On the Way to LLM Personalization: Learning to Remember User Conversations

在大型语言模型记忆的研讨会上接受了本文(L2M2)2025.LARGE语言模型(LLMS)已迅速成为各种任务的宝贵助手。但是,它们的有效性受到他们通过个性化对人类偏好和行为量身定制反应的能力的限制。 LLM个性化的先前工作主要集中在样式转移或对用户的小概况融合,因为知识注入仍然是一个开放的挑战。在本文中,我们探索将先前对话的知识注入LLM,以使未来的工作……

如何通过利用上下文工程来显着增强LLM

How To Significantly Enhance LLMs by Leveraging Context Engineering

llms的上下文工程的好处和实践方面帖子如何通过利用上下文工程来显着增强LLM,首先出现在数据科学上。

使用LLMS的高级主题建模

Advanced Topic Modeling with LLMs

通过利用代表模型和使用LLMS的高级主题建模的代表模型和生成AI进行深入研究,首先是朝向数据科学的。

如何创建与人类标签保持一致的LLM法官

How to Create an LLM Judge That Aligns with Human Labels

动手构建和验证LLM评估人员的指南《如何创建与人类标签保持一致的LLM法官》首先出现在数据科学方面。

在Amazon Sagemaker上使用Amazon Nova LLM-AS-A-A-A-As-As-A-A-ai

Evaluating generative AI models with Amazon Nova LLM-as-a-Judge on Amazon SageMaker AI

评估大语言模型(LLM)的性能超出了统计指标,例如困惑或双语评估研究(BLEU)得分。对于大多数真实世界的生成AI方案,重要的是要了解模型是否比基线或更早的迭代产生更好的输出。这对于诸如摘要,内容生成,[…]

如何在笔记本电脑上运行LLM

How to run an LLM on your laptop

可能包含数百万张护照,信用卡,出生证明和包含个人身份信息的文件的图像。在DataComp Commonpool的一小部分中发现了数千个图像 - 包括可识别的面孔,这是一个主要的AI训练集,用于图像生成,从…麻省理工学院技术评论的系列方式可帮助您完成工作。西蒙·威利森(Simon Willison)有一个世界末日的计划。这是一个USB棍子,他在它上装了几个他最喜欢的开放式LLMS-由其创作者公开共享的模型,原则上可以下载和运行…

此“智能教练”可帮助LLM在文本和代码之间切换

This “smart coach” helps LLMs switch between text and code

在解决复杂问题时,CodeSteer系统可以提高大型语言模型的准确性,例如在供应链中安排货物。

探索提示学习:使用英语反馈来优化LLM Systems

Exploring Prompt Learning: Using English Feedback to Optimize LLM Systems

提示学习提出了一种令人信服的方法,用于持续改进AI应用程序,该帖子探索及时学习:使用英语反馈来优化LLM系统,首先出现在数据科学方面。

指标(和LLM)如何欺骗您:悖论的现场指南

How Metrics (and LLMs) Can Trick You: A Field Guide to Paradoxes

当数字撒谎时 - 您的指标误导您的帖子,指标(和LLM)如何欺骗您:悖论的现场指南首先出现在数据科学上。

掌握LLM:2024自学指南

Mastering LLMs: 2024 Self-Study Guide

为什么重要的是:掌握LLM:2024自学指南提供了一个完整的路线图,以从头开始学习大型语言模型。