LLMS关键词检索结果

防御结构化查询(Struq)和偏好优化(Secalign)

Defending against prompt injection with structured queries (StruQ) and preference optimization (SecAlign)

大型语言模型(LLMS)的最新进展实现了令人兴奋的LLM集成应用程序。但是,随着LLM的改善,对它们的攻击也是如此。提示注射攻击被OWASP列为对LLM集成的AP ...

研究表明,LLM愿意协助恶意“氛围编码”

Research Suggests LLMs Willing to Assist in Malicious ‘Vibe Coding’

在过去的几年中,大型语言模型(LLMS)在进攻性网络安全方面的潜在滥用进行了审查,尤其是在生成软件漏洞方面。最近的“ Vibe编码”(随意使用语言模型快速为用户开发代码的趋势,而不是明确地教用户使用代码)已经恢复了一个概念[…]邮政研究表明,LLMS愿意协助对恶意“ Vibe编码”的概念首先出现在Unite.ai上。

AI难以模仿历史语言

AI Struggles to Emulate Historical Language

A collaboration between researchers in the United States and Canada has found that large language models (LLMs) such as ChatGPT struggle to reproduce historical idioms without extensive pretraining – a costly and labor-intensive process that lies beyond the means of most academic or entertainment in

使用Amazon SageMaker大型推理容器V15

Supercharge your LLM performance with Amazon SageMaker Large Model Inference container v15

今天,我们很高兴地宣布,由VLLM 0.8.4驱动的Amazon Sagemaker大型推理(LMI)容器V15的推出,并支持VLLM V1发动机。该版本引入了显着的性能提高,扩展的模型兼容性与多模态(即能够理解和分析文本到文本,图像到文本和文本映射数据),并与VLLM提供内置的集成,以帮助您无人接缝和最高绩效的大型性能(LLMS)具有最高的性能。

亚马逊Q业务的准确评估框架 - 第2部分

Accuracy evaluation framework for Amazon Q Business – Part 2

在本系列的第一篇文章中,我们引入了Amazon Q Business的全面评估框架,Amazon Q Business是一个完全管理的检索增强发电(RAG)解决方案,该解决方案使用了您公司的专有数据,而没有管理大型语言模型(LLMS)的复杂性。第一篇文章着重于选择适当的用例,准备数据并实施指标[…​​]

Amazon Bedrock提示优化驱动LLM应用程序创新Yuewen Group

Amazon Bedrock Prompt Optimization Drives LLM Applications Innovation for Yuewen Group

今天,我们很高兴地宣布在亚马逊基岩上迅速优化。使用此功能,您现在可以使用单个API调用或单击Amazon Bedrock控制台上的按钮来优化几个用例的提示。在这篇博客文章中,我们讨论了如何提示优化改善Yuewen Group中智能文本处理任务的大语言模型(LLMS)的性能。

llms不是

LLMs Are Not

人们说的是

使用llmperf

Load-Testing LLMs Using LLMPerf

基准Claude 3十四行诗在亚马逊基岩上使用LLMPERF的LLMPERF邮政加载测试LLMS首先出现在数据科学上。

使用llmperf

Load-Testing LLMs Using LLMPerf

基准Claude 3十四行诗在亚马逊基岩上使用LLMPERF的LLMPERF邮政加载测试LLMS首先出现在数据科学上。

良好的真理

The Good-Enough Truth

撒谎,该死的谎言和llms the the the the the post the Good-Enody真相首先出现在数据科学方面。

主机并发llms lorax

Host concurrent LLMs with LoRAX

在这篇文章中,我们探讨了如何使用低排名适应性(LORA)有效地解决这些挑战。具体而言,我们讨论了使用Lora交换(Lorax)(Lorax)和Amazon Elastic Compute Cloud(Amazon EC2)GPU实例的讨论,允许组织有效地管理和服务不断增长的精细模型,优化成本,优化成本,并为客户提供无缝绩效。

适应AI的推理时代

Adapting for AI’s reasoning era

任何在大学中参加考试的人都知道,反流信息的令人印象深刻的能力并不是批判性思维的代名词。大型语言模型(LLMS)于2022年首次公开发行,但有限,但有限,就像有才华的学生一样,他们在多项选择考试中表现出色,但当被要求捍卫自己的逻辑时就会跌跌撞撞。今天的高级推理模型是…

GPU托管,LLM和看不见的后门

GPU Hosting, LLMs, and the Unseen Backdoor

Big AI在大型硬件上运行。目前,该硬件是GPU,否认,堆叠和旋转云基础架构24/7,直到某件事破裂之前,没有人双重检查。每个人都专注于LLMS所说和做的事情 - 但不是他们的住所或训练方式。那个后端?这是一团糟。而且它很开。

天然多模型模型的缩放定律

Scaling Laws for Native Multimodal Models

建立可以通过多模式信号有效地感知世界的通用模型一直是一个长期目标。当前的方法涉及分别整合预训练的组件,例如将视觉编码器连接到LLMS和持续的多模式训练。尽管这种方法表现出显着的样本效率,但仍然是一个悬而未决的问题,这是否本质上是优越的。在这项工作中,我们重新审视了本地多模型(NMM)的建筑设计 - 从头开始​​训练的人 - 并进行广泛的……

与AWS推理的Amazon Sagemaker上优化混合8x7b

Optimizing Mixtral 8x7B on Amazon SageMaker with AWS Inferentia2

这篇文章演示了如何在AWS推理的实例上部署和服务Mixtral 8x7b语言模型,以进行具有成本效益,高性能推断。我们将使用拥抱面孔的最佳神经元进行模型汇编,该神经元提供了一组工具,可直接加载,训练和推理以及文本生成推理(TGI)容器,该容器具有用于部署和服务LLMS与HOUGGingFace的工具套件。

tis-dpo:直接偏好优化的令牌级别的重要性采样

TIS-DPO: Token-level Importance Sampling for Direct Preference Optimization

直接偏好优化(DPO)由于其简单性和有效性而被广泛采用大型语言模型(LLMS)的偏好对齐。但是,DPO被推导为匪徒问题,其中整个响应被视为单臂,忽略了令牌之间的重要性差异,这可能会影响优化效率,并且使得难以实现最佳结果。在这项工作中,我们建议DPO的最佳数据在获胜和失去响应方面的每个代币都具有相同的预期奖励,因为令牌重要性没有差异。但是,由于…

培训llms以自我氧化语言

Training LLMs to self-detoxify their language

MIT-IBM WATSON AI实验室的一种新方法可帮助大型语言模型转向他们对更安全,更符合价值的输出的反应。

赛车超越深度:AWS LLM League的首次亮相

Racing beyond DeepRacer: Debut of the AWS LLM League

AWS LLM LOAGEWAS旨在通过提供一种体验来降低生成AI模型定制的进入障碍,而参与者无论其先前的数据科学经验如何,都可以从事微调LLMS。使用Amazon Sagemaker Jumpstart,引导与会者通过自定义LLMS来解决适应其领域的实际业务挑战的过程。