llama关键词检索结果

本周免费且实用的课堂人工智能工具

This Week’s Free & Useful Artificial Intelligence Tools For The Classroom

至少,现在,我将每周发布一次这个专题,重点介绍课堂上可以使用的最佳全新且免费的人工智能工具的新增内容。以下是最新消息:Llama Tutor 很有趣——它是一个 AI 聊天机器人,但专门用于教学。[…]

中国DeepSeek-V3最佳开放AI模型

Kinesiska DeepSeek-V3 bästa öppna AI-modellen

DeepSeek是一家中国人工智能公司,推出了DeepSeek V3,这是一个开源人工智能模型,包含6710亿个参数,并在NVIDIA H800 GPU上训练了超过278.8万小时。该模型在各种对比测试中均优于 Meta 的 Llama 3.1 和 OpenAI 的 GPT-4 等竞争对手。中国人工智能公司DeepSeek发布了新的语言模型DeepSeek V3,它超越了开放[…]中国DeepSeek-V3最佳开放人工智能模型首次出现在人工智能新闻上。

RadiologyLlama-70B:放射学报告的新语言模型

RadiologyLlama-70B: A new language model for radiology reports

RadiologyLlama-70B 是一种先进的 AI 模型,经过超过 650 万份医疗报告的训练,可增强对放射学发现的分析。该模型可以显著改善放射科医生的工作流程,在降低计算成本的同时提供卓越的准确性。

使用 AWS Trainium 在 SageMaker HyperPod 上对 Llama 3 进行 PEFT 微调 ​​

PEFT fine tuning of Llama 3 on SageMaker HyperPod with AWS Trainium

在这篇博文中,我们展示了如何使用 AWS Trainium 上的 PEFT 和 SageMaker HyperPod 对 Meta Llama 3 模型进行高效的监督微调。我们使用 HuggingFace 的 Optimum-Neuron 软件开发工具包 (SDK) 将 LoRA 应用于微调作业,并使用 SageMaker HyperPod 作为主要计算集群在 Trainium 上执行分布式训练。使用 LoRA 监督微调 Meta Llama 3 模型,您可以进一步将微调模型的成本降低高达 50%,并将训练时间缩短 70%。

Llama 3.3 70B 现已在 Amazon SageMaker JumpStart 中提供

Llama 3.3 70B now available in Amazon SageMaker JumpStart

今天,我们很高兴地宣布 Meta 的 Llama 3.3 70B 已在 Amazon SageMaker JumpStart 中推出。 Llama 3.3 70B 标志着大型语言模型 (LLM) 开发方面取得了令人兴奋的进步,它以更少的计算资源提供了与大型 Llama 版本相当的性能。在本文中,我们将探讨如何在 Amazon SageMaker AI 上高效部署此模型,并使用高级 SageMaker AI 功能实现最佳性能和成本管理。

合作伙伴聚焦:Cerebras 如何加速 AI 应用开发

Partner spotlight: How Cerebras accelerates AI app development

了解如何使用 Cerebras 和 DataRobot 通过 Llama 3.1-70B 开发 AI 应用程序。以更快的推理速度构建、自定义和测试 LLM。文章“合作伙伴聚焦:Cerebras 如何加速 AI 应用程序开发”首先出现在 DataRobot 上。

AI 中的代理内存:持久内存如何重新定义 LLM 应用程序

Agent Memory in AI: How Persistent Memory Could Redefine LLM Applications

人工智能 (AI) 从根本上改变了我们的生活、工作和交流方式。大型语言模型 (LLM),例如 GPT-4、BERT、Llama 等,在对话式人工智能方面取得了显着进步,提供了快速且类似人类的响应。然而,这些系统受到一个关键缺点的限制,无法在单个会话之外保留上下文。一旦交互 […]The post Agent Memory in AI: How Persistent Memory Could Redefine LLM Applications appeared first on Unite.AI.

使用全新改进的 Amazon SageMaker Python SDK 加速您的 ML 生命周期 - 第 2 部分:ModelBuilder

Accelerate your ML lifecycle using the new and improved Amazon SageMaker Python SDK – Part 2: ModelBuilder

在本系列的第 1 部分中,我们介绍了 Amazon SageMaker Python SDK 上新推出的 ModelTrainer 类及其优势,并向您展示了如何在自定义数据集上微调 Meta Llama 3.1 8B 模型。在这篇文章中,我们将介绍 ModelBuilder 类的增强功能,它允许您将模型从 ModelTrainer 无缝部署到 SageMaker 终端节点,并为多种部署配置提供单一界面。

[AI Show 第 126 集]:OpenAI 12 天:o1、ChatGPT Pro、Sora、对 Altman、Pichai 和 Bezos 的新采访、Amazon Nova 和 David Sacks 是美国“AI 沙皇”

[The AI Show Episode 126]: 12 Days of OpenAI: o1, ChatGPT Pro, Sora, New Interviews with Altman, Pichai, and Bezos, Amazon Nova & David Sacks Is US “AI Czar”

12 月即将成为激动人心的新品发布季 — 这份礼物会源源不断地送出!从 OpenAI 的 12 天“Shipmas”到亚马逊的最新车型系列 Llama 3.3,再到 Hume AI 的创新语音控制,发布会的脚步丝毫没有放缓的迹象。欢迎与主持人 Paul Roetzer 和 Mike Kaput 一起探索这些塑造行业未来的最新发展。此外,您还可以从 DealBook 峰会上对主要 AI 领导者的采访中获得关键见解,了解 OpenAI-Microsoft 合作伙伴关系不断发展的动态,以及 David Sacks 作为特朗普政府 AI 和加密顾问的有趣角色 — 等等。

生成逻辑

Generative Logic

阿里巴巴的最新模型 QwQ-32B-Preview 因其推理能力而获得了一些令人印象深刻的评价。与 OpenAI 的 GPT-4 o1,1 一样,它的训练强调推理,而不仅仅是再现语言。这似乎是一件值得尝试的事情——或者至少值得尝试一下——所以当我听说它很快就在 Ollama 上可用,而且规模不大时 […]

联想和摩托罗拉在 Tech World 2024 上推出超个性化 AI 助手:个性化 AI 的未来还是侵犯隐私?

Lenovo and Motorola Unveil Hyper-Personalized AI Assistants at Tech World 2024: The Future of Personalized AI or Privacy Infringers?

在联想的 Tech World 2024 上,联想和摩托罗拉都展示了突破性的人工智能 (AI) 创新,旨在突破消费技术超个性化的界限。联想推出了“AI Now”,这是一款基于 Meta 的 Llama 3.1 AI 模型构建的生成人工智能 (genAI) 系统,它有望通过将 PC 变成个性化数字助理来使其变得更智能。 […] 帖子联想和摩托罗拉在 Tech World 2024 上推出超个性化 AI 助理:个性化 AI 的未来还是侵犯隐私?首次出现在 Unite.AI 上。

使用 Amazon EKS 和 vLLM 在 AWS Inferentia 上部署 Meta Llama 3.1-8B

Deploy Meta Llama 3.1-8B on AWS Inferentia using Amazon EKS and vLLM

在本文中,我们将介绍使用 Amazon EKS 在 Inferentia 2 实例上部署 Meta Llama 3.1-8B 模型的步骤。此解决方案将 Inferentia 2 芯片的卓越性能和成本效益与 Amazon EKS 的强大和灵活的环境相结合。Inferentia 2 芯片提供高吞吐量和低延迟推理,非常适合 LLM。

使用 AWS Inferentia 和 AWS Trainium 在 Amazon SageMaker JumpStart 中经济高效地部署 Meta Llama 3.1 模型

Deploy Meta Llama 3.1 models cost-effectively in Amazon SageMaker JumpStart with AWS Inferentia and AWS Trainium

我们很高兴地宣布,Meta Llama 3.1 8B 和 70B 推理支持已在 Amazon SageMaker JumpStart 中的 AWS Trainium 和 AWS Inferentia 实例上推出。 Trainium 和 Inferentia 由 AWS Neuron 软件开发工具包 (SDK) 提供支持,可提供高性能并将 Meta Llama 3.1 的部署成本降低高达 50%。在这篇文章中,我们演示了如何在 SageMaker JumpStart 中的 Trainium 和 Inferentia 实例上部署 Meta Llama 3.1。

Meta 现在允许军事机构访问其人工智能软件。它给使用它的每个人带来了道德困境

Meta now allows military agencies to access its AI software. It poses a moral dilemma for everybody who uses it

作者:Zena Assaad,澳大利亚国立大学 Meta 将向美国政府提供其生成人工智能 (AI) 模型,这家科技巨头宣布,这一有争议的举动给使用该软件的每个人带来了道德困境。Me​​ta 上周透露,它将向美国政府提供这些名为 Llama 的模型 […]

LangChain 与 LlamaIndex:为您的 LLM 应用程序选择正确的框架

LangChain vs LlamaIndex: Choosing the Right Framework for Your LLM Application

简介:大型语言模型 (LLM) 现在已广泛用于基于聊天机器人的基本用途,但将它们集成到更复杂的应用程序中可能很困难。幸运的是,对于开发人员来说,有一些工具可以简化 LLM 与应用程序的集成,其中最突出的两个是 LangChain 和 LlamaIndex。这两个

使用 Cortex 运行本地 LLM

Run Local LLMs with Cortex

查看这个类似于 Ollama 但更好的本地 AI 模型管理器。

Meta 和其他公司现在允许军事机构访问他们的 AI 软件

Meta and others now allow military agencies to access their AI software

科技巨头 Meta 宣布,将向美国政府提供其生成式人工智能 (AI) 模型,这一有争议的举动给使用该软件的每个人都带来了道德困境。Me​​ta 上周透露,它将向政府机构提供这些名为 Llama 的模型,“包括那些 […]

在 Amazon SageMaker JumpStart 上微调用于视觉和文本用例的多模态模型

Fine-tune multimodal models for vision and text use cases on Amazon SageMaker JumpStart

在本文中,我们将展示如何微调文本和视觉模型(例如 Meta Llama 3.2),以便在视觉问答任务中表现更好。Meta Llama 3.2 Vision Instruct 模型在具有挑战性的 DocVQA 视觉问答基准上表现出色。通过利用 Amazon SageMaker JumpStart 的强大功能,我们展示了调整这些生成式 AI 模型以更好地理解和回答有关图像的自然语言问题的过程。