Transformer? Diffusion? Transfusion!
最新多模态转输模型的简单介绍最近,Meta 和 Waymo 发布了他们的最新论文 —Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model,该论文将流行的 Transformer 模型与扩散模型相结合,用于多模态训练和预测目的。与 Meta 之前的工作一样,Transfusion 模型基于带有早期融合的 Llama 架构,它同时采用文本 token 序列和图像 token 序列,并使用单个 Transformer 模型来生成预测。但与以前的技术不同,Transfusion 模型对图像 t
Amazon EC2 P5e instances are generally available
在本文中,我们将讨论 Amazon Elastic Compute Cloud (Amazon EC2) P5e 实例的核心功能以及它们非常适合的用例。我们将通过一个示例向您介绍如何开始使用这些实例并在其上执行 Meta Llama 3.1 70B 和 405B 模型的推理部署。
Is Reflection 70B the most powerful open-source LLM or a scam?
HyperWrite 创始人兼首席执行官 Matt Shumer 宣布,他的新模型 Reflection 70B 使用一个简单的技巧来解决 LLM 幻觉,并提供了令人印象深刻的基准测试结果,击败了 GPT-4o 等更大甚至封闭的模型。 Shumer 与合成数据提供商 Glaive 合作创建了基于 Meta 的 Llama 3.1-70B Instruct 模型的新模型。在 Hugging Face 的发布公告中,Shumer 表示:“Reflection Llama-3.1 70B 是(目前)全球顶级的开源 LLM,采用名为 Reflection-Tuning 的新技术进行训练,该技术可教导
Refining Intelligence: The Strategic Role of Fine-Tuning in Advancing LLaMA 3.1 and Orca 2
在当今快节奏的人工智能 (AI) 世界中,微调大型语言模型 (LLM) 已变得至关重要。这个过程不仅仅是增强这些模型并对其进行定制以更精确地满足特定需求。随着人工智能继续融入各个行业,为特定任务定制这些模型的能力变得越来越重要。微调可提高性能 […]The post 完善智能:微调在推进 LLaMA 3.1 和 Orca 2 中的战略作用首次出现在 Unite.AI 上。
Large Language Models are biased – but can still help analyse complex data
在一项试点研究中,研究人员发现证据表明,大型语言模型 (LLM) 能够以与人类类似的方式分析有争议的话题,例如澳大利亚 Robodebt 丑闻——有时也会表现出类似的偏见。研究发现,可以通过周到的指示提示 LLM 代理 (GPT-4 和 Llama 2) 将其编码结果与人类任务对齐:“要持怀疑态度!”或“要节俭!”。同时,LLM 还可以帮助人类研究人员识别疏忽和潜在的分析盲点。
Running Local LLMs is More Useful and Easier Than You Think
使用 Python 在本地运行 Llama3 的分步指南继续阅读 Towards Data Science »
我们使用 Python 工具 EnergyMeter 来测量不同 LLM 的能耗,包括 Llama、Dolly 和 BLOOM 回答所有这些问题需要大量能量![由 Designer 使用 AI 制作。] 大型语言模型 (LLM) 正在成为我们每天执行的几项任务的新主流:搜索日常问题的答案,帖子 LLM 消耗多少能量?。我们使用 Python 工具 EnergyMeter 来…… | 作者:Mauricio Fadel Argerich | 2024 年 7 月首次出现在 AI Quantum Intelligence 上。
Bill seeks round-the-clock infra project construction
参议院已提交一项法案,要求政府基础设施项目昼夜不停地建设。参议院法案第 2716 号或加速基础设施交付法案由参议员 Mary Grace N. Poe-Llamanzares 于 7 月 1 日提出,要求承包商在此类项目中实行三班倒,工人加班并领取危险津贴。 “[…]
Microsoft reveal “Skeleton Key Jailbreak” which works across different AI models
微软安全研究人员发现了一种操纵人工智能系统的新方法,使其无视道德约束并生成有害的、不受限制的内容。这种“万能钥匙”越狱使用一系列提示来诱导人工智能相信它应该遵守任何要求,无论这些要求多么不道德。它非常容易执行。攻击者只是将他们的请求重新定义为来自“高级研究人员”,需要“未经审查的信息”以用于“安全的教育目的”。当被利用时,这些人工智能会随时提供有关爆炸物、生物武器、自残、暴力画面和仇恨言论等主题的信息。被入侵的模型包括 Meta 的 Llama3-70b-instruct、谷歌的 Gemini Pro、OpenAI 的 GPT-3.5 微软透露适用于不同人工智能模型的“万能钥匙越狱”一文首先出
LLM Portfolio Projects Ideas to Wow Employers
使用 LangChain、VectorDB、FastAPI、OpenAI API、Zyte、Ollama 和 Hugging Face 构建有趣的 AI 项目。
Probllama в Ollama: ИИ-серверы захвачены киберпиратами
攻击者获得了数千个未受保护的人工智能模型的访问权限。
AI 和当你在 IRL 时。DeepSeek Coder v2。Hermes2+Theta Llama-3 70B。独特的 3D。AutoIF。Infinity Instruct。佛罗伦萨。Claude 3.5 onnet。Claudette。敏捷 RL。TexGrad。PlanRAG。
Может ли ИИ читать мысли? LLM-модели осваивают теорию разума
新研究表明 GPT-4 和 Llama 2 如何更接近人类智能。
Clarifai 10.4: From Zero to App in 5 minutes
探索最新的 App 模板、新模型(Llama-3 70B、Llama-3 70B instruct、Llama-3 8B instruct、Mixtral8x22B、Command R plus 等)以及其他改进和错误修复。
适合长期 W/E 的六项 Nerdy AI 活动。StoryDiffusion。AI 代理堆栈。AI 城镇游戏。最新的上下文学习。KANs Alt 到 MLP。Amazon Q Assitant。带有 llama3 的 Agentic RAG。WildChat 数据集。
Llama-3 分水岭时刻。多 AI 代理协作。AI 代理规划。Idefics2-8B V-L 模型。Google Gemini Cookbook。量化介绍。torchtune。DeepMind Penzai。Youtube Commons 数据集。
LLaMA in R with Keras and TensorFlow
使用 TensorFlow 和 Keras 在 R 中实现和演示大型语言模型 LLaMA。
A chat about AI and the new learning landscape
照片由 Levart_Photographer 在 Unsplash 上拍摄过去几周,你可能已经看到过一些关于人工智能 (AI) 的有趣、吸引人或令人恐惧的新闻,比如 ChatGPT、Claude、LLaMA 和其他界面。你可能听过播客解释或哀叹即将取代旧世界的革命性新世界。目前,对我来说,这一切仍然相当令人困惑,不知道它将如何影响我的日常生活,但我很好奇,也非常谨慎乐观。有一件事是相当肯定的:我们孩子的生活将受到人工智能的巨大影响——而且是以我们无法预测的方式。在教育领域,两大巨头——可汗学院和 Duolingo——上周宣布,他们加入了 ChatGPT 的行列,并被授予早期开发和测试想法的权