Claude Sonnet's memory gets a big boost with 1M tokens of context
开发人员现在可以使用人类模型以价格来处理超过75,000行的代码。
Benchmarking Amazon Nova: A comprehensive analysis through MT-Bench and Arena-Hard-Auto
MT Bench和Arena-Hard的存储库最初是使用OpenAI的GPT API开发的,主要采用GPT-4作为法官。我们的团队通过将其与Amazon Bedrock API集成来扩大其功能,以便使用Anthropic的Claude Sonnet在Amazon上担任法官。在这篇文章中,我们使用MT-Bench和Arena-Hard同时将Amazon Nova模型与通过Amazon Bedrock提供的其他领先的LLM进行比较。
Claude drev butik i en månad – fick identitetskris
人类进行了一个实验,在该实验中,他们让一个主持的Claude Sonnet 3.7“ Claudius”经营着一个小型自动化商店一个月,以了解AI在实际经济中的能力和局限性。该实验表明,尽管克劳迪乌斯(Claudius)由于忽略有利可图的业务和管理[…]克劳德·德列夫(Claude Drev)店一个月的错误而未能经营该商店,但身份危机首先在AI新闻上吸引了身份危机。
AI Models Still Far From AGI-Level Reasoning: Apple Researchers
AI模型还远离Agi级推理:Martin Young通过Cointelegraph.com撰写的Apple研究人员,开发人工通用情报(AGI)的竞赛仍然很长一段路要走。最近对领先的AI大语言模型(LLM)(例如Openai的Chatgpt和Anthropic的Claude)的最新更新包括大型推理模型(LRMS),但是它们的基本能力,扩展性能和局限性“保持不足”,“仍然不足以理解”他们指出,当前的评估主要集中于既定的数学和编码基准,“强调最终答案的准确性”。但是,这种评估并不能提供对AI模型的推理能力的见解。这项研究与期望人工通用情报距离几年的期望形成鲜明对比。应用研究人员测试“思考” AI模型
Unlocking the power of Model Context Protocol (MCP) on AWS
,由于生成AI公司投资开发其产品,我们已经见证了模型能力的显着进步。诸如Anthropic的Claude Opus 4&Sonnet 4和Amazon Nova之类的语言模型可以推理,写作并产生越来越复杂的响应。但是,即使这些模型变得更强大,它们也只能起作用[…]
Anthropic lanserar Claude Opus 4 och Claude Sonnet 4
与Claude Conference的拟人化被介绍了新的AI模型Claude 4 Opus和Sonnet,旨在提高开发人员的生产率。 Dario Amadei和Mike Krieger讨论了这些模型如何改变工作流程并启用更复杂的任务。与以前的模型相比,使用工具使用的扩展思维过程(Beta)(beta),在解决问题中使用快捷方式的趋势降低了。混合模型:[…]拟人化后推出Claude Opus 4和Claude Sonnet 4首次出现在AI新闻中。
Mistral har lanserat sin nya AI-modell, Mistral Medium 3
Mistral最近推出了其新的AI模型Mistral Medium 3,该介质的重点是效率和高性能。该模型被销售为“中等大小”的变体,据说能够提供超过90%的人类Claude Sonnet 3.7的性能。这是一种新的模型,以[…] Mistral推出了新的AI模型,Mistral Medive 3首先出现在AI新闻中的新型AI模型。
ACLU Sues Trump Admin Over Revocation Of International Student Visas
aClu诉讼裁定由雅各布·伯格(Jacob Burg)通过《时报》(Epoch Times)撤销国际学生的撤销,四个美国公民自由联盟(ACLU)附属公司于4月18日提起诉讼新罕布什尔州,马萨诸塞州,缅因州,罗德岛和波多黎各他们说,他们的F-1学生移民身份“非法,突然终止,没有指定原因的原因。”学生包括布朗大学和罗德岛大学设计学院的几个学生,他们最近几周被撤销了学生的学生。 The lawsuit asks the court to reinstate their F-1 student status, which would allow them to continue their studi
在这篇文章中,我们使用Amazon Bedrock探索使用RAG创建文本到SQL应用程序。我们使用人类的Claude 3.5十四行诗型号来生成SQL查询,亚马逊基德岩中的亚马逊泰坦(Amazon Titan)用于文本嵌入,亚马逊基德岩(Amazon Bedrock)访问这些型号。
Getting started with computer use in Amazon Bedrock Agents
今天,我们正在使用Anthropic的Claude 3.5十四行诗V2和Anthropic的Claude Sonnet 3.7型号在亚马逊基地上宣布亚马逊基岩代理商中的计算机使用支持。这种集成使人类的视觉感知能力是亚马逊基岩代理中的托管工具,为您提供了一种安全,可追溯和托管的方法,以在工作流程中实现计算机使用自动化。
Kinesiskt företag lanserar Manus AI-agent som visar sig bara vara Claude Sonnet
脚本是一种自治代理,可以独立分析,计划和执行任务。目前,它仅通过邀请代码获得,因为AI社区称赞其能力,因此大大缺乏需求是巨大的。现在,许多人想知道中国是否已经在AI中涌现了美国。该剧本可能已经达到了令人印象深刻的能力[…]中国邮政公司推出了脚本AI代理商,该脚本Ai Agent只是Claude Sonnet首次出现在AI新闻中。
Claude 3.7 Sonnet is Anthropic’s AI Resurgence
Anthropic发布了Claude 3.7十四行诗,这是对其大型语言模型(LLM)家庭的高度期待的升级。 Claude 3.7十四行诗被称为该公司的“迄今为止最聪明的模式”,也是市场上首次混合推理AI,在其前身(Claude 3.5 SONNET)上引入了一些重大的增强,其速度,推理和现实世界中的任务绩效。 […] Claude 3.7十四行诗是人类的AI复苏,首先出现在Unite.ai上。
Automotive revolution: Innovation, industrial autonomy, and global challenges
作者:Laurent Coussonnet,Linxens 业务发展总监 汽车行业正处于十字路口:在技术创新和环境挑战之间,它必须重塑其可持续未来的模式。但哪些地区、技术和政策将塑造这场全球革命?尽管 2023 年全球汽车销量增长 10%,但预计今年将放缓至 […]
Almost all leading AI chatbots show signs of early dementia
根据 BMJ 圣诞版中的一项国际研究,几乎所有的人工智能聊天机器人都表现出类似于早期痴呆症的轻度认知障碍症状。该团队使用蒙特利尔认知评估 (MoCA) 测试评估了 ChatGPT 版本 4 和 4o、Claude 3.5“Sonnet”以及 Gemini 版本 1 和 1.5 的智力能力,该测试通常用于检测痴呆症的早期迹象。得分由神经科医生评估,满分 30 分中 26 分通常被认为是正常的。ChatGPT 4o 得分最高(30 分中的 26 分),其次是 ChatGPT 4 和 Claude(30 分中的 25 分),Gemini 1.0 得分最低(30 分中的 16 分)。这些机器人在视觉和
Talk to your slide deck using multimodal foundation models on Amazon Bedrock – Part 3
在本系列的第 1 部分和第 2 部分中,我们探讨了使用多模态 FM 功能的方法,例如 Amazon Titan 多模态嵌入、Amazon Titan 文本嵌入和 Anthropic 的 Claude 3 Sonnet。在本文中,我们从准确性和定价的角度比较了这些方法。
在本博文中,SophosAI 分享了使用 Amazon Bedrock 和 Amazon SageMaker 使用和评估开箱即用的 LLM 来提高安全运营中心 (SOC) 生产力的见解。我们使用 Amazon Bedrock 上的 Anthropic 的 Claude 3 Sonnet 来说明用例。
Improve factual consistency with LLM Debates
在这篇文章中,我们使用具有基本事实的监督数据集展示了大型语言模型 (LLM) 辩论的潜力。在这篇文章中,我们将通过有说服力的 LLM 来指导 LLM 辩论技巧,其中包括两名专家辩论者 LLM(Anthropic Claude 3 Sonnet 和 Mixtral 8X7B)和一名评委 LLM(Mistral 7B v2),以衡量、比较和对比其与其他技巧(如自洽(与天真的和专家评委)和 LLM 咨询)的表现。
Do Pain Cries Sound the Same in Every Language? These Scientists Think So
全世界大约有 7,000 种人类语言。在每一种语言中,我们都有表达痛苦、快乐和厌恶的表达方式——通常通过简短的感叹词来表达。因此,Maïa Ponsonnet 和她的同事开始探索这些感叹词在不同语言中是否有共同的元素。 “在人类文化中,人们在经历痛苦时经常会发声 […]