Own Your Narrative: Why Personal Branding Matters for University Leaders
HEPI的董事尼克·希尔曼(Nick Hillman)在星期五在牛津大学教育系的一部分的斯科普(Skope)(技能,知识和组织表现中心)组织的一次会议上度过。它是由高等教育系统教授詹姆斯·罗布森(James Robson)监督的,并由技能部长Baroness(Jacqui)Smith负责。在他的开幕式上[…]周末阅读:开创性的罗宾斯报告是否应该告知即将到来的16年后战略?首先出现在HEPI上。
TokenBreak Exploit Bypasses AI Defenses
它很重要:TokenBreak利用绕过AI防御来通过操纵令牌化来逃避LLM内容调节系统。
The Super Weight in Large Language Models
最近的作品显示出令人惊讶的结果:一小部分大语言模型(LLM)参数异常值对模型的质量不成比例。 LLM包含数十亿个参数,因此这些小部分(例如0.01%)转化为数十万个参数。在这项工作中,我们提出了一个更令人惊讶的发现:修剪较少的单个参数可以破坏LLM生成文本的能力 - 使困惑度增加了3个数量级,并将零拍的精度降低到猜测。我们提出了一种无数据识别此类参数的方法…
Choosing the right approach for generative AI-powered structured data retrieval
在这篇文章中,我们探讨了五种不同的模式,用于在AWS中实现LLM驱动的结构化数据查询功能,包括直接对话接口,BI工具增强功能以及自定义的文本到SQL解决方案。
Agentic Prompt Engineering: A Deep Dive into LLM Roles and Role-Based Formatting
在LLM和代理商中使用角色的实用指南,其中包括Clarifai,Crewai和Google ADK的示例。
Context extraction from image files in Amazon Q Business using LLMs
在这篇文章中,我们查看了一个分步实现,用于在Amazon Q Business应用程序中使用自定义文档丰富(CDE)功能来处理独立图像文件。我们将带您浏览CDE中配置的AWS lambda功能来处理各种图像文件类型,并展示该集成如何增强Amazon Q业务提供全面见解的能力的示例场景。
S3 Launches – LLM Eval ‘For Any Jurisdiction, Language + Model’
著名法律技术专家雷蒙德·布莱德(Raymond Blyd)已推出了针对法律需求的新的LLM评估框架S3,该框架着重于“确定核心缺陷而不是……
Instruction-Following Pruning for Large Language Models
随着大语言模型(LLM)的快速缩放,结构化修剪已成为一种广泛使用的技术,可以从较大的模型中学习高效,较小的模型,与SCRATCH类似尺寸的模型相比,较大的模型具有出色的性能。在本文中,我们超越了为模型确定固定修剪掩模的传统静态修剪方法,并提出了一种动态的结构化修剪方法。在我们的方法中,修剪面罩是输入依赖性的,并且根据用户指令中描述的信息动态调整。我们的方法称为…
Evaluating Long Range Dependency Handling in Code Generation LLMs
随着语言模型支持越来越大的上下文大小,评估其使其有效使用该上下文的能力变得越来越重要。我们分析了Several Code生成模型在上下文Windows中使用多个STEPKEY检索任务处理远距离依赖性的能力,最高为8K令牌。与喜欢流行的海景测试的测试相比,这些任务在难度方面逐渐降低,并允许对模型功能进行更多细微的评估。我们发现,当功能…
Advancing Egocentric Video Question Answering with Multimodal Large Language Models
以当前的视频问答(QA)需要模型来处理长途时间推理,第一人称视角以及诸如频繁的摄像机运动之类的专业挑战。本文系统地评估了QAEGO4DV2上的专有和开源多模型模型(MLLMS) - 源自Qaego4d的EgeCentric视频的精制数据集。使用零摄像机和CloseQA设置的零摄像和微调方法评估了四个流行的MLLM(GPT-4O,GEMINI-1.5-PRO,VIDEO-LALAVA-7B和QWEN2-VL-7B-INSTRUCT)。我们将QAEGO4DV2介绍给MitigateAnnotation Noise…
欢迎来到我们的每月摘要,您可以在这里赶上您可能错过的任何AIHUB故事,仔细阅读最新消息,回顾最近的事件等等。本月,我们听说了有关机器人技术的可解释AI,探索隐私的生成模型,并找出Robocup 2025所拥有的东西。准备在Robocup2025开球:A […]
Spreadsheet, Not Skynet: Microdoses, Not Microprocessors
相对于GPT LLM MAMLMS作为语言工件的经济规模的适度力量。当然,由于经济超级巨大,因此对它的相对较小的影响仍然是巨大的。但是...
Higher Education: 10 Questions from a Year 10
*为了宣布兴趣,本·希尔曼(Ben Hillman)是尼克·希尔曼(Nick Hillman)的儿子,尼克·希尔曼(Nick Hillman)是赫普(Hepi)的董事。高等教育:10年级的10个问题首先出现在HEPI上。
Why Your Next LLM Might Not Have A Tokenizer
令牌机是必不可少的邪恶,但是这种激进的方法表明,这可能不再是必要的。为什么您的下一个LLM可能没有令牌器的帖子首先出现在数据科学方面。
Build Multi-Agent Apps with OpenAI’s Agent SDK
使用此开源SDK创建多代理应用程序很简单,并且可以与任何与OpenAI兼容的LLM The Post-The Post-The Post构建多代理应用程序使用OpenAI的Agent SDK一起使用,它首先出现在数据科学上。