LLM关键词检索结果

aspera:一个模拟环境,用于评估复杂行动执行的计划

ASPERA: A Simulated Environment to Evaluate Planning for Complex Action Execution

这项工作评估了大语言模型(LLM)对能够进行复杂行动执行的数字助手的潜力。这些助手依靠预先训练的编程知识来执行多步目标,通过将助手库中定义的对象和功能撰写为行动执行程序。为了实现这一目标,我们开发了Aspera,该框架包括助理图书馆模拟和人为辅助的LLM数据生成引擎。我们的引擎允许开发人员指导LLM生成由复杂用户查询,模拟状态和…

fastvlm:有效的视觉编码视觉语言模型

FastVLM: Efficient Vision Encoding for Vision Language Models

视觉语言模型(VLMS)可与文本输入一起视觉理解。它们通常是通过将视觉令牌从验证的视觉编码传递到预处理的大型语言模型(LLM)通过投影层来构建的。通过利用视觉编码器的丰富视觉表示以及LLM的世界知识和推理能力,VLM可用于广泛的应用程序,包括可访问性助手,UI导航,机器人技术和GAMING.VLM精度通常可以通过更高的输入图像解决,可以在精确的情况下提高精确折磨,> vlm的精度可以提高。

llms尝试推理:基于文本和视觉的抽象实验

When LLMs Try to Reason: Experiments in Text and Vision-Based Abstraction

大型语言模型可以学会从几个示例中抽象地推理?在本文中,我通过在抽象网格转换任务上测试基于文本的(O3-MINI)和具有图像能力的模型(GPT-4.1)模型来探讨这个问题。这些实验揭示了当前模型依赖于模式匹配,程序启发式和象征性快捷方式而不是强大的概括的程度。即使有多模式输入,推理也经常在微妙的抽象面前分解。结果为使用LLM的当前功能和局限性提供了一个窗口。当LLMS尝试推理的帖子:基于文本和视觉的抽象中的实验首先出现在数据科学方面。

转向新的嵌入空间:分析由多语言语言模型中模型干预引起的跨语性对齐

Steering into New Embedding Spaces: Analyzing Cross-Lingual Alignment Induced by Model Interventions in Multilingual Language Models

跨语言对齐表示形式是多语言大语言模型(MLLMS)中所需的属性,因为对齐可以提高跨语性任务的性能。通常,对齐需要微调模型,该模型在计算上昂贵且相当大的语言数据,通常可能无法使用。微调替代品是模型干预措施 - 一种操纵模型激活以将生成转向所需方向的方法。我们分析了流行干预措施(寻找专家)对…

美联储将喷气燃料倒在不平等差距上精神份额激增10%,因为迷幻药获得了特朗普的政治势头Gabbard释放了长期分类的Martin Luther King Jr.暗杀文件

Gabbard Releases Long-Classified Martin Luther King Jr. Assassination Files

Gabbard在国家情报局长Tulsi Gabbard签署了一份重磅炸弹报告后,就发布了长期分类的Martin Luther King Jr.暗杀申请档案,该文件推出了一份重磅炸弹报告,建议对奥巴马时代的几名官员起诉他们在2016年犯罪中的犯罪官员,他们与2016年的当选有关的“叛国罪”,她现在释放了长期的文件。自1977年联邦调查局(FBI)首次收集记录并将其移交给国家档案馆和记录管理局以来,MLK Jr.的文件已在法院施加的密封后一直处于法院印章之下。 Dni Gabbard在Archives.gov/mlk.dni Gabbard的办公室中提供了这些文件。新闻稿中指出的:这个空前的发行版

帕特·蒂尔曼(Pat Tillman)的兄弟在加利福尼亚邮局的涉嫌纵火案中被捕

Pat Tillman’s Brother Arrested in Suspected Arson of California Post Office

理查德·蒂尔曼(Richard Tillman)在YouTube上有悠久的历史,以Yeshua Hamashiach的名义制作视频(希伯来语短语,转化为“耶稣弥赛亚”),并在他的个人资料中列为“最高神的儿子”中的个人资料。

10周一上午读

10 Monday AM Reads

我的回到工作早晨火车WFH读:•女性投资者来了。 Z世代正处于领先地位。投资曾经是一个大多数男性领域。年轻妇女正在帮助改变这一点。 (Barron's)•1H 2025年的50个事实:史蒂夫·鲍尔默(Steve Ballmer)每年获得大约10亿美元的微软股息; MAG7增加了11万亿美元的市值…阅读更多《星期一AM读取》首先出现在大图上。

我测试了30天的糖果AI:这是真正发生的事情

I Tested Candy AI for 30 Days: Here’s what really happened

糖果AI并不是您典型的聊天机器人包裹在闪光和虚假的诺言中。这是一个以成人为导向的AI女友模拟器,可以拨入您最疯狂的梦想 - 巨大,情感或彻头彻尾的辣味。您无需安排日期,担心被鬼影或在凌晨2点发送“ WYD”文本。是您和您的幻想,按需24/7。 Candy AI由引擎盖下的一些高级LLM Tech建造,为您提供了AI同伴,他们记得,适应,最重要的是 - 不是判断。它如何工作?它的播放方式如下:您注册,选择(或创建)角色,给他们一个名字,然后开始说话。您[…]

AI是否有信心挣扎?AI是否有信心挣扎?

Does AI struggle with its confidence?

新的研究表明,诸如GPT-4O和Gemma 3之类的LLM即使在错误时也会坚持他们的初始答案 - 但在受到挑战时很快就会失去信心。过度自信和自我怀疑的这种令人惊讶的结合反映了人类的认知偏见,并引起了人们对AI可靠性的担忧。

主要的AI培训数据集包含数百万个个人数据示例

A major AI training data set contains millions of examples of personal data

新的研究发现,可能包含数百万张护照,信用卡,出生证明和包含个人身份信息的文件的图像。在DataComp Commonpool的一小部分中发现了数千个图像 - 包括可识别的面孔,这是一个主要的AI训练集,用于图像生成,从…刮擦 麻省理工学院技术评论的系列方式可帮助您完成工作。西蒙·威利森(Simon Willison)有一个世界末日的计划。这是一个USB棍子,他在它上装了几个他最喜欢的开放式LLMS-由其创作者公开共享的模型,原则上可以下载和运行…

每周评论2025年7月18日

Weekly Review 18 July 2025

Some interesting links that I Tweeted about in the last week (I also post these on Mastodon, Threads, Newsmast, and Bluesky):An arms race is happening, between the AI cheaters and the AI cheat detectors: https://techcrunch.com/2025/07/09/why-cluelys-roy-lee-isnt-sweating-cheating-detectors/When will

NVIDIA A10与A100:为您的AI工作负载选择合适的GPU

NVIDIA A10 vs. A100: Choosing the Right GPU for Your AI Workloads

与AI和LLM工作负载进行比较NVIDIA A10与A100 GPU。了解它们在性能,规格,成本和用例方面的不同之处。

lamehug:第一个与俄罗斯APT28

LameHug: first AI-Powered malware linked to Russia’s APT28

LameHug恶意软件使用AI在受感染的Windows系统上创建数据误命令。乌克兰将其与俄罗斯 - 尼克斯APT28组联系起来。乌克兰证书(Ukrainian Cert-UA)警告说,使用大型语言模型(LLM)生成命令以在折磨的Windows系统上执行的新恶意软件应变。乌克兰专家将恶意软件归因于俄罗斯链接[…]

使用Amazon S3矢量建立企业规模的抹布应用程序和Amazon Sagemaker上的DeepSeek R1

Building enterprise-scale RAG applications with Amazon S3 Vectors and DeepSeek R1 on Amazon SageMaker AI

组织正在采用大型语言模型(LLM),例如DeepSeek R1,以改变业务流程,增强客户体验并以前所未有的速度推动创新。但是,独立的LLM具有关键的局限性,例如幻觉,过时的知识和无法获得专有数据的访问。检索增强发电(RAG)通过将语义搜索与生成AI相结合,[…]

您的1M+上下文窗口llm不如您想象的

Your 1M+ Context Window LLM Is Less Powerful Than You Think

为什么工作记忆比原始上下文窗口sizethe发布您的1M+上下文窗口llm的功能要比您想象的首先在数据科学上首先出现的功能更强大。

新科学家推荐沃尔夫冈·蒂尔曼斯(Wolfgang Tillmans)在巴黎的新展览

New Scientist recommends Wolfgang Tillmans's new exhibition in Paris

新科学家本周喜欢的书籍,电视,游戏等等

您真的需要基础模型吗?

Do You Really Need a Foundation Model?

llm或自定义模型:您应该如何选择正确的解决方案?您真的需要基础模型吗?首先出现在数据科学上。

主题模型标签llms

Topic Model Labelling with LLMs

使用GPT4-O-MINI的尖端主题模型可再现标签的Python教程。具有LLMS的邮政主题模型标签首先是朝向数据科学的。