EcoFinBench – a natural language processing benchmark for economics and finance
Max Ahrens、Dragos Gorduza 和 Michael McMahon 在这篇英格兰银行论文中提出了一种新的自然语言处理基准:我们引入了 EcoFinBench,这是一个适用于经济和金融领域的自然语言处理 (NLP) 基准套件。我们跨多个特定领域的数据集全面测试大量 NLP 模型,以进行句子分类。具体来说,[...]
Semantic Mastery: Enhancing LLMs with Advanced Natural Language Understanding
大型语言模型(LLM)极大地提高了执行 NLP 任务的能力。然而,更深入的语义理解、上下文连贯性和更微妙的推理仍然很难获得。本文讨论了通过更先进的 NLU 技术(例如语义解析、知识整合和上下文强化学习)推进法学硕士发展的最先进方法。我们分析了结构化知识图、检索增强生成(RAG)以及将模型与人类理解水平相匹配的微调策略的使用。此外,我们解决...
在这篇文章中,我们将探讨 AWS 和 Visa 如何合作,使用 Amazon Bedrock AgentCore 通过 Visa 智能商务来实现代理商务。我们展示了自主人工智能代理如何将碎片化的购物和旅行体验转变为无缝的端到端工作流程——从发现和比较到安全支付授权——所有这些都是由自然语言驱动的。
GIE-Bench: Towards Grounded Evaluation for Text-Guided Image Editing
使用自然语言指令编辑图像已成为一种自然且富有表现力的修改视觉内容的方式;然而,评估此类模型的性能仍然具有挑战性。现有的评估方法通常依赖于 CLIP 等图像文本相似度度量,但缺乏精度。在这项工作中,我们引入了一个新的基准,旨在以更扎实的方式评估文本引导图像编辑模型,沿着两个关键维度:(i)功能正确性,通过自动生成的多项选择题进行评估,以验证预期的更改是否成功......
Building a voice-driven AWS assistant with Amazon Nova Sonic
在这篇文章中,我们将探讨如何使用 Amazon Nova Sonic 进行语音处理并使用 Strands Agent 进行多代理编排来构建复杂的语音驱动 AWS 操作助手。该解决方案展示了自然语言语音交互如何改变云运营,使 AWS 服务更易于访问且运营更高效。
Video Friday: Robot Dog Shows Off Its Muscles
Video Friday 是您每周精选的精彩机器人视频,由您在 IEEE Spectrum 机器人领域的朋友收集。我们还发布了未来几个月即将举行的机器人活动的每周日历。请将您的活动发送给我们以供收录。ICRA 2026:2026 年 6 月 1-5 日,维也纳享受今天的视频!科学东京的 Suzumori Endo 实验室利用薄薄的 McKibben 肌肉开发了一种狗肌肉骨骼机器人。该机器人模仿灵活的“吊床状”肩部结构,以研究狗肌肉骨骼系统的生物力学功能。[Suzimori Endo Robotics Laboratory]HOLEY SNAILBOT!!![Freeform Robotics]