VSAS-Bench: Real-Time Evaluation of Visual Streaming Assistant Models
流式视觉语言模型 (VLM) 在给定指令提示和在线输入帧流的情况下不断生成响应。这是实时视觉助手的核心机制。现有的 VLM 框架主要评估离线环境中的模型。相比之下,流式 VLM 的性能取决于纯视频理解之外的其他指标,包括主动性(反映模型响应的及时性)和一致性(反映模型响应随时间的稳健性)。为了解决这个限制,我们提出了 VSAS-Bench,一个新的......
Priority Open Recommendations: Department of Veterans Affairs
GAO 的发现2025 年 5 月,GAO 为退伍军人事务部 (VA) 确定了 29 项优先建议。此后,VA 实施了其中两项建议。2026 年 5 月,GAO 确定了另外 3 项优先建议,使总数达到 30 项。GAO 强调了以下三个值得及时和重点关注的领域:提高质量和及时获得医疗保健、实现信息技术现代化以及加强采购管理。解决 GAO 在这些领域的建议将有助于 VA 应对可能干扰退伍军人医疗保健质量和及时性的风险;实现成本节约并更好地监督信息技术工作;并通过高风险的收购管理应对挑战。采取行动实施 GAO 的所有开放式优先建议将有助于提高整个 VA 运营的效率和效果。GAO 为何进行这项研究优先式
Air Force Readiness: Actions Needed to Address Depot Maintenance Delays and Staffing Challenges
GAO 的发现空军拥有三个维修站,负责维持军事行动所需的飞机的准备状态。自 2019 财年以来,无论是按照飞机到达机库之前设定的原始目标完成日期还是按照维护期间发现的计划外工作的修订目标完成日期来衡量,机库维护延误都大幅增加。2019-2024 财年,空军飞机在机库维护期间延误的百分比空军跟踪原始和修订目标完成日期的机库维护及时性,但主要使用修订后的目标来报告其绩效。GAO 发现与空军关于基地及时性的报告。例如:关于修订后目标的报告掩盖了延误的全部情况,因为它没有反映计划外的工作。维修站在完成维护后经常修改目标,以匹配完成维护所需的实际天数。机库和飞机项目办公室对目标完成日期修订流程的应用不一
Head Start: Office of Head Start Could Improve Communication with Tribal Programs
GAO 的发现启蒙办公室 (OHS) 提供资金和技术援助,支持部落启蒙计划教授土著语言和文化。 2024 财年,OHS 为部落启蒙计划提供了 3.45 亿美元。近年来,OHS 还为 141 个部落启蒙计划提供了与融入本土语言、文化和传统相关的培训。根据启蒙计划绩效标准的允许,GAO 采访的 10 个选定的部落启蒙计划中的每一个都使用浸入式、双语教室或短期语言课程来教授原住民语言。 将土著文化主题纳入部落启蒙游乐场OHS 为部落启蒙计划提供灵活性、培训和技术援助,以帮助解决入学问题。选定的部落启蒙计划的官员积极评价 OHS 的支持,但报告了与 OHS 的沟通挑战,涉及及时性,影响了他们对灵活性的
GAO 的发现黑肺福利计划为因黑肺病而完全残疾的煤矿工人提供福利(收入和医疗福利)。这些矿工还可能因黑肺病而获得其他福利,例如国家工作人员的补偿金。根据 GAO 的分析,2024 年,有 7,709 名矿工受益。其中 93% 的矿工年龄在 62 岁或以上,87% 的矿工仅因残疾而领取联邦黑肺福利。他们也可能有资格享受社会保障退休福利。 GAO 发现,对于 7% 的 62 岁以下人群,大多数人因黑肺病而获得了额外福利。然而,近四分之一的人仅收到联邦黑肺福利金,平均每年 13,400 美元。劳工部 (DOL) 已采取一些措施来解决矿工在联邦黑肺福利方面面临的挑战。例如,为了解决冗长的索赔问题,它在