演示关键词检索结果

没有 TD 学习的 RL

RL without TD learning

在这篇文章中,我将介绍一种基于“另类”范式的强化学习 (RL) 算法:分而治之。与传统方法不同,该算法不是基于时间差(TD)学习(存在可扩展性挑战),并且可以很好地扩展到长视野任务。我们可以基于分而治之进行强化学习(RL),而不是时间差(TD)学习。问题设置:离策略RL我们的问题设置是离策略RL。让我们简单回顾一下这意味着什么。强化学习中有两类算法:在策略强化学习和离策略强化学习。同策略 RL 意味着我们只能使用当前策略收集的新数据。换句话说,每次更新策略时我们都必须丢弃旧数据。像 PPO 和 GRPO 这样的算法(以及一般的策略梯度方法)就属于这一类。离策略 RL 意味着我们没有这个限制:我

Austal 在 2025 年印度太平洋航空展上展示新型 Vantage 地面无人机

Austal Shows New Vantage Surface Drones at Indo Pacific 2025

澳大利亚亨德森造船厂 Austal 本周在悉尼举行的 Indopacific 2025 上展示了 Vantage 系列大型可选配船员水面舰艇 (LOSV)。此外,该公司还展示了他们的 AROS(自主和远程操作船舶)平台控制器套件。该产品旨在为无人和可选载人水面舰艇提供标准化控制接口。奥斯塔演示...奥斯塔在 2025 年印度太平洋上展示新型 Vantage 水面无人机的帖子首先出现在《海军新闻》上。

经过实战测试的 Syos USV 实现了快速能力

Combat-tested Syos USVs achieve rapid speed to capability

Syos 是一家源自新西兰的科技初创公司,在英国和乌克兰也设有办事处,并迅速将无人水面舰艇 (USV) 作为公司的增长领域。仅去年一年,它就为客户生产了数十种工艺品。这在最近进行的一次演示中得到了例证……经过战斗测试的 Syos 无人水面艇实现了快速的能力能力,首先出现在《海军新闻》上。

烟花是怎样飞的?

How do fireworks fly?

你有没有想过烟花是如何飞翔的?烟花飞行背后的科学原理与火箭相同,也是牛顿第三运动定律的精彩演示。对于每一个动作,都会有一个相等且相反的反应。就像火箭一样,烟花需要克服重力的力量。 […]帖子烟花如何飞翔?首先出现在《儿童科学实验》上。

新西兰航空与BETA正式推出电动计划

Air New Zealand, BETA officially launch electric programme

新西兰航空和 BETA Technologies 正式启动了该航空公司的下一代飞机技术演示计划,标志着新西兰电动飞机创新的一个重要里程碑。测试版 [...]

观看这对变形机器人行走、驾驶和飞行

Watch this morphing robot duo walk, drive, and fly

就像早期变形金刚电影中的场景一样,加州理工学院的研究人员刚刚演示了人形机器人和无人机如何合作来完成多种形式的运动。该实验为机器人运动开辟了新的可能性。继续阅读类别:机器人、技术标签:加州理工学院、人形机器人、无人机、机器人

B-2 隐形轰炸机在反舰武器测试中击沉目标

B-2 Stealth Bomber Sinks Target in Anti-Ship Weapon Test

美国空军与挪威飞机上周一起使用新型精确制导炸弹击沉了一个海上目标,这是美国空军在俄罗斯和中国海军威胁下整合反舰弹药的最新努力。 9 月 3 日,隶属于密苏里州怀特曼空军基地第 393 轰炸机一代中队的 B-2 Spirit 隐形轰炸机与空军研究实验室的 QUICKSINK 海上武器集成,在挪威海针对海上目标进行了演示。 “B-2 发挥了核心作用,它使用精确制导的 QUICKSINK 弹药来攻击并击沉海上目标。除了测试弹药的性能

在雨天和泥泞中,法国炮兵部队展示了乌克兰战争的教训

In rain and mud, French artillery unit shows lessons from Ukraine war

这次演示展示了法国第 35 伞兵炮兵团如何努力适应无人机主导的战场。

灯光、相机、算法——Kling AI 如何点亮东京大屏幕

Lights, Camera, Algorithm — How Kling AI Lit Up Tokyo’s Big Screen

屋子里的灯光变暗了,谈话声也减弱了,然后一切开始了——人工智能制作的短片在东京电影院的屏幕上滚动。这不是技术演示,也不是营销噱头。这是 Kling AI 的电影展示,Kling AI 是快手科技的一个平台,它如何教会机器在电影中做梦,引起了人们的关注。此次活动精选了 NEXTGEN 创意大赛的获奖作品,该大赛收到了来自 122 个国家/地区的 4,600 多份参赛作品,这一惊人的参赛人数让您怀疑下一个斯皮尔伯格是否可能会编写提示而不是剧本。电影,范围 [...]

Vention展示智能制造新的人工智能和开发者平台功能

Vention präsentiert neue KI- und Entwicklerplattform-Funktionen für die intelligente Fertigung

蒙特利尔,2025 年 10 月 29 日 /美通社/ — 全球唯一人工智能驱动的全栈软件和硬件自动化平台开发商 Vention 今天宣布了智能制造的下一步发展,使 Vention 更接近其 Zero-Shot Automation™ 的愿景。在第六届年度演示日上,Vention 推出了新功能,其中... 继续阅读 →

美国士兵在北方打击 25-2 期间控制了自主黑鹰

U.S. Soldier Takes Control of Autonomous Black Hawk During Northern Strike 25-2

一名美国士兵代替训练有素的飞行员负责使用自选驾驶黑鹰直升机规划和执行任务。西科斯基公司宣布对其采用 MATRIX 技术的可选驾驶 (OPV) 黑鹰直升机的功能进行新的演示,以及它可以为战场带来什么。期间 [...]

SpaceX 发射私人空间站探路者“Haven Demo”,并将其他 17 颗卫星送入轨道(视频)

SpaceX launches private space station pathfinder 'Haven Demo,' 17 other satellites to orbit (video)

SpaceX 今天(11 月 2 日)启动了今年的第 140 次猎鹰 9 号任务,将“Haven Demo”技术演示器和其他 17 个有效载荷送上 Bandwagon-4 拼车任务。

欧洲正致力于在 2030 年代初开发可重复使用的火箭

Europe is working to develop reusable rockets by the early 2030s

ArianeGroup 的甲烷燃料普罗米修斯发动机和忒弥斯演示器标志着欧洲可重复使用火箭计划迈出了关键一步。

25 年 29 月 10 日空降:X-59 飞翔!!!、Kings Aid CFI、停机影响 ATC 训练

Airborne 10.29.25: X-59 Flies!!!, Kings Aid CFIs, Shutdown Hurts ATC Training

另外:AIR 失去 eVTOL 演示机、美国海岸警卫队获得新的直升机、货机机队不断壮大、美国陆军落后于洛克希德·马丁公司 Skunk Works 与 NASA 合作,成功完成了 X-59 的首次飞行,这是一款创新、安静的超音速飞机,旨在将超音速飞行的能力恢复到商业航空旅行中。 X-59 从加利福尼亚州帕姆代尔的美国空军 42 号工厂的臭鼬工厂发射升空,并降落在加利福尼亚州爱德华兹的 NASA 阿姆斯特朗飞行研究中心附近。 King Schools 正在加紧努力,帮助填补 AceCFI 突然关闭留下的空白,为受影响的 CFI 提供飞行教练进修课程 (FIRC) 的大幅折扣。在线 FIRC 服务

美国士兵首次指挥自主黑鹰

U.S. Soldier First to Command Autonomous Black Hawk

Northern Strike 的演示突出了洛克希德新型自主黑鹰飞行技术。

强化学习通过自适应揭示基本原理进行推理

RL for Reasoning by Adaptively Revealing Rationales

我们提出,来自部分专家演示的强化学习(RL)不仅仅是一种训练启发式方法,而且是解决复杂序列生成任务的一个有前景的框架。监督微调(SFT)依赖于密集的真实标签,随着序列长度的增长,其成本也越来越高。另一方面,强化学习则面临着稀疏奖励和组合大输出空间的问题。我们通过引入自适应回溯(AdaBack)来解决这个问题,这是一种按样本课程学习算法,在训练期间仅显示目标输出的部分前缀。该...

Rostec 首次展示了带有拦截无人机的新型自动化反无人机综合体

Ростех впервые представил новый автоматизированный антидрон-комплекс с БПЛА-перехватчиками

该演示是莫斯科 Interpolitex-2025 展览的一部分

让您的声音听起来充满自信,或者如果您愿意的话可以小声说话 - Adobe 的“Corrective AI”可让您重写情绪本身

Make your voice sound confident—or whisper it if you like—Adobe’s “Corrective AI” lets you rewrite emotion itself

当我观看演示时,老实说我认为这是一个噱头。一个沉闷、机械的声音读了一行字,然后,轻轻一按,它就变得温暖而富有表现力。这就是纠正人工智能的作用——它可以让你在录制后改变录制的画外音的情绪。无需重拍,无需工作室时间,只需一些标签和滑块即可添加“平静”、“自信”或“耳语”等情绪。这是 Adob​​e 对创意人工智能日益痴迷的一部分。该公司已经将 Firefly 扩展为一个完整的音频和视频工作室,推出了可以根据文本提示生成音轨和语音的工具。纠正[...]