通过应用程序___XiaoMi-AI 助力科研平台

通过应用程序

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

通过应用程序

¥ 1.0

热度

摘要：贝叶斯优化（BO）在大量控制应用程序中对昂贵的黑盒功能进行全局优化的数据效果表现出了巨大的希望。传统的BO是无衍生的，因为它仅依赖于性能函数的观察来找到其最佳。最近，已经提出了所谓的第一阶BO方法，该方法还将绩效函数的梯度信息进一步加速收敛。一阶BO方法主要利用标准采集功能，而间接使用内核结构中的梯度信息来学习性能功能的更准确的概率替代物。在这项工作中，我们提出了一种直接利用性能函数（Zeroth-order）及其相应梯度（第一阶）评估的梯度增强的BO方法。为此，提出了一个新型的基于梯度的采集功能，可以识别性能优化问题的固定点。然后，我们利用从多目标优化的想法来制定一种e显策略，以找到最佳贸易点的查询点，这些查询点是传统的Zeorth-rorder-rorde获取功能与拟议的基于梯度的采集函数之间的。我们展示了如何使用拟议的获取 - 增强梯度增强的BO（AEGEBO）方法来加速基于策略的增强型学习的收敛，通过将噪声观察结果结合到可以直接从闭环数据中估算的奖励函数及其梯度的噪声。将AEGBO的性能与传统的BO和基准LQR问题上众所周知的增强算法进行了比较，我们始终如一地观察到在有限的数据预算中显着提高了性能。

添加pdf代下载 VIP点击下载文件

通过应用程序

主要关键词

利用工作中评估的拟议全局优化固定点提高性能函数的梯度 BO 增强数据传统的性能函数准确的多目标梯度信息巨大的应用程序有限的采集学习的方法函数新型的替代物功能功能的昂贵的核结构优化增强的策略的

通过应用程序PDF文件第1页

通过应用程序PDF文件第2页

通过应用程序PDF文件第3页

通过应用程序PDF文件第4页

通过应用程序PDF文件第5页

可下载资源数量

已经购买

下载数量：1

通过应用程序

通过应用程序

相关文件推荐

应用程序

在线应用程序

在线应用程序

S62A应用程序

致电应用程序：

应用程序列表

计划检查应用程序

云应用程序安全

应用程序的机器学习

关于应用程序经济

应用程序包-London

致电应用程序：

家长控制应用程序

UnitedHealthcare 应用程序

系统和应用程序

常规应用程序（）（）

i-PRO AI 应用程序

i-PRO AI 应用程序

i-PRO AI 应用程序

关于Soch应用程序的常见问题

安全云业务应用程序

VI类井应用程序（1/6/2025）

克隆和假应用程序缓解

ESKOM声明器应用程序

算法应用程序，它们是算法 - ... div>

mysigen应用程序用户手册

ny forward应用程序

计算机科学/应用程序 div>

应用程序对型 - 型-1-糖的管理。pdf

可逆逻辑门和应用程序

XiaoMi-AI