零...___XiaoMi-AI 助力科研平台

零...

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

零...

¥ 1.0

热度

摘要 - 在经典的损失源编码问题中，一个编码长的源符号块，使扭曲能够接近最终的香农限制。这种块编码方法引入了较大的延迟，这在许多延迟敏感的应用中是不可取的。我们考虑零延迟情况，其中的目标是在没有任何延迟的情况下编码和解码有限的Alphabet Markov源。已经表明，这个问题将自己适合随机控制技术，从而导致存在，结构和一般的结构近似结果。但是，到目前为止，这些技术仅导致了代码设计的计算算法实现。为了解决这个问题，我们提出了一种可实现的强化学习设计算法，并严格证明其渐近最佳性。特别是，我们表明可以使用量化的Q学习算法来获得此问题的近乎最佳的编码策略。证明是基于量化Q学习的最新结果的基础，该Q学习是针对弱伙伴控制的马尔可夫链，其应用需要开发有关规律性和稳定性属性的技术结果，并将最佳解决方案与折扣和平均成本无限的地平线标准问题联系起来。这些理论结果由模拟支持。

添加pdf代下载 VIP点击下载文件

零...

主要关键词

经典的情况可实现的延迟计算法敏感的块编码无限的实现最佳的设计的量化的 Alphabet 结果编码方法最佳中是地平线规律性设计稳定性结果的学习延迟的学习的量化问题应用属性的最终的算法零延迟控制技术理论结果控制的有限的编码一般的较大的

零...PDF文件第1页

零...PDF文件第2页

零...PDF文件第3页

零...PDF文件第4页

零...PDF文件第5页

可下载资源数量

已经购买

下载数量：1

零...

零...

相关文件推荐

在...

An ...

...

...

...

在...

在...

可以在...

通过...

在...

与...

在两个...

...

由于...

在...

...

在...

...

与...

关于...

...

在...

在...

在...

高 - ...

与...

...

在...

...

S- ...

XiaoMi-AI