Loading...
机构名称:
¥ 1.0

摘要 - 在经典的损失源编码问题中,一个编码长的源符号块,使扭曲能够接近最终的香农限制。这种块编码方法引入了较大的延迟,这在许多延迟敏感的应用中是不可取的。我们考虑零延迟情况,其中的目标是在没有任何延迟的情况下编码和解码有限的Alphabet Markov源。已经表明,这个问题将自己适合随机控制技术,从而导致存在,结构和一般的结构近似结果。但是,到目前为止,这些技术仅导致了代码设计的计算算法实现。为了解决这个问题,我们提出了一种可实现的强化学习设计算法,并严格证明其渐近最佳性。特别是,我们表明可以使用量化的Q学习算法来获得此问题的近乎最佳的编码策略。证明是基于量化Q学习的最新结果的基础,该Q学习是针对弱伙伴控制的马尔可夫链,其应用需要开发有关规律性和稳定性属性的技术结果,并将最佳解决方案与折扣和平均成本无限的地平线标准问题联系起来。这些理论结果由模拟支持。

零...

零...PDF文件第1页

零...PDF文件第2页

零...PDF文件第3页

零...PDF文件第4页

零...PDF文件第5页

相关文件推荐

2024 年
¥1.0
2024 年
¥1.0
2018 年

...

¥1.0
2025 年

...

¥1.0
2023 年

...

¥1.0
2024 年
¥1.0
2025 年
¥1.0
2023 年
¥1.0
2024 年
¥1.0
2023 年
¥2.0
2024 年
¥18.0
2024 年
¥1.0
2024 年

...

¥3.0
2024 年
¥1.0
2024 年
¥1.0
2025 年

...

¥1.0
2025 年
¥1.0
2024 年

...

¥2.0
1900 年
¥1.0
1900 年
¥1.0
2024 年

...

¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2025 年
¥1.0
2024 年
¥3.0
2024 年

...

¥3.0
2025 年
¥1.0
2024 年

...

¥1.0
2024 年
¥1.0