Loading...
机构名称:
¥ 1.0

为了提供平衡的动作空间,我们定义了 4 维连接动作 ⟨ 𝑜,𝑞,𝑐, Φ ⟩ = 𝑎 ∈A = { Γ × Ω × Ω × Θ } ,其中离散操作选择 𝑜 ,目标和控制量子位 𝑞,𝑐 ∈ Ω = [ 0 ,𝜂 − 1 ] ,连续参数化 Φ ∈[− 𝜋, 𝜋 ] 。据我们所知,我们是第一个考虑在单个闭环中学习门的位置和参数化的人。相比之下,大多数相关工作考虑使用离散动作空间,其中电路必须事后进一步优化 [ 8 , 17 ] 。为了降低操作决策 𝑜 ∈ Γ = { X , P , M , T } 的复杂性,我们应用不受控制的操作(𝑹𝑿 或 𝑷),当且仅当 𝑞 = 𝑐,否则应用受控操作(𝑪𝑿 或 𝑪𝑷)。此外,代理可以测量特定的量子比特(M)或终止当前情节(T),否则当测量完所有可用量子比特或达到可用深度𝛿时终止当前情节。因此,给定一个确定性动作选择策略 𝜋 ( 𝑎 | 𝑠 ) 和一个操作映射 𝑔 : A ↦→ 𝑈 ,电路可以生成为 Σ 𝑡 = ⟨ 𝑔 ( 𝑎 )⟩ 𝑡 ,步骤 𝑡 ≤ 𝜂 · 𝛿 · 2 = 𝜎 。每个情节 𝜎 的可用操作预算使我们能够定义步骤成本 C 𝑡 = max 0 , 3

量子电路设计:强化学习挑战

量子电路设计:强化学习挑战PDF文件第1页

量子电路设计:强化学习挑战PDF文件第2页

量子电路设计:强化学习挑战PDF文件第3页

相关文件推荐

2024 年
¥1.0