从演示和成对偏好推断奖励函数是将强化学习 (RL) 代理与人类意图相结合的良好方法。然而,最先进的方法通常专注于学习单一奖励模型,因此很难权衡来自多位专家的不同奖励函数。我们提出了多目标强化主动学习 (MORAL),这是一种将社会规范的不同演示组合成帕累托最优策略的新方法。通过维持标量权重的分布,我们的方法能够以交互方式调整深度 RL 代理以适应各种偏好,同时无需计算多个策略。我们在两种场景中通过实证证明了 MORAL 的有效性,这两种场景模拟了交付和紧急任务,需要代理在存在规范冲突的情况下采取行动。总的来说,我们认为我们的研究是朝着具有学习奖励的多目标 RL 迈出的一步,弥合了当前奖励学习和机器伦理文献之间的差距。
对于可持续供应链网络的优化设计,考虑问题因素的综合性,综合考虑经济、环境和社会三个方面,以建立成本最小、环境污染排放最小和劳动力数量最大为目标,建立以供应链网络效率最大化为目标的混合整数规划模型。本文的创新之处,首先是在连续供应链中考虑经济、环境和社会效益的影响,其中环境效益不仅考虑碳排放,还包括工厂废水、废弃物和固体废弃物的排放作为影响因素。其次,构建了多目标模糊隶属函数,以总体满意度值来衡量模型解的质量。最后,提出了混沌粒子蚁群算法,解决了粒子群算法运行中出现的过早收敛问题。实验结果表明,本文提出的PSCACO算法与MOPSO、CACO、NSGA-II算法进行比较,得出算法的收敛效果更加有效,验证了混沌粒子蚁群算法求解多目标函数的有效性和可行性,为供应链管理提出了一种新的可行方案。
量子信息的处理由量子电路定义。对于当前量子设备上的应用,这些通常是参数化的,即它们包含具有可变参数的操作。设计这样的量子电路和聚合的高级量子算子是一项具有挑战性的任务,需要大量的量子信息理论知识,前提是可以通过分析找到多项式大小的解。此外,找到一个具有低计算成本的精确解决方案代表着一个重大的权衡,特别是对于当前一代量子计算机而言。为了应对这些挑战,我们提出了一种多目标遗传编程方法(与数值参数优化器混合)来自动合成参数化量子算子。为了证明所提出方法的优势,将其应用于混合量子经典算法的量子电路,然后与分析解决方案和非混合版本进行比较。结果表明,与非混合版本相比,我们的方法产生了更多样化的解决方案和更准确的量子算子,甚至达到了分析基线的质量。
有很多现实世界的黑框优化概率需要同时优化多个标准。然而,在多目标优化(MOO)问题中,确定整个帕累托阵线需要过度的搜索成本,而在许多实际情况下,决策者(DM)只需要在帕累托最佳解决方案集中的特定解决方案。我们提出了一种贝叶斯操作方法(BO)方法,以使用昂贵的目标功能识别MOO中最喜欢的解决方案,其中DM的贝叶斯偏好模型是根据两种称为成对偏好和改进请求的Supperions类型的交互方式自适应估算的。要探索最优选的解决方案,我们定义了一个采集函数,在该函数中,在观察函数和DM偏好中的不确定性都已合并。为了最大程度地减少与DM的相互作用成本,我们还为偏好估计提出了一种主动学习策略。我们通过基准功能优化和机器学习模型的高参数优化问题来证明我们提出的方法的有效性。
电台。因此,这些控制变量的最佳计划方法可以解决上述问题,其中尺寸和位置会影响微电网中的功率流,从而导致功率损失,电压偏差和整体成本的变化。许多研究讨论了与微电网中电动汽车的最佳杂交可再生能源。参考文献中的作者。[1,2]提出了一种基于机器学习的可再生微电网的基于机器学习的能量管理,并考虑了电动汽车的充电需求。参考文献中已经提出了一种基于优化的方法。[3 - 5]在当天 - 考虑电动汽车和RER的微电网之前运行。参考。[6],作者开发了一个模糊的云随机框架,用于根据电动汽车的最大分布来管理使用RER的微电网的能量。通过使用智能聚合器,一种能源管理系统已被优化,用于在微电网中转移电源(车辆到车辆)。7[8],通过考虑不受控制和智能充电模式对微电网最佳操作的影响来评估EV的行为。在参考文献中讨论了EVS的最佳分配和调度操作问题。[9 - 11]。在参考文献中提出了一种随机能源管理算法。[12]解决电力市场中智能微电网的贡献,同时最大程度地减少总成本并确定RER的最佳尺寸。参考。参考。参考。参考。参考。参考。[13],作者解释了光伏面板产生的波动功率的效果,并将EV引入了储能,以在紧急条件下为电网提供电网。[14],作者提议在欧洲三个不同地点进行环境足迹,以通过有效的计划方法与最佳电池存储与电池储存的有效计划方法减少二氧化碳气体的排放,以平衡电力生产和需求之间的间隙。[15],作者回顾了许多研究的方法,用于管理包括RER,常规分布式发电机在内的微电网能量,以及参与智能家居的需求响应和充电站对系统技术和经济运营的影响。[16],作者提出了一个有效的计划操作,用于通过与电力市场对电力市场的互动对系统最佳经济运营的相互作用来证明作为价格制造商作为价格制造商的影响,包括RERS,能源存储和常规来源。[17],作者开发了一种满足最大载荷需求的方法,在不断变化的天气条件下可能的最低成本和动态分析,从而通过从太阳能站的各种系统组合,储能,水电站和常规来源的各种系统组合中获得的最佳配置在OFF-网格中进行瞬时干扰。[18],作者表达了在
摘要 — 为了提高基于稳态视觉诱发电位 (SSVEP) 的脑机接口 (BCI) 的目标识别性能,已经提出了许多空间滤波方法。现有的方法倾向于仅使用来自同一刺激的训练数据来学习某个目标的空间滤波器参数,并且它们很少考虑来自其他刺激的信息或训练过程中的体积传导问题。在本文中,我们提出了一种新的基于多目标优化的高通空间滤波方法来提高 SSVEP 检测的准确性和鲁棒性。滤波器是通过最大化训练信号和来自同一目标的单个模板之间的相关性,同时最小化来自其他目标的信号与模板之间的相关性来得出的。优化还将受到滤波器元素之和为零的约束。在两组自采集的 SSVEP 数据集(分别包含 12 个和 4 个频率)上的评估研究表明,所提方法优于 CCA、MsetCCA、SSCOR 和 TRCA 等比较方法。所提方法还在 35 名受试者记录的公开 40 类 SSVEP 基准数据集上进行了验证。实验结果证明了所提方法对提升 SSVEP 检测性能的有效性。
提出了一种用于水下监视应用中的协同轨迹检测的漂移声学传感器网络最优部署决策支持系统,并在模拟场景中进行了测试。该系统集成了海水流预报、传感器范围模型和简单的漂移浮标运动模型,以预测传感器位置和时间网络性能。多目标遗传优化算法用于通过同时优化两个服务质量指标(网络区域覆盖和跟踪覆盖的时间平均值)来搜索一组帕累托最优部署解决方案(即网络中漂移声纳浮标的初始位置)。优化后找到的解决方案代表了两个指标之间不同的效率权衡,任务规划人员可以方便地评估这些解决方案,以便在两个冲突目标之间选择具有所需折衷的解决方案。还通过无迹变换进行敏感性分析,以测试解决方案对于网络参数和环境不确定性的稳健性。提供了利用真实概率海水流预报的模拟场景的结果,显示了所提方法的有效性。未来的工作预计将使该工具完全可操作并准备在实际场景中使用。� 2013 北约科学技术组织,海事研究与实验中心。由 Elsevier Ltd. 出版。保留所有权利。
提出了一种用于水下监视应用中的协同轨迹检测的漂移声学传感器网络最优部署决策支持系统,并在模拟场景中进行了测试。该系统集成了海水流预报、传感器范围模型和简单的漂移浮标运动模型,以预测传感器位置和时间网络性能。采用多目标遗传优化算法,通过同时优化两个服务质量指标(网络区域覆盖和跟踪覆盖的时间平均值)来搜索一组帕累托最优部署解决方案(即网络漂移声纳浮标的初始位置)。优化后找到的解代表了两个指标之间不同的效率权衡,任务规划人员可以方便地评估这些解,以便在两个冲突目标之间选择具有所需折衷的解决方案。还通过无迹变换进行了灵敏度分析,以测试解决方案对网络参数和环境不确定性的稳健性。提供了利用真实概率海水流预报的模拟场景的结果,显示了所提方法的有效性。未来的工作是使该工具完全可操作并准备在真实场景中使用。� 2013 北约科学技术组织,海事研究和经验中心
组蛋白特异性脱甲基酶1(LSD1/KDM1A)在2004年首次被鉴定为一种表观遗传酶,能够脱甲基甲基化的组蛋白H3的特异性丝氨酸残基,即H3K4ME1/2和H3K9ME1/2 AS FADOF。它在许多类型的癌症(乳房,胃,前列腺,肝细胞和食管癌,急性髓样白血病等)中无处不在,导致了分化的障碍,并增加了细胞水平的增殖,迁移和侵入性。LSD1抑制剂可以分组为共价和非共价剂。 每个组都包含一些混合化合物,可以同时抑制LSD1(双重或多静脉组化合物)。 迄今为止,有9个LSD1抑制剂已经进入了血液学和/或固体癌症的临床试验。 Seven of them (tranylcypromine, iadademstat (ORY-1001), bomedemstat (IMG-7289), GSK-2879552, INCB059872, JBI-802, and Phenelzine) covalently bind the FAD cofactor, and two are non-covalent LSD1 inhibitors [pulrodemstat (CC- 90011)和Seclidemstat(SP-2577)]。 另一个基于TCP的LSD1/MAO-B双重抑制剂VA Fiferstat(ORY-2001)正在接受阿尔茨海默氏病和人格障碍的临床试验。 本综述总结了LSD1的结构和功能,其在癌症和非癌症中的病理意义以及与不同化学支架的LSD1共价和非共价抑制剂的鉴定,包括参与临床试验的抑制剂,以强调其潜在的潜在和选择性的抗抗癌药。LSD1抑制剂可以分组为共价和非共价剂。每个组都包含一些混合化合物,可以同时抑制LSD1(双重或多静脉组化合物)。迄今为止,有9个LSD1抑制剂已经进入了血液学和/或固体癌症的临床试验。Seven of them (tranylcypromine, iadademstat (ORY-1001), bomedemstat (IMG-7289), GSK-2879552, INCB059872, JBI-802, and Phenelzine) covalently bind the FAD cofactor, and two are non-covalent LSD1 inhibitors [pulrodemstat (CC- 90011)和Seclidemstat(SP-2577)]。另一个基于TCP的LSD1/MAO-B双重抑制剂VA Fiferstat(ORY-2001)正在接受阿尔茨海默氏病和人格障碍的临床试验。本综述总结了LSD1的结构和功能,其在癌症和非癌症中的病理意义以及与不同化学支架的LSD1共价和非共价抑制剂的鉴定,包括参与临床试验的抑制剂,以强调其潜在的潜在和选择性的抗抗癌药。
摘要 - 分解有限的多目标优化问题,其进化算法引起了相当大的关注。使用不同的算法策略,进化运算符和约束处理技术,已经开发出各种受约束的多目标优化算法(CMOEAS)。CMOEA的性能可能很大程度上取决于所使用的操作员,但是,通常很难为当前的问题选择合适的操作员。因此,改善操作员的选择是有希望的,对于CMOEAS来说是必要的。这项工作提出了一个在线操作员的选择框架,并在深入的强化学习中有助于。人口的动态,包括融合,多样性和可行性,被视为国家;候选运营商被视为行动;人口状态的改善被视为奖励。通过使用Q-Network学习策略来估计所有动作的Q值,建议的方法可以适应地选择一个操作员,该操作员根据当前状态最大程度地提高人口的改善,从而改善算法性能。该框架嵌入了四个流行的CMOEAS中,并在42个基准问题上进行了评估。实验结果表明,与九个最先进的CMOEA相比,提出的深钢筋学习辅助操作员的选择显着提高了这些CMOEAS的性能,并且所得算法获得了更好的多功能性。