预计能量转换将显着增加可再生能源的份额,其生产在电力组合中是间歇性的。除了关键的好处外,这一开发的主要缺点是产生电源和需求之间的不匹配。创新的动态定价方法可能会通过利用需求方提供的灵活性来大大促进这一关键问题。以此为核心,这是为消费者提供随着时间的流逝而不断发展的价格信号,以影响其消费。这种新颖的方法涉及一个具有挑战性的决策问题,可以概括如下:如何确定价格信号在维持生产者/零售商的盈利能力的约束下,最大化电源和需求之间的同步,并同时使最终消费者受益?作为一项贡献,这项研究工作介绍了该特定决策问题的详细形式化。此外,本文讨论了有效设计动态定价策略所需的各种算法组件:不同的预测模型以及对动态价格需求响应的准确统计建模。©2023作者。由Elsevier Ltd.这是CC下的开放访问文章(http://creativecommons.org/licenses/4.0/)。
摘要。当今世界,世界各地的汽车行业都在简化电动汽车 (BEV) 的生产,以迈向创造无污染环境。BEV 被用作全球范围内减轻碳排放的替代策略。由于环境保护是长期可持续发展目标之一,因此需要从化石燃料转向可再生能源,同时这也引发了对电动汽车进行最佳选择的决策问题。本文考虑了 Faith Ecer 早期作品中基于十种替代 BEV 和十一项标准的决策问题。多标准决策的新型排序方法 MCRAT(按替代轨迹进行多标准排序)与三种不同的标准权重计算方法 AHP(层次分析法)、CRITIC(通过标准间相关性确定标准重要性)和 MEREC(基于标准去除效果的方法)一起使用。使用随机森林机器学习算法对获得的结果进行比较和验证。这项研究工作结合了多标准决策方法和机器学习算法,对电动汽车做出最佳决策,这种综合方法产生了最佳排名结果,并且它肯定会在未来的决策方法中开辟新的空间。
马尔可夫决策过程使代理商与其环境之间的非确定性相互作用在可拖动的随机框架内进行建模。每次代理人观察当前状态,并采取行动,从而立即获得奖励。当时代理的目标是优化其预期的累积奖励。在数学上,马尔可夫决策问题是基于动态编程原则解决的,其框架是许多强化学习算法的基础,例如,例如Q-学习算法。有关马尔可夫决策过程的理论,请参见[5,10,25,26],以及[1,6,7,11,11,12,15,20,29,33]有关其应用,尤其是在强化学习领域。在马尔可夫决策问题的经典设置中,给出了基础马尔可夫决策过程的过渡概率的过渡内核。从经济上讲,这意味着代理具有对基本过程的真实分布的了解,这通常在实践中不能做出理由。为了解决这个问题,学者们最近引入了马尔可夫决策问题的强大版本,以说明假定的潜在概率内核可能的误约
线性动力系统(LDS)是在工程和科学中广泛使用的数学模型,以描述随着时间的推移而发展的系统。在本文中,我们研究了离散时间线性动力学系统各种决策问题的算法。我们的主要重点是模型检查问题,即在给定线性动力学系统和ω规范规范的情况下,决定LDS的轨迹是否满足规范。使用来自各种数学学科的工具,大多数
当一个国家需要为其空军购买一架新的军事训练飞机时,必须考虑许多因素。这需要很好地掌握相互冲突的因素,这可以从多标准决策 (MCDM) 领域中受益。然而,评估过程中涉及的一些标准通常不精确或模糊,使用具有模糊数字特征的语言术语可能是明智的。因此,本研究的目的是从模糊 MCDM 方法组合中提取最佳方法,以解决西班牙空军感兴趣的实际决策问题,具体来说,是根据一组不同性质的标准选择最佳军用高级训练飞机。这个决策问题一方面涉及定量或技术标准(战斗上限、作战速度、起飞速度等),另一方面涉及定性标准(机动性、人体工程学等),这些标准基于第 23 战斗机和攻击训练联队的一组飞行教练的经验,通过问卷调查收集。采用层次分析法 (AHP) 确定标准权重,采用参考理想方法 (RIM) 及其模糊版本 (FRIM) 根据上述飞行教练定义的参考理想方案评估替代方案。结果,意大利阿莱尼亚马基 M-346 主飞机被选为最佳选择。© 2020 Elsevier B.V. 保留所有权利
太空任务操作的高成本促使多个航天机构优先开发自主航天器指挥和控制技术。深度强化学习 (DRL) 技术为创建复杂、多方面的操作问题的自主代理提供了一个有前途的领域。这项工作研究了将 DRL 驱动的策略生成算法应用于航天器决策问题的可行性,包括构建航天器决策问题的策略,例如马尔可夫决策过程、降维途径、使用专家领域知识进行简化、对超参数的敏感性以及面对错误建模的环境动态时的鲁棒性。此外,在屏蔽深度强化学习的新颖改编中,考虑通过将这些方法与构造正确的控制技术相结合来确保这些方法的安全性。这些策略针对原型低保真驻留场景和高保真姿态模式管理场景进行了演示,涉及飞行遗产姿态控制和动量管理算法。研究发现,DRL 技术与这些问题的其他黑盒优化工具或启发式解决方案相比具有优势,并且需要与深度学习社区中广泛使用的测试数据集类似的网络规模和训练持续时间。
1。预算控制 - 预算的特征,预算控制系统的组织。预算类型。准备不同类型的预算。2。边际成本核算 - 意义和目标。中断 - 分析,成本 - 数量 - 利润分析,各种决策问题。3。决策中的成本概念 - 相关成本,差异成本,增量成本和机会成本。4。向管理层报告 - 报告的含义和模式,不同级别的管理和报告。报告的形式,报告的分类。
卫生经济模型通常用于世界许多国家医疗资源分配决策[1-5]。模型提供了一种明确的方法来构建决策问题并综合所有相关证据来估计给定健康状况(通常为终生健康状况)下替代医疗干预措施的预期成本和后果。传统的卫生经济模型是“分段的”,因为它们通常解决护理路径中特定决策点的单个决策问题。分段模型代表了英国国家健康与临床优化研究所 (NICE) 和其他类似机构用于指导有关卫生技术可用性的决策的标准分析方法[6-8],但它们受到一些局限性[9]。其中第一个局限性与未能捕捉不同干预措施之间的系统相互依赖性有关。任何新干预措施的成本效益不仅取决于新干预措施本身的成本和有效性,还取决于现行系统的配置,即现有干预措施的可用性、成本和有效性[9,10]。例如,针对某种癌症类型的新检测的成本效益可能取决于目前对确诊疾病患者的推荐治疗方案,以及对无症状个体的筛查计划的可用性。由于分段模型的范围有限,这种用于同一病症的干预措施之间的系统级相互依赖性很少能被充分捕捉。其次,分段模型通常采用简单的分段成本/质量调整生命年 (QALY) 阈值规则,该规则不明确考虑预算约束 [11,12]。然而,有充分的证据表明,反复应用基于阈值的决策规则可能会导致医疗保健支出不受控制地增长 [13-18]。第三,大多数模型的开发目的都是为了为更广泛医疗途径中的单个决策问题提供信息。这意味着,在整个疾病领域,报销和覆盖范围决策基于许多异步开发的离散经济模型,这些模型往往应用不同的模型结构、假设和证据。这可能导致两个解决同一决策问题的模型得出不一致的结论,有可能导致次优的采用决策[19-25]。系统级模型涵盖整个疾病领域的重要事件、健康结果和成本,是解决传统分段模型局限性的潜在方法。三个著名的系统级模型包括美国阿基米德糖尿病模型[26]、美国冠心病 (CHD) 政策模型[27]和英国 CHD 模型[28]。虽然这种建模方法可以追溯到 1977 年 [ 29 ],但直到 2012 年 Tappenden 等人提出了全疾病模型 (WDM) 的方法框架 [ 9 ],它才得到很好的定义。简而言之,WDM 是一个系统级的通用疾病模型,可以对整个疾病和治疗途径(包括预防、检测、诊断和治疗)中的选项进行一致的经济分析 [ 9 ]。由于这些模型的范围更广,它们侧重于整个疾病和治疗途径,而不是
健康经济模型通常用于为全球许多国家的医疗保健资源分配决策提供信息[1-5]。模型提供了构建决策问题并综合所有相关证据的明确手段,以估算给定健康状况(通常在一生中)内的替代卫生保健干预措施的预期成本和后果。常规健康经济模型是“分段”,因为它们典型地在护理途径的特定决策点上解决了一个决策问题。“零件”模型代表了国家卫生与护理研究所(NICE)和其他地方的类似机构提供有关健康技术可用性的决策的标准分析方法[6-8],但它们受到了一些局限性[9]。其中的第一个涉及不同干预措施之间的系统相互依存关系。任何新干预措施的成本效益不仅取决于新干预本身的成本和有效性,还取决于预批次系统的配置,即现有干预措施的可用性,成本和有效性[9,10]。例如,针对给定癌症类型的新测试的成本效益可能取决于针对诊断疾病的患者的适当建议的治疗选择,以及无症状患者筛查计划的可用性。这种类型的系统级相互依赖性在用于同一条件的干预措施之间,由于其有限的范围,很少会被分段模型充分限制。第二,分段模型通常采用每个质量调整的生命年(QALY)阈值规则的简单分段成本,该规则不明确考虑预算限制[11,12]。但是,已经有充分的文献证明,基于阈值的决策规则的重复应用可能导致医疗保健支出的不受控制[13-18]。第三,大多数模型都是为了在更广泛的护理途径中告知单个决策问题。这意味着在整个疾病领域,报销和覆盖范围决策基于许多倾向于采用不同模型结构,假设和证据的Asyn-Gronen-Grone-Gronaper of Spections Intronaper开发的经济模型。这可能导致这样一种情况,即两个解决同一决策问题的模型会产生不一致的结论,并有可能导致最佳采用决策[19-25]。系统级模型包括重要事件,整个疾病领域的健康成果和成本,代表了解决常规分段模型局限性的潜在手段。系统级模型的三个众所周知的例子包括美国档案糖尿病模型[26],美国冠心病(CHD)政策模型[27]和英国CHD模型[28]。尽管这种建模方法可以追溯到1977年[29],但直到2012年Tappenden等到2012年。为全疾病模型(WDM)设置了方法学框架[9]。由于这些模型的更广泛范围,该模型的重点是整个疾病和治疗途径简而言之,WDM是一种系统级通用疾病模型,可以对整个疾病和治疗途径的期权进行一致的经济分析,包括预防,检测,诊断和治疗[9]。
动机:这是讲座系列中的一个小删减。我们不再关注顺序决策问题,而是转向存在许多耦合变量的问题。问题是找到与这些变量的耦合一致的值(或稍后的概率分布)。这是一个非常通用的问题设置,它适用于许多问题,而不仅仅是地图着色和数独。事实上,许多计算问题可以归结为约束满足问题或它们的概率类似物,即概率图模型。这还包括顺序决策问题,正如我在一些额外的讲座中提到的那样。此外,用于解决 CSP 的方法与离散优化非常密切相关。从我的角度来看,引入 CSP 的主要动机是作为引入其概率版本图模型的先行者。这些是机器学习、机器人技术、人工智能等领域中制定概率模型的核心语言。马尔可夫决策过程、隐马尔可夫模型以及我们在本讲座中无法讨论的许多其他问题设置都是图形模型的特殊情况。在 CSP 和图形模型这两种设置中,核心是理解进行推理的含义。树搜索、约束传播和信念传播是此上下文中最重要的方法。在本讲座中,我们首先定义 CSP 问题,然后介绍基本方法:使用一些启发式方法的顺序分配、回溯和约束传播。