摘要 - 公共巴士运输系统为现代社区的大部分地区提供关键的转移服务。时间性能和维持可靠的服务质量非常重要。不幸的是,由人满为患,车辆故障和道路事故造成的破坏通常会导致服务性能退化。尽管过境机构将有限数量的车辆保留在预备役中,并派遣它们以缓解受影响的路线,但该程序通常是临时的,必须依靠人类的经验和直觉来分配资源(车辆)以在不确定性下影响受到影响的旅行。在本文中,我们描述了一种使用非近视顺序决策程序来解决问题的原则方法,并确定(a)是否有利于预测问题并积极地在具有高样的中断的区域附近的车站运输总线以及(b)确定哪种车辆是否以及要派遣到特定问题的车辆。我们的方法是与大都会运输局合作开发的,用于美国中型城市,并将该系统建模为半马尔可夫决策问题(解决为蒙特 - 卡洛树搜索程序),并表明可以以最大化整体奖励的方式获得对这两个确定的决策问题的答案。我们从生成模型中采样了许多可能的未来,每个期货都被分配给树并使用根并行化处理。我们使用合作伙伴机构的3年数据来验证我们的方法。我们的实验表明,该拟议的框架为乘客增加了2%的服务,同时将Deadhead Miles降低了40%。索引项 - 公共交通,蒙特卡洛,优化
1通常会考虑到普尔(Poole(1968))从单个银行的静态决策问题中衍生出来的人,该问题从一个单个银行的静态决策问题中衍生出来,该问题选择了多少最初的储备金贷款贷款(以赚取给定的市场利益(赚取了多少),以及要持有的范围(以外的速度比较高的企业均可降低,这会占据较高的储备,这会构成对储备的折扣,而又可以降低储备,而又能构成势力,而势力却越来越多,而不是竞争,而这会构成势力,而这将构成势力的范围,那么该储备会占据势力市场速度)。这个“ Poole模型”是政策圈子中的首选框架,例如,Keister等人,例如Ennis和Keister(2008)。(2008),Keister(2012),Afonso等。 (2020b)和Aberg等。 (2021)。 2在走廊系统中通常选择目标率和管理费率,以便目标率在于走廊的中间,并且中央银行不使用常驻设施作为管理美联储资金利率的工具(尽管它们可用于希望从中央银行借入或向中央银行借贷的美联储资金参与者)。(2008),Keister(2012),Afonso等。(2020b)和Aberg等。(2021)。2在走廊系统中通常选择目标率和管理费率,以便目标率在于走廊的中间,并且中央银行不使用常驻设施作为管理美联储资金利率的工具(尽管它们可用于希望从中央银行借入或向中央银行借贷的美联储资金参与者)。
在环理论中,构建一个包含另一个环的更大环非常有用,这被称为环扩展 [1-2, 11-15]。最近,人们研究使用 Turiyam 环 [16] 处理四向数据分析,并研究其广泛的性质 [17-19] 来解决各种决策问题。然而,需要对一些猜想和方程进行基本的证明,以理解数学代数的可用性 [20]。为了实现这一目标,本文重点研究了一些丢番图方程的可逆性条件及其对 Turiyam 环的扩展。
将序列建模技术应用于决策问题,例如连续控制和黑框优化。对于连续控制,我们确定了决策变压器和拟议法案(AAAI'24接受)的潜在故障模式,以利用优势条件来实现强大的控制。进行黑盒优化,我们提出了通过安装行为算法的遗憾的学习历史来提炼和加强现有的黑框优化算法,从而使序列模型能够充当通用优化器(当前是提交)。bytedance,北京,中国07/2021 - 11/2021研究实习生
克莱姆森大学的四名研究人员帮助开发了一种洪水疏散工具,该工具使用人工智能来帮助预测洪水、识别危险道路并验证安全疏散路线。该工具将人工智能 (AI) 与人类知识结合在一起。研究人员正在利用这种人机协作 (HAT) 伙伴关系来创建一个智能模型,以解决南卡罗来纳州偏远沿海农村社区的洪水疏散决策问题。当前的洪水疏散模型包括地理信息系统 (GIS) 和基础设施规划方法,这些方法不使用人工智能。
人们经常在医疗和健康环境中遇到数字信息。在本文中,我们研究了与健康和非健康环境中决策准确性相关的数学因素。这是一项重要的努力,因为数学认知研究人员与研究健康决策的人之间的跨话相对较少。90名成年人(M = 37岁; 86%白人;男性为51%)回答了假设的健康决策问题,93名成年人(M = 36岁; 75%的白人; 42%的男性)回答了一个非医疗决策问题。所有参与者都是从在线小组中招募的。每个参与者完成了一系列涉及客观数学技能的任务(例如,整数和分数估计,比较,算术流利度,客观算术等)和其数学态度,焦虑和主观算术的主观评分。在单独的回归模型中,我们确定了哪些客观和主观数学措施与健康和非健康决策准确性相关。大小比较精度,多步算术准确性和数学焦虑症是健康决策准确性的显着差异,而对数学的关注(如开放式策略报告中所示)是非医疗决策精度的唯一重要预测指标。重要的是,来自数学认知文献的可靠和有效的措施与健康决策准确性相比,比常用的主观和客观算法更加密切。这些结果具有实际的含义:了解与健康决策绩效相关的数学因素可以为将来的干预措施提供信息,以增强对数字健康信息的理解。
理想情况下,当多个观测员意识到新事件时,它们将遵循协调的观察策略。但是,根据每个新事件的时间表,观测值之间的通信可能太慢,无法有用。在这种情况下,观察者可以做的最好的方法是根据其本地信息诉诸最佳自主决策。我们代表了一组遥远的观察者作为团队游戏所面临的决策问题。然后,我们考虑一些样本场景,并确定可以通过经典观察策略获得的最佳性能。我们继续表明,在这些情况下,共享量子状态的可用性使观测值能够以严格改善其最佳不协调性能的方式协调其选择。
针对无人水下航行器(UUV)作业环境中决策的复杂性和不确定性,该研究提出一种基于动态影响图(DID)和期望效用理论的自主决策方法。首先,建立UUV态势感知威胁评估模型,据此提出UUV自主决策的DID模型。然后,基于UUV威胁评估结果,推断并预测决策节点中各决策方案的效用。随后,利用最大期望效用原则选取最优自主决策方案。最后,通过仿真验证了DID方法的有效性。与传统专家系统相比,DID系统表现出很强的适应性,能够更好地解决不确定条件下的动态决策问题。
可变可再生能源生产商和电力零售商在决策问题中会遇到许多不确定性,例如可再生能源的间歇性、消费的变化以及市场价格波动。为了应对这些不确定性,本文提出了一种新的基于合同的电力灵活性 (FlexCon) 交易机制,该机制由可变可再生能源生产商和电力零售商两方之间进行。拟议的机制由一个名为 FlexCon 运营商的新实体管理,通过合同监督能源和金融交易,并与系统运营商协调交易。通过 FlexCon,双方能够交换能源不平衡作为电力灵活性的来源,以减轻决策问题中不确定性的负面影响。为此,从各方的角度引入了两个两阶段随机线性问题。在第一阶段,可变可再生能源生产商和电力零售商分别在日前市场提交其销售和购买的出价。在日前市场清算之后,接近交货时间时,双方将他们对合同的决定提交给引入的 FlexCon 运营商。运营商根据各方的盈余或短缺情况分配可能的电力灵活性交易。假设不平衡不能通过 FlexCon 完全解决,则剩余的偏差将在平衡市场中解决。在随机问题的第二阶段,对与平衡市场和 FlexCon 相关的各方决策进行建模。通过场景考虑了与价格、可再生能源发电、电力消耗和通过 FlexCon 的最大可交换电力灵活性相关的不确定性。同时,利润风险由条件风险价值度量考虑。数值结果表明,FlexCon 有效地减少了不确定性对各方利润的影响。© 2023 作者。由 Elsevier Ltd. 出版。这是一篇根据 CC BY 许可开放获取的文章(http://creativecommons.org/licenses/by/4.0/)。
■ 人类和其他动物适应环境的一个标志是我们能够控制自己在不同环境下的思维和行为。研究已经描述了认知控制可以采取的各种形式——包括增强与目标相关的信息、抑制与目标无关的信息以及全面抑制潜在反应——并确定了支撑这些控制类型的计算和神经回路。研究还确定了引发控制分配调整的各种情况(例如,引发表明错误或处理冲突增加的信号的情况),但对于特定情况何时会引起特定控制调整的规则仍知之甚少。最近,通过将控制分配视为决策问题,在这方面取得了重大进展。这种方法已经开发出统一的规范模型,规定了何时以及如何改变激励机制