金融投资组合管理投资政策通过现代投资组合理论(如Markowitz模型)进行定量计算的投资政策依赖于一组假设,这些假设在高波动性市场(例如技术部门或加密货币)中不受数据支持。因此,定量研究人员正在寻找解决此问题的替代模型。具体而言,投资组合管理(PM)是一个问题,最近通过深度强化学习(DRL)方法完全解决了问题。在特定的DRL算法中,通过估计代理在模拟器中任何财务状态执行的每个动作的预期奖励的分布,也称为体育馆。然而,这些方法依靠深神经网络模型来表示这种分布,尽管它们是通用近似模型,能够随着时间的推移代表此分布,但它们无法解释其行为,但由一组不可解释的参数给出。至关重要的是,金融投资者的政策要求可以解释,以评估他们是否遵循合理的行为,因此DRL代理不适合遵守特定政策或解释其行为。在这项工作中,在使DRL可以解释的动机的驱动下,我们开发了一种可解释的DRL(XDRL)方法,用于PM,将近端政策优化(PPO)DRL算法整合到模型不可思议的可解释的机器学习技术中,以提高预测时间的透明度,以增强透明度的特征。我们提出了DRL代理商的第一个可解释的事后PM财务政策。通过执行我们的方法,我们可以在预测时间解释代理商评估他们是否遵循投资政策的必要条件或评估遵循代理商建议的风险。我们通过成功识别影响投资决策的关键特征来从经验上说明这一点,从而证明了在预测时间中解释代理行动的能力。
复杂性。提出了三种范式:(i)工程经济学;(ii)经济学与工程;(iii)作为工程的经济学。“工程经济学”范式有着悠久的传统,而 Mariotti 帮助我们理解这种范式背后的动机,并重建 19 世纪下半叶始于美国、随后在全球共享经验中传播开来的成功实验。后一种范式(即“作为工程的经济学”)强调了科学经济学方法的实证主义,这种方法基于一个(隐藏的)假设,即经济学是不同的,必须将其与社会科学区分开来。Mariotti 指出,这只是可以用来概括允许在经济学和(更常见的是)金融领域进行“工程”应用的解决方案需求的几个隐喻之一。几位诺贝尔奖获得者可以被描述为“经济工程师”:哈里·马科维茨、默顿·米勒和威廉·夏普于 1990 年因“金融经济学的开创性工作”而获奖,罗伯特·默顿和迈伦·斯科尔斯于 1997 年因“确定衍生品价值的新方法”而获奖,劳埃德·沙普利和阿尔文·罗斯于 2012 年因“稳定配置理论和市场设计实践”而获奖,保罗·米尔格罗姆和罗伯特·威尔逊于 2020 年因“改进拍卖理论和发明新的拍卖形式”而获奖。值得注意的是,除了这些作为经济工程达到持久共识的例子之外,人们还可以认识到经济学作为工程范式也需要旨在解决政策制定核心问题的理论模型,但事实上导致了对古典理论模型的过度信任。这引发了相关问题,将在以下章节中讨论。最后,马里奥蒂将“经济学与工程学”范式描述为“同行之间的会面,尊重学科独特性和不同文化,但在相互影响甚至跨学科的背景下”(马里奥蒂,2021 年,第 2 节)。一些正统经济学家可能会想,“你怎么敢这样做?”但事实上,相互影响和跨学科在科学中很常见。此外,在《建立经济学与工程学的新联盟》中,马里奥蒂指出,相互影响、跨学科和多学科性在经济学与工程学的关系中一直存在。此外,由于科学复杂性方法的发展,它们正在得到加强,这将在以下章节中讨论。
ECO2101:高级微观经济学-I 模块 1:需求理论需求概念、需求定律、需求函数决定因素、需求变化和需求量。市场需求函数供应 - 含义、供应定律、供应函数、供应决定因素。市场均衡、市场均衡变化、需求供应分析的应用。消费者行为 - 基数效用分析 - 边际效用递减规律、等价边际效用、消费者均衡无差异曲线分析:边际替代率、消费者均衡、需求无差异曲线分析:收入、替代和价格效应 - 希克斯-艾伦和斯拉茨基。从众效应和势利效应无差异曲线的应用和用途:对消费者的补贴:价格补贴与一次性收入补助。配给和无差异曲线分析。食品券计划。模块 2:消费者行为和需求弹性 显示偏好需求理论:偏好假设和排序逻辑。通过逻辑排序推导需求定律 不确定性下的个人行为:涉及风险的选择:圣彼得堡悖论和伯努利假设,风险情况下构建效用指数的诺伊曼-摩根斯坦方法。弗里德曼-萨维奇假设,马科维茨假设。 需求弹性:需求弹性的概念、弹性的类型和测量、决定因素和应用。 消费者剩余:马歇尔的消费者剩余衡量标准。消费者剩余和价格变动。希克斯消费者剩余的四个概念、水钻石悖论、消费者剩余在成本效益分析中的应用。模块 3:生产理论和成本生产理论:可变比例定律,生产函数:等产量线,边际技术替代率。两个可变因素的生产函数 - 规模收益,柯布-道格拉斯 - 生产函数最佳要素组合 - 等成本线,要素的最小成本组合,扩张路径。生产成本和成本曲线:成本概念,短期和长期成本理论,规模经济:内部和外部,现代成本理论 - 学习曲线 - L 形长期平均成本。模块 4:企业市场结构和收益曲线理论:市场结构的分类,平均收益和边际收益的概念。不同市场结构下的平均收益和边际收益,企业的均衡。竞争企业和行业的均衡:完全竞争的含义和条件,企业的短期和长期均衡
1 Marwala, T.,2022 年。缩小差距:非洲的第四次工业革命。Pan Macmillan 南非。2 Marwala, T.,2023 年。人工智能、博弈论和政治机制设计(第 41-58 页)。新加坡:Springer Nature 新加坡。3 Roberts, H.、Hine, E.、Taddeo, M. 和 Floridi, L.,2024 年。全球人工智能治理:障碍和前进的道路。国际事务,第 iiae073 页。4 Ali, AE、Venkatraj, KP、Morosoli, S.、Naudts, L.、Helberger, N. 和 Cesar, P.,2024 年。透明的人工智能披露义务:谁、什么、何时、何地、为什么、如何。arXiv preprint arXiv:2403.06823。 5 Hurwitz, E. 和 Marwala, T.,2007 年 10 月。学会虚张声势。2007 年 IEEE 系统、人与控制论国际会议(第 1188-1193 页)。 6 Markowitz, DM 和 Hancock, JT,2024 年。生成式人工智能比人类更偏向真相:核心真值默认理论原则的复制和扩展。语言与社会心理学杂志,43(2),第 261-267 页。 7 Falco, G.、Shneiderman, B.、Badger, J.、Carrier, R.、Dahbura, A.、Danks, D.、Eling, M.、Goodloe, A.、Gupta, J.、Hart, C. 和 Jirotka, M.,2021 年。通过独立审计管理人工智能安全。自然机器智能,3(7),第 566-571 页。 8 Coeckelbergh, M.,2020 年。人工智能伦理。麻省理工学院出版社。 9 Elliott, D. 和 Soifer, E.,2022 年。人工智能技术、隐私和安全。人工智能前沿,5,第 826737 页。 10 Marwala, T.,2024 年。机制设计、行为科学和人工智能在国际关系中的应用。摩根考夫曼。 11 Verbruggen, A. 和 Laes, E.,2015 年。核电可持续性评估:国际原子能机构和政府间气候变化专门委员会框架的话语分析。环境科学与政策,51,第 170-180 页。 12 Marwala, T. 和 Mpedi, LG,2024 年。人工智能与法律。 Palgrave Mcmillan。13 Marwala, T.、Fournier-Tombs, E. 和 Stinckwich, S.,2023 年。使用合成数据训练人工智能模型:可持续发展的机遇和风险。arXiv 预印本 arXiv:2309.00652。14 Sidogi, T.、Mongwe, WT、Mbuvha, R. 和 Marwala, T.,2022 年 12 月。使用具有静态套利损失条件的生成对抗网络创建合成波动率曲面。2022 年 IEEE 计算智能研讨会系列 (SSCI)(第 1423-1429 页)。 15 Tshilidzi Marwala、Eleonore Fournier-Tombs、Serge Stinckwich,“监管跨境数据流:利用安全数据共享实现全球包容性人工智能”,联合国大学技术简报 3(东京:联合国大学,2023 年)。 16 Ebers, M. 和 Gamito, MC,2021 年。算法治理和算法治理。Springer。 17 Marwala, T.,2014 年。用于理性决策的人工智能技术。Springer。 18 Marwala, T. 和 Hurwitz, E.,2017 年。人工智能与经济理论:市场中的天网(第 1 卷)。Cham:Springer International Publishing。 19 Sasikala, P.,2012 年。云计算与电子政务:进步、机遇和挑战。国际云计算应用与计算杂志 (IJCAC), 2 (4), 第 32-52 页。20 Marwala, T., 2023. 政治中的情报、博弈论与机制设计 (第 135-155 页)。新加坡:Springer Nature 新加坡。
