随着AI系统解决越来越具有挑战性的问题,人类将其答案验证为安全,有用和准确的问题将变得更加困难。例如,确认对研究生级物理问题的解决方案需要领域的专业知识,评估文献需要大量时间,并且在代码中确定种族条件需要仔细的推理,所有人类在实际的时间和资源约束下都可能与之斗争。由于现有的AI一致性和监督方法取决于可靠的人类监督,因此我们将需要新的互动机制和培训协议来进行可扩展的监督(Amodei等人,2016年;鲍曼等。,2022),即随着最先进的AI模型执行的任务的复杂性的增加而扩展。
哈罗德·罗杰斯(Harold Rogers),肯塔基州院长凯恩·格兰杰(Kay Granger),德克萨斯州主席罗伯特·阿德霍尔特(Robert B. Aderholt),阿拉巴马州迈克尔·辛普森(Michael K.'Chuck''Fleischmann,田纳西州David P. Joyce,俄亥俄州安迪·哈里斯,马里兰州Mark E. Amodei,内华达州内华达州David G. Valadao,加利福尼亚州丹·纽豪斯,华盛顿John R. Moolenaar,密歇根州John H. Rutherford冈萨雷斯,德克萨斯州朱莉娅·莱特洛,路易斯安那州迈克尔·克劳,德克萨斯州迈克尔·弗莱斯,密西西比Ryan K.北卡罗来纳州
Harold Rogers,肯塔基州董事会名誉Kay Granger,德克萨斯州3主席Robert B. Aderholt,阿拉巴马州迈克尔·辛普森(Alabama Michael K.'Chuck''Fleischmann,田纳西州David P. Joyce,俄亥俄州Andy Harris,马里兰州Mark E. Amodei,内华达州克里斯·斯图尔特(Nevada Chris Stewart),犹他州1戴维·G·瓦拉达(David G. Valadao)欣森,爱荷华州托尼·冈萨雷斯,德克萨斯州朱莉娅·莱特洛,路易斯安那州迈克尔·克劳德,德克萨斯州迈克尔·格林,密西西比州瑞安·辛克,蒙大拿州安德鲁·S·克莱德,乔治亚北卡罗来纳州的亚利桑那州查克·爱德华兹(Arizona Chuck Edwards)2
主席 Stauber、排名成员 Ocasio-Cortez 和小组委员会成员,感谢你们邀请我代表巴里克黄金公司出席你们的听证会,并就 HR 2925(2023 年采矿监管清晰度法案)和 HR 6862(修订 FAST 法案)作证。我们很高兴支持这两项法案,它们以不同的方式解决了持续且棘手的许可延迟问题,这些问题阻碍了国内采矿业的发展以满足国家矿产需求。HR 2925 由内华达州众议员 Mark Amodei 提出,并由众议员 Mary Peltola 共同发起,将解决由 2019 年异常法院裁决(称为“Rosemont”裁决)造成的严重许可不确定性和诉讼延迟。国会议员道格·兰伯恩(Doug Lamborn)提出的 HR 6862 号法案将阻止联邦许可改进指导委员会提出的一项考虑不周的提案,该提案旨在阻止采矿作业使用 Fast 41 的快速许可工具。
哈罗德·罗杰斯 (肯塔基州) 罗伯特·B·阿德霍尔特 (阿拉巴马州) 迈克尔·K·辛普森 (爱达荷州) 约翰·R·卡特 (德克萨斯州) 肯·卡尔弗特 (加利福尼亚州) 汤姆·科尔 (俄克拉荷马州) 马里奥·迪亚兹-巴尔特 (佛罗里达州) 史蒂夫·沃马克 (阿肯色州) 查尔斯·J·“查克”·弗莱施曼 (田纳西州) 大卫·P·乔伊斯 (俄亥俄州) 安迪·哈里斯 (马里兰州) 马克·E·阿莫迪 (内华达州) 大卫·G·瓦拉道 (加利福尼亚州) 丹·纽豪斯 (华盛顿州) 约翰·R·莫伦纳尔 (密歇根州) 约翰·H·卢瑟福 (佛罗里达州) 本·克莱恩 (弗吉尼亚州) 盖伊·雷申特哈勒 (宾夕法尼亚州) 迈克·加西亚 (加利福尼亚州) 阿什利·辛森 (爱荷华州) 托尼·冈萨雷斯 (德克萨斯州) 朱莉娅·莱特洛 (路易斯安那州) 迈克尔·克劳德 (德克萨斯州)迈克尔·盖斯特,密西西比州 瑞安·K·津克,蒙大拿州 安德鲁·S·克莱德,乔治亚州 杰克·拉·特纳,堪萨斯州 杰瑞·L·卡尔,阿拉巴马州 斯蒂芬妮·I·比斯,俄克拉荷马州 斯科特·富兰克林,佛罗里达州 杰克·埃尔泽,德克萨斯州 胡安·西斯科马尼,亚利桑那州 查克·爱德华兹,北卡罗来纳州
强化学习(RL)(Sutton和Barto 2018)是一种基于抽样的学习控制器的方法。受动物行为模型的启发,RL代理与环境相互作用,并在数值奖励方面收到其性能的反馈,这些奖励会加强或惩罚某些行为。近年来,这种学习方法取得了令人印象深刻的结果(Mnih等人2015; Silver等。2016)。但是,无法精确捕获设计师在奖励信号中的意图可能会导致代理学习意外行为(Amodei等人。2016)。作为一种响应,正式语言(尤其是线性时间逻辑(LTL)和ω-规范语言)已被提出明确捕获学习目标。尽管这些语言取得了实际的成功(Hahn等人2019; Bozkurt等。2020),它们的理论复杂性是相互疏忽的。在本文中,我们提出并研究了一种基于模型的LTL和ω-型语言的近似RL算法。大概是正确的(PAC)学习(Valiant 1984)是一种正式化学习算法保证的框架:用户选择两个参数,ε> 0和δ> 0。学习算法是(有效的)PAC如果将其转换为ε接近最佳的溶液,使用多项式样本数量至少为1-δ。在RL中,已经提出了许多PAC学习算法的折扣和平均奖励(Kakade 2003; Brafman和
1。汤姆·科尔(Tom Cole),好的,头发2。哈罗德·罗杰斯(Harold Rogers),肯塔基州3。Robert B. Aderholt,Al 4。 Michael K. Sympson,ID 5。 约翰·R·卡特(John R. Carter),德克萨斯州6。 Ken Calvert,CA 7。 Diaz-Balart Mario,FL 8。 Steve Womack,AR9。 Charles J. “ Chuck” Fleischmann,TN10。 大卫·乔伊斯(David P. Joyce),俄亥俄州11。 Andy Harris,MD 12。 Mark E. Amody,NV 13。 大卫·瓦拉迪奥(David G. Valadeo),加利福尼亚州14。 Dan Newhouse,WA 15。 约翰·R·穆勒(John R. Moulear),我的16岁 约翰·H·卢瑟福(John H. Rutherford),佛罗里达州17。 本·克莱恩(Ben Cline),弗吉尼亚州18。 Guy Reschemist,PA19。 Ashley Hinson,AI20。 Tony Gonzales,TX 21。 朱莉娅·洛斯(Julia Letllow),洛杉矶22。 Michael Cloud,TX 23。 Michael Guest,MS 24。 Ryan K. Zinke,MT 25。 Andrew St. Clyde,GA 26。 Stephanie I. Bice,OK 27。 Scott Franklin,FL 28。 Jake Elzey,TX 29。 Juan Ciscomani,AZ 30。 查克·爱德华兹(Chuck Edwards),北卡罗来纳州31。 Mark Alford,Mo 32。 W. Strong,Al34。 Celeste Maloy,UT35。 M. Moore,WVRobert B. Aderholt,Al 4。Michael K. Sympson,ID 5。约翰·R·卡特(John R. Carter),德克萨斯州6。Ken Calvert,CA 7。 Diaz-Balart Mario,FL 8。 Steve Womack,AR9。 Charles J. “ Chuck” Fleischmann,TN10。 大卫·乔伊斯(David P. Joyce),俄亥俄州11。 Andy Harris,MD 12。 Mark E. Amody,NV 13。 大卫·瓦拉迪奥(David G. Valadeo),加利福尼亚州14。 Dan Newhouse,WA 15。 约翰·R·穆勒(John R. Moulear),我的16岁 约翰·H·卢瑟福(John H. Rutherford),佛罗里达州17。 本·克莱恩(Ben Cline),弗吉尼亚州18。 Guy Reschemist,PA19。 Ashley Hinson,AI20。 Tony Gonzales,TX 21。 朱莉娅·洛斯(Julia Letllow),洛杉矶22。 Michael Cloud,TX 23。 Michael Guest,MS 24。 Ryan K. Zinke,MT 25。 Andrew St. Clyde,GA 26。 Stephanie I. Bice,OK 27。 Scott Franklin,FL 28。 Jake Elzey,TX 29。 Juan Ciscomani,AZ 30。 查克·爱德华兹(Chuck Edwards),北卡罗来纳州31。 Mark Alford,Mo 32。 W. Strong,Al34。 Celeste Maloy,UT35。 M. Moore,WVKen Calvert,CA 7。Diaz-Balart Mario,FL 8。 Steve Womack,AR9。 Charles J. “ Chuck” Fleischmann,TN10。 大卫·乔伊斯(David P. Joyce),俄亥俄州11。 Andy Harris,MD 12。 Mark E. Amody,NV 13。 大卫·瓦拉迪奥(David G. Valadeo),加利福尼亚州14。 Dan Newhouse,WA 15。 约翰·R·穆勒(John R. Moulear),我的16岁 约翰·H·卢瑟福(John H. Rutherford),佛罗里达州17。 本·克莱恩(Ben Cline),弗吉尼亚州18。 Guy Reschemist,PA19。 Ashley Hinson,AI20。 Tony Gonzales,TX 21。 朱莉娅·洛斯(Julia Letllow),洛杉矶22。 Michael Cloud,TX 23。 Michael Guest,MS 24。 Ryan K. Zinke,MT 25。 Andrew St. Clyde,GA 26。 Stephanie I. Bice,OK 27。 Scott Franklin,FL 28。 Jake Elzey,TX 29。 Juan Ciscomani,AZ 30。 查克·爱德华兹(Chuck Edwards),北卡罗来纳州31。 Mark Alford,Mo 32。 W. Strong,Al34。 Celeste Maloy,UT35。 M. Moore,WVDiaz-Balart Mario,FL 8。Steve Womack,AR9。Charles J. “ Chuck” Fleischmann,TN10。 大卫·乔伊斯(David P. Joyce),俄亥俄州11。 Andy Harris,MD 12。 Mark E. Amody,NV 13。 大卫·瓦拉迪奥(David G. Valadeo),加利福尼亚州14。 Dan Newhouse,WA 15。 约翰·R·穆勒(John R. Moulear),我的16岁 约翰·H·卢瑟福(John H. Rutherford),佛罗里达州17。 本·克莱恩(Ben Cline),弗吉尼亚州18。 Guy Reschemist,PA19。 Ashley Hinson,AI20。 Tony Gonzales,TX 21。 朱莉娅·洛斯(Julia Letllow),洛杉矶22。 Michael Cloud,TX 23。 Michael Guest,MS 24。 Ryan K. Zinke,MT 25。 Andrew St. Clyde,GA 26。 Stephanie I. Bice,OK 27。 Scott Franklin,FL 28。 Jake Elzey,TX 29。 Juan Ciscomani,AZ 30。 查克·爱德华兹(Chuck Edwards),北卡罗来纳州31。 Mark Alford,Mo 32。 W. Strong,Al34。 Celeste Maloy,UT35。 M. Moore,WVCharles J.“ Chuck” Fleischmann,TN10。大卫·乔伊斯(David P. Joyce),俄亥俄州11。Andy Harris,MD 12。 Mark E. Amody,NV 13。 大卫·瓦拉迪奥(David G. Valadeo),加利福尼亚州14。 Dan Newhouse,WA 15。 约翰·R·穆勒(John R. Moulear),我的16岁 约翰·H·卢瑟福(John H. Rutherford),佛罗里达州17。 本·克莱恩(Ben Cline),弗吉尼亚州18。 Guy Reschemist,PA19。 Ashley Hinson,AI20。 Tony Gonzales,TX 21。 朱莉娅·洛斯(Julia Letllow),洛杉矶22。 Michael Cloud,TX 23。 Michael Guest,MS 24。 Ryan K. Zinke,MT 25。 Andrew St. Clyde,GA 26。 Stephanie I. Bice,OK 27。 Scott Franklin,FL 28。 Jake Elzey,TX 29。 Juan Ciscomani,AZ 30。 查克·爱德华兹(Chuck Edwards),北卡罗来纳州31。 Mark Alford,Mo 32。 W. Strong,Al34。 Celeste Maloy,UT35。 M. Moore,WVAndy Harris,MD 12。Mark E. Amody,NV 13。大卫·瓦拉迪奥(David G. Valadeo),加利福尼亚州14。Dan Newhouse,WA 15。约翰·R·穆勒(John R. Moulear),我的16岁约翰·H·卢瑟福(John H. Rutherford),佛罗里达州17。本·克莱恩(Ben Cline),弗吉尼亚州18。Guy Reschemist,PA19。Ashley Hinson,AI20。Tony Gonzales,TX 21。朱莉娅·洛斯(Julia Letllow),洛杉矶22。Michael Cloud,TX 23。Michael Guest,MS 24。 Ryan K. Zinke,MT 25。 Andrew St. Clyde,GA 26。 Stephanie I. Bice,OK 27。 Scott Franklin,FL 28。 Jake Elzey,TX 29。 Juan Ciscomani,AZ 30。 查克·爱德华兹(Chuck Edwards),北卡罗来纳州31。 Mark Alford,Mo 32。 W. Strong,Al34。 Celeste Maloy,UT35。 M. Moore,WVMichael Guest,MS 24。Ryan K. Zinke,MT 25。Andrew St. Clyde,GA 26。 Stephanie I. Bice,OK 27。 Scott Franklin,FL 28。 Jake Elzey,TX 29。 Juan Ciscomani,AZ 30。 查克·爱德华兹(Chuck Edwards),北卡罗来纳州31。 Mark Alford,Mo 32。 W. Strong,Al34。 Celeste Maloy,UT35。 M. Moore,WVAndrew St. Clyde,GA 26。Stephanie I. Bice,OK 27。Scott Franklin,FL 28。Jake Elzey,TX 29。Juan Ciscomani,AZ 30。查克·爱德华兹(Chuck Edwards),北卡罗来纳州31。Mark Alford,Mo 32。 W. Strong,Al34。 Celeste Maloy,UT35。 M. Moore,WVMark Alford,Mo 32。W. Strong,Al34。Celeste Maloy,UT35。M. Moore,WVM. Moore,WV
1。See generally Alec Radford, Jeff Wu, Rewon Child, D. Luan, Dario Amodei & I. Sutskever, Language Models Are Unsupervised Multitask Learners (2019) (unpublished manuscript), https://d4mucfpksywv.cloudfront.net/better-language-models/language-model s.pdf [https://perma.cc/7tud-38j5]; Long Ouyang, Jeff Wu, Xu Jiang, Diogo Almeida, Carroll L. Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, John Schulman, Jacob Hilton, Fraser Kelton, Luke Miller, Maddie Simens, Amanda Askell, Peter Welinder, Paul Christiano, Jan Leike &瑞安·洛(Ryan Lowe),培训语言模型遵循人类反馈的指示4,2022)(未出版的手稿),https://arxiv.org/pdf/2203.02155.pdf [https://perma.cc/myf8-28l9]。2。See Muhammad Usman Hadi , Qasem Al Tashi, Rizwan Qureshi, Abbas Shah, Amgad Muneer, Muhammad Irfan, Anas Zafar, Muhammad Bilal Shaikh, Naveed Akhtar, Jia Wu & Seyedali Mirjalili, Large Language Models: A Comprehensive Survey of Its Applications, Challenges, Limitations, and Future前景(2023年12月7日)(未发表的手稿),https://www.semanticscholar.org/paper/large-language-models%3a-a-a-comprehensial--comphermiss--compherive--susporment-of-hadi-tashi/24de-tashi [https://perma.cc/fl y8-zd2p]。3。请参阅OpenAI,GPT-4技术报告(3月1,2024)(未发表的手稿),https://arxiv.org/abs/2303.08774 [https://perma.cc/m5vx-tjlt]。4。“理解”一词在引用中,因为不给这些AI系统化拟人化并不意义地暗示它们具有类似于人类的认知能力。5。6。L. R EV。L. R EV。相反,正如本文强调的那样,LLM AI系统通过统计近似来获得其智能观察结果。确实,他们通常能够产生非常准确和类似人类的反应,但目前,他们很可能不会以与人类认知理解相当或类似的方式“理解”人类语言。因此,在这种情况下,“理解”可以被认为是说这些模型产生的统计输出在鉴于输入的响应范围内,并且经常近似于一个类似位置的人,他们确实理解了认知水平上的输入,会产生响应。即使这种产生响应迅速且显着的人类输出的能力是显着的,但考虑到当前AI模型的工作方式,人们必须注意不要暗示类似人类的认知。OpenAi,介绍ChatGpt:对话的优化语言模型,o Pen AI:B日志(2022年11月30日),https://openai.com/blog/chatgpt [https://perma.cc/8qwz-7nky]。Daniel Schwarcz和Jonathan H. Choi,《律师的AI工具:实用指南》,108 M Inn。h eadnotes 1,1(2023);乔纳森·H·乔(Jonathan H.
[1] Takahiro Arima、Tomoko Okuma 和 Tatsuya Dewa。从技术文档中提取材料信息以探索新应用。自然语言处理协会第 29 届年会论文集,第 512-515 页,2023 年。[2] Annemarie Friedrich、Heike Adel、Federico Tomazic、Johannes Hingerl、Renou Benteau、Anika Marusczyk 和 Lukas Lange。SOFC-exp 语料库和神经方法在材料科学领域的信息提取。在计算语言学协会第 58 届年会论文集,第 1255-1268 页。ACL,2020 年。[3] Shu Huang 和 Jacqueline M. Cole。使用飞行数据提取器自动生成的电池材料数据库。科学数据,第 5 卷7,第1号,第2052-4463页,2020年。[4] Fabrizio Gilardi、Meysam Alizadeh和Maël Kubli。Chatgpt在文本注释任务中的表现优于众包工作者。美国国家科学院院刊,第120卷,第30期,第e2305016120页,2023年。[5] Tom Brown、Benjamin Mann、Nick Ryder、Melanie Subbiah、Jared D Kaplan、Prafulla Dhariwal、Arvind Neelakantan、Pranav Shyam、Girish Sastry、Amanda Askell、Sandhini Agarwal、Ariel Herbert-Voss、Gretchen Krueger、Tom Henighan、Rewon Child、Aditya Ramesh、Daniel Ziegler、 Jeffrey Wu、Clemens Winter、Chris Hesse、Mark Chen、Eric Sigler、Mateusz Litwin、Scott Gray、Benjamin Chess、Jack Clark、Christopher Berner、Sam McCandlish、Alec Radford、Ilya Sutskevser 和 Dario Amodei。语言模型是少样本学习器。载于《神经信息处理系统进展》,第 33 卷,第 1877-1901 页。Curran Associates, Inc.,2020 年。[6] Md Tahmid Rahman Laskar、M Saiful Bari、Mizanur Rahman、Md Amran Hossen Bhuiyan、Shafiq Joty 和 Jimmy Huang。在基准数据集上对 ChatGPT 进行系统研究和全面评估。载于《计算语言学协会研究结果:ACL 2023》,第 1877-1901 页。 431–469。ACL,2023 年 7 月。[7] Bart lomiej Koptyra、Anh Ngo、Lukasz Radli´nski 和 Jan Koco´n。Clarin-emo:使用人类注释和 chatgpt 训练情绪识别模型。在国际计算科学会议上,第 365–379 页。Springer,2023 年。[8] Taiki Watanabe、Akihiro Tamura、Takashi Ninomiya、Takuya Makino 和 Tomoya Iwakura。使用化合物释义进行化学命名实体识别的多任务学习。在 2019 年自然语言处理经验方法会议和第 9 届国际自然语言处理联合会议 (EMNLP-IJCNLP) 的论文集上,第 6244–6249 页。ACL,2019 年。[9] Amalie Trewartha、Nicholas Walker、Haoyan Huo、Sanghoon Lee、Kevin Cruse、John Dagdelen、Alexander Dunn、Kristin A. Persson、Gerbrand Ceder 和 Anubhav Jain。量化领域特定预训练在材料科学命名实体识别任务中的优势。Patterns,第 3 卷,第 4 期,第 100488 页,2022 年。[10] Gupta Tanishq、Zaki Mohd 和 NM Krishnan。Matscibert:用于文本挖掘的材料领域语言模型
[1] Dario Amodei、Chris Olah、Jacob Steinhardt、Paul Christiano、John Schulman 和 Dan Mané。2016 年。《人工智能安全中的具体问题》。CoRR abs/1606.06565 (2016)。[2] Berkeley J. Dietvorst、Joseph P. Simmons 和 Cade Massey。2015 年。《算法厌恶:人们在发现算法有错误后会错误地避开它们》。《实验心理学杂志:综合》144, 1 (2015),114。[3] Berkeley J. Dietvorst、Joseph P. Simmons 和 Cade Massey。2018 年。《克服算法厌恶:如果人们可以(即使稍微)修改算法,他们也会使用不完美的算法》。《管理科学》64, 3 (2018),1155–1170。 [4] Julie S. Downs、Mandy B. Holbrook、Steve Sheng 和 Lorrie Faith Cranor。2010 年。您的参与者是否在玩弄系统?筛查 Mechanical Turk 工人。在 SIGCHI 计算机系统人为因素会议论文集上。2399–2402。[5] Jodi Forlizzi 和 Carl DiSalvo。2006 年。家庭环境中的服务机器人:对家用 Roomba 吸尘器的研究。在第一届 ACM SIGCHI/SIGART 人机交互会议论文集上。[6] Dylan Hadfield-Menell、Smitha Milli、Pieter Abbeel、Stuart J. Russell 和 Anca Dragan。2017 年。逆向奖励设计。在神经信息处理系统的发展中。[7] Bill Hibbard。2012 年。避免意外的 AI 行为。在国际通用人工智能会议上。Springer,107–116。[8] Lynn M. Hulse、Hui Xie 和 Edwin R. Galea。2018 年。对自动驾驶汽车的看法:与道路使用者的关系、风险、性别和年龄。安全科学 102(2018 年),1–13。[9] Rafal Kocielnik、Saleema Amershi 和 Paul N. Bennett。2019 年。您会接受不完美的人工智能吗?探索调整人工智能系统最终用户期望的设计。在 CHI 计算系统人为因素会议论文集上。[10] Moritz Körber。2018 年。衡量对自动化信任的理论考虑和问卷的开发。在国际人体工程学协会大会上。Springer,13–30。 [11] Victoria Krakovna、Laurent Orseau、Miljan Martic 和 Shane Legg。2019 年。使用逐步相对可达性惩罚副作用。在 AI 安全研讨会 IJCAI 中。[12] Victoria Krakovna、Laurent Orseau、Richard Ngo、Miljan Martic 和 Shane Legg。2020 年。通过考虑未来任务来避免副作用。在第 20 届神经信息处理系统会议论文集上。[13] Miltos Kyriakidis、Riender Happee 和 Joost CF de Winter。2015 年。公众对自动驾驶的看法:对 5000 名受访者的国际问卷调查结果。交通研究 F 部分:交通心理学和行为 32(2015 年),127–140。 [14] Ramya Ramakrishnan、Ece Kamar、Debadeepta Dey、Julie Shah 和 Eric Horvitz。2018 年。《发现强化学习中的盲点》。《第 17 届自主代理和多代理系统国际会议论文集》。[15] Stuart Russell。2017 年。《可证明有益的人工智能》。《指数生命,下一步》(2017 年)。[16] Sandhya Saisubramanian、Ece Kamar 和 Shlomo Zilberstein。2020 年。一种减轻负面影响的多目标方法。在第 29 届国际人工智能联合会议论文集上。[17] Sandhya Saisubramanian 和 Shlomo Zilberstein。2021 年。通过环境塑造减轻负面影响。在第 20 届自主代理和多智能体系统国际会议论文集上。[18] Sandhya Saisubramanian、Shlomo Zilberstein 和 Ece Kamar。2020 年。避免因对人工智能系统知识不完整而产生的负面影响。CoRR abs/2008.12146 (2020)。[19] Rohin Shah、Dmitrii Krasheninnikov、Jordan Alexander、Pieter Abbeel 和 Anca Dragan。 2019. 世界状态中的隐含偏好。第七届国际学习表征会议论文集。[20] Alexander Matt Turner、Dylan Hadfield-Menell 和 Prasad Tadepalli。2020. 通过可实现效用保存实现保守代理。AAAI/ACM 人工智能、伦理与社会会议论文集。[21] Ming Yin、Jennifer Wortman Vaughan 和 Hanna Wallach。2019. 理解准确度对机器学习模型信任的影响。CHI 计算系统人为因素会议论文集。[22] Shun Zhang、Edmund H. Durfee 和 Satinder P. Singh。2018. 分解马尔可夫决策过程中对副作用的 Minimax-Regret 查询以实现安全最优。在第 27 届国际人工智能联合会议论文集上。