I would like to thank all the past and present members of the PSI lab and the Machine Learning group at U of T, especially Babak Alipanahi, Andrew Delong, Christopher Srinivasa, Jimmy Ba, Hannes Bretschneider, Alice Gao, Hui Xiong, Leo Lee, Michael Leung, and Oren Kraus for sharing ideas and collaborating with me.在我的博士学位期间,我在Google上做了两次Intenrship,这对我来说都是一次很棒的学习经历。我要感谢Google Brain Team和Google DeepMind团队的所有成员,尤其是Oriol Vinyals,Jon Shlens,Navdeep Jaitly,Ian Goodfellow,Ilya Sutskever,Timothy Lillicrap,Ali Eslicrap,Ali Eslami,Sam Bowman,Sam Sam Bowman和Jon Gauthier。我特别要感谢Alireza Moghaddamjoo和Hamid Sheikhzadeh Nadjar启发我在伊朗阿米尔卡比尔技术大学的本科生期间从事学术研究并与我合作。我很高兴与许多好朋友一起度过博士学位。尤其要感谢Sadegh Jalali,Aynaz Vatankhah,Masoud Barekatain,Amin Heidari,Weria Havary-Nassab,David Jorjani,Parisa Zareapour,Ehsan Shojaei,Siavash Fazeli和Mohammad norououzi。我借此机会特别感谢Nasrin Tehrani和Hamid Emami。,由于过去几年的持续支持,我在加拿大感到家。当然,我最深切的感激和爱属于我的父母,纳斯林和哈桑,
摘要背景我们开发了一种机器学习(ML)模型,以预测早期胃癌(EGC)患者淋巴结转移(LNM)的风险,这些患者不符合现有的日本内窥镜可固定性标准,并将其性能与最常见的临床风险扫描系统(Ecura System)相比。方法,我们使用了来自21家经过内窥镜亚粘膜溶解(ESD)和/或在2010年至2021年之间的21家机构的EGC患者的数据。所有切除的EGC在组织学上均未满足当前的日本内窥镜可耐加固性标准。在所有患者中,有3,506名构成了开发基于神经网络的ML模型的训练队列,而536个构成了验证队列。由接收器操作特征曲线(AUC)下的面积测量的ML模型的性能与验证队列中的ECURA系统的性能进行了比较。结果LNM率分别为14%(503/3,506)和7%(39/536),分别为培训和验证队列。ML模型在验证队列中鉴定出患有AUC为0.83(95%置信区间,0.76–0.89)的LNM患者,而ECURA系统鉴定出具有0.77的LNM的患者,其AUC为0.77(95%置信区间,0.70-0.85)(0.70-0.85)(p = 0.006)(p = 0.006,DELONG TEST)。结论我们的ML模型的性能优于ECURA系统,用于预测不符合日本内窥镜可固定性标准的EGC患者的LNM风险。迷你抽象,我们开发了一种基于神经网络的机器学习模型,该模型可预测早期胃癌患者淋巴结转移的风险,这些患者不符合内窥镜可缓解性标准。
摘要 目的比较基于机器学习理论的6种模型的预测效果,为预测2型糖尿病(T2DM)风险提供方法学参考。 研究地点与对象 本研究基于2016—2018年东莞市居民慢性病危险因素监测数据。各监测点采用多阶段整群随机抽样的方法,最终抽取4157人。在初始人群中剔除缺失数据超过20%的个体,最终纳入4106人。采用设计K最近邻算法和合成少数过抽样技术对数据进行处理。采用单因素分析对变量进行初步筛选。采用10倍交叉验证对部分模型参数进行优化。以准确度、精确度、召回率和受试者工作特征曲线下面积(AUC)评价模型的预测效果,采用Delong检验分析各模型AUC值的差异。结果平衡数据后样本量增加至8013例,其中2型糖尿病患者4023例,对照组3990例。六种模型的比较结果显示,反向传播神经网络模型的预测效果最好,准确率、准确度、召回率分别为93.7%、94.6%、92.8%,AUC值为0.977,其次是logistic模型、支持向量机模型、CART决策树模型和C4.5决策树模型。深度神经网络的预测性能最差,准确率、准确度、召回率分别为84.5%、86.1%、82.9%,AUC值为0.845。结论本研究构建了6类2型糖尿病风险预测模型,并基于各项指标比较了这6种模型的预测效果,结果显示,基于所选数据集的反向传播神经网络的预测效果最好。
糖尿病会影响全球4.25亿个人,预计在未来20年中,数字将增加到6亿人(1)。在1型糖尿病(T1D)中,患者经历胰岛素产生降低引起的胰岛素缺乏症,而在2型糖尿病(T2D)中,患者经历了胰岛素抵抗(IR),通常与肥胖有关(2)。导致IR发展的主要因素是增加氧化应激,高血糖和脂质水平升高(3)。尽管有助于控制血糖水平的疗法进步,但心血管并发症仍然是该人群发病率和死亡率的主要原因(2、4、5)。在心脏中,IR会导致钙处理,线粒体功能障碍和代谢不足的失调,导致一系列病理,其中包括心肌 - 心脏情感功能障碍,舒张性障碍功能障碍,心肌细胞死亡,心肌死亡和内膜骨化(6,7,7,7,7,7,7)。与IR相关的血管事件通常与高血压和增强的血栓形成环境有关(8、9)。虽然阻塞性血凝块可以导致心肌梗塞,脑血管事件或关键的肢体缺血,并且由于血小板与止血蛋白之间的复杂相互作用而发生(10)。在这种高度异质的人群中,发展此类并发症的风险是可变的,并取决于一系列因素,包括年龄,糖尿病持续时间,血糖控制和IR。在内分泌学领域的这一研究主题中,我们介绍了8篇文章,旨在探索IR与心血管健康之间的关系。他等人。动脉硬化是糖尿病的众所周知的并发症(11)。检查了放射线间脂肪组织(IMAT)分析是否可以用作指示T2D患者动脉硬化的诊断措施。总共包括549例新诊断的T2D患者,并使用颈动脉斑块负担来表明动脉粥样硬化。构建了三个模型以评估动脉粥样硬化的风险:临床模型,一个放射组学模型(基于胸部CT图像的IMAT分析)和临床放射线组合组合模型(一种整合临床放射学特征的模型)。使用曲线和DELONG测试下的区域比较了这三个模型的性能。临床 - 放射线组合模型和放射线学模型表明,在表明动脉粥样硬化方面的性能更好。作者
DeLong and Shleifer(1993)记录了统治精英的寻租行为可以阻碍经济发展并延迟工业化的证据。为了在此问题上提供成长理论分析,我们将寻租政府介绍给了Schumpeterian增长模型的最新变体,该模型具有内源性服用。我们发现,受到较弱的宪法限制的自私政府更多地参与寻租税收,这延迟了经济从工业前的停留国家到现代经济增长的过渡。定量,一个完全自私的政府将相对于慈善政府的工业化延迟了八十年。直觉上,政府征收的税收造成了一种扭曲,从而缩小了经济和市场规模的产出水平,这又减少了进军的激励措施。因此,寻租税收延迟了经济的内源性,并在短期内延迟了经济增长。然而,新公司的减少最终会增加现有公司的规模,从而对质量改善和经济增长产生了积极影响。从长远来看,正面和负面影响相互取消,从而使税率对稳态增长率产生中性效果。这些结果表明,即使经济对稳态增长的影响是中立的,寻求租金税也可能对经济的增长路径产生严重影响,这突出了考虑过渡性影响经济增长的重要性。本研究涉及有关经济增长和创新的文献。Romer(1990),Segerstrom等人的开创性研究。(1990),Grossman and Helpman(1991)以及Aghion和Howitt(1992)开发了基于第一代R&D的增长模型,在这种模型中,新产品的发明或现有产品的质量改善驱动经济中的创新。Peretto(1994)和Smulders和van de Klundert(1995)的随后研究结合了新产品的发明和产品的质量改进,以开发基于第二代R&D的增长模型,其含义1得到了经验证据的支持。2这项研究使用第二代基于研发的增长模型来探索寻求租金政府如何影响经济的内源性。
摘要 在巴西,种植者生产有益微生物专供自己使用是一种被称为“农场生产”的做法。至于农场生物杀虫剂,它们最初在 20 世纪 70 年代用于防治多年生和半多年生作物的害虫,但自 2013 年以来,其使用范围已扩大到玉米、棉花和大豆等一年生作物的害虫。目前,数百万公顷的土地正在使用这些农场制剂进行处理。本地生产可降低成本、满足当地需求并减少对环境有害的化学农药的投入,从而有助于建立更可持续的农业生态系统。批评人士认为,如果不实施严格的质量控制措施,农场制剂可能会:(1) 被可能包括人类病原体的微生物污染,或 (2) 含有极少的活性成分,影响田间药效。细菌杀虫剂的农场发酵占主导地位,尤其是针对鳞翅目害虫的苏云金芽孢杆菌。然而,在过去的 5 年中,昆虫病原真菌的生产迅速增长,主要用于控制吸食汁液的昆虫,例如粉虱(Bemisia tabaci (Gennadius))和玉米叶蝉(Dalbulus maidis (DeLong and Wolcott))。相比之下,昆虫病毒的农场生产增长有限。巴西约 500 万农村生产者中的大多数拥有中小型农场,虽然绝大多数人仍然没有在农场生产生物农药,但这个话题已经引起了他们的兴趣。许多采用这种做法的种植者通常使用非无菌容器作为发酵罐,导致制剂质量差,并且有失败的案例报道。另一方面,一些非正式报告表明,即使受到污染,农场制剂也可能有效,这至少可以部分解释为液体培养基中的微生物池分泌的杀虫次生代谢物。事实上,关于这些微生物生物农药的功效和作用方式的信息不足。通常是大型农场生产的生物农药污染程度较低,其中一些农场的连续耕地面积超过 20,000 公顷,因为其中许多农场拥有先进的生产设施,并拥有专业知识和训练有素的员工。农场生物农药的使用预计将持续下去,但采用率将取决于多种因素,例如选择安全、毒性强的微生物菌株和实施合理的质量控制措施(符合新兴的巴西法规和国际标准)。本文介绍并讨论了农场生物杀虫剂的挑战和机遇。
[1] Ryan S. Baker。2024。大数据和教育(第8版)。宾夕法尼亚州费城宾夕法尼亚大学。 [2] Ryan S. Baker和Aaron Hawn。2022。教育算法偏见。国际人工智能杂志教育杂志(2022),1-41。[3] Solon Barocas,Andrew D Selbst和Manish Raghavan。2020。反事实解释和主要原因背后的隐藏假设。在2020年公平,问责制和透明度会议的会议记录中。80–89。[4] Alex J Bowers和Xiaoliang Zhou。2019。曲线下的接收器操作特征(ROC)区域(AUC):一种评估教育结果预测指标准确性的诊断措施。受风险的学生教育杂志(JESPAR)24,1(2019),20-46。[5] Oscar Blessed Deho,Lin Liu,Jiuyong Li,Jixue Liu,Chen Zhan和Srecko Joksimovic。2024。过去!=未来:评估数据集漂移对学习分析模型的公平性的影响。IEEE学习技术交易(2024)。[6] Olga V Demler,Michael J Pencina和Ralph B D'Agostino Sr. 2012。滥用DELONG测试以比较嵌套模型的AUC。医学中的统计数据31,23(2012),2577–2587。[7] Batya Friedman和Helen Nissenbaum。1996。计算机系统中的偏差。信息系统(TOIS)的ACM交易14,3(1996),330–347。[8]乔什·加德纳,克里斯托弗·布鲁克斯和瑞安·贝克。2019。225–234。通过切片分析评估预测学生模型的公平性。在第9届学习分析与知识国际会议论文集。[9]LászlóA Jeni,Jeffrey F Cohn和Fernando de la Torre。2013。面对不平衡的数据:使用性能指标的建议。在2013年,俄亥俄州情感计算和智能互动会议上。IEEE,245–251。 [10] Weijie Jiang和Zachary a Pardos。 2021。 在学生等级预测中迈向公平和算法公平。 在2021年AAAI/ACM关于AI,伦理和社会的会议上。 608–617。 [11]RenéFKizilcec和Hansol Lee。 2022。 教育算法公平。 在教育中人工智能的伦理学中。 Routledge,174–202。 [12]JesúsFSalgado。 2018。 将正常曲线(AUC)下的面积转换为Cohen的D,Pearson的R PB,Ordds-Ratio和自然对数赔率比率:两个转换表。 欧洲心理学杂志适用于法律环境10,1(2018),35-47。 [13] Lele Sha,Mladen Rakovic,Alexander Whitelock-Wainwright,David Carroll,Victoria M Yew,Dragan Gasevic和Guanliang Chen。 2021。 在自动教育论坛帖子中评估算法公平性。 教育中的人工智能:第22届国际会议,AIED 2021,荷兰乌得勒支,6月14日至18日,2021年,第I部分。 Springer,381–394。 2024。 2023。 2018。IEEE,245–251。[10] Weijie Jiang和Zachary a Pardos。2021。在学生等级预测中迈向公平和算法公平。在2021年AAAI/ACM关于AI,伦理和社会的会议上。608–617。[11]RenéFKizilcec和Hansol Lee。2022。教育算法公平。在教育中人工智能的伦理学中。Routledge,174–202。[12]JesúsFSalgado。2018。将正常曲线(AUC)下的面积转换为Cohen的D,Pearson的R PB,Ordds-Ratio和自然对数赔率比率:两个转换表。欧洲心理学杂志适用于法律环境10,1(2018),35-47。[13] Lele Sha,Mladen Rakovic,Alexander Whitelock-Wainwright,David Carroll,Victoria M Yew,Dragan Gasevic和Guanliang Chen。2021。在自动教育论坛帖子中评估算法公平性。教育中的人工智能:第22届国际会议,AIED 2021,荷兰乌得勒支,6月14日至18日,2021年,第I部分。Springer,381–394。2024。2023。2018。[14]Valdemaršvábensk`Y,MélinaVerger,Maria Mercedes T Rodrigo,Clarence James G Monterozo,Ryan S Baker,Miguel Zenon Nicanor LeriasSaavedra,SébastienLallé和Atsushi Shimada。在预测菲律宾学生的学习成绩的模型中评估算法偏见。在第17届国际教育数据挖掘会议上(EDM 2024)。[15]MélinaVerger,SébastienLallé,FrançoisBouchet和Vanda Luengo。您的模型是“ MADD”吗?一种新型指标,用于评估预测学生模型的算法公平性。在第16届国际教育数据挖掘会议上(EDM 2023)。[16] Sahil Verma和Julia Rubin。公平定义解释了。在国际软件公平研讨会的会议记录中。1-7。[17] Zhen Xu,Joseph Olson,Nicole Pochinki,Zhijian Zheng和Renzhe Yu。2024。上下文很重要,但是如何?课程级别的性能和公平转移的相关性在预测模型转移中。在第14届学习分析和知识会议论文集。713–724。[18] Andres Felipe Zambrano,Jiayi Zhang和Ryan S Baker。2024。在贝叶斯知识追踪和粗心大意探测器上研究算法偏见。在第14届学习分析和知识会议论文集。349–359。