Char, D. S., M. D. Abr amoff 和 C. Feudtner。2020.确定机器学习医疗保健应用的伦理考虑因素。美国生物伦理学杂志 20 (11):7 – 17。doi: 10.1080/15265161.2020.1819469。Fawcett, T. 2006。ROC 分析简介。模式识别快报 27 (8):861 – 874。Hardt, M.、E. Price 和 N. Srebro。2016.监督学习中的机会平等。神经信息处理系统进展 29:3315 – 3323。Kleinberg,J.,和 S. Mullainathan。2019.简单造成不公平:对公平、刻板印象和可解释性的影响。2019 年 ACM 经济与计算会议论文集,807 – 808。Platt,J. C. 1999。支持向量机的概率输出以及与正则化似然方法的比较。在《大边距分类器的发展》中,编辑。A. J. Smola、Peter Bartlett、B. Schölkopf 和 D. Schuurmans,61 – 74。马萨诸塞州剑桥:麻省理工学院出版社。Rajkomar,A.、M. Hardt、M. D. Howell、G. Corrado 和 M. H. Chin。2018 年。确保机器学习的公平性以促进健康公平。内科年鉴 169 (12):866 – 872。Woodworth,B.、S. Gunasekar、M. I. Ohannessian 和 N. Srebro。2017.学习非歧视性预测因子。机器学习研究论文集 65:1920 – 1953。Zhang, B. H., B. Lemoine, 和 M. Mitchell。2018.通过对抗性学习减轻不必要的偏见。2018 年 AAAI/ACM 人工智能、伦理和社会会议论文集,335 – 340。美国路易斯安那州新奥尔良。
深度学习的成功揭示了许多现象似乎与统计和优化领域中发展的经典直觉相抵触。在这次演讲中,我们介绍了我们最近的工作,旨在理解一种这种现象:“良性”过度拟合的可能性。我们考虑一个分类问题,其中标签的恒定分数是均匀随机的。我们表明,通过梯度下降训练的过度参数化神经网络,没有(明确)正则化实现零训练误差,完美拟合了嘈杂的标签,并同时达到了最小值 - 最佳的测试误差。特别是,过度适合嘈杂的培训数据可能是最佳学习规则,而在非凸目标函数上的梯度下降有效地产生了此类解决方案。我们讨论了有关了解梯度下降的隐性偏见及其对深度学习的影响的最新工作。基于与Peter Bartlett,Niladri Chatterji,Wei Hu,Nati Srebro和Gal Vardi的联合工作。
[J5] Lijia Zhou⋆,Frederic Koehler⋆,Danica J. Sutherland和Nathan Srebro。“乐观速度:线性回归中插值学习和正则化的统一理论。” ACM/IMS数据科学杂志(2023)。≥10个引用[J4] Frederik Harder,Milad Jalali Asadabadi,Danica J. Sutherland和Mijung Park。“预先训练的受欢迎的特征可改善私人图像的产生。”机器学习研究的交易(2023)。≥10个引用[J3] R´emi Flamary等。“锅:Python最佳运输。”机器学习研究杂志(2021)。机器学习开源软件纸。≥500个引用[J2] Michelle Ntampaka,Hy Trac,Danica J. Sutherland,Sebastian Fromenteau,Barnab´as p´oczos和Jeff Schneider。“使用机器学习对受污染的星系簇的动态质量测量。”天体物理学杂志831.2(2016),第1页。 135。≥50个引用[J1] Michelle Ntampaka,Hy Trac,Danica J. Sutherland,Nicholas Battaglia,Barnab´as p´oczos和Jeff Schneider。“用于银河系群的动态质量测量的机器学习方法。”天体物理学杂志803.2(2015),第1页。 50。≥100Cites