研究:我尝试过的最困难的事情

Max Rubin-Toles,COL ’25,亚利桑那州图森 去年秋天,我写了我的第一个证明。今年秋天,我申请了理论计算机科学博士课程,希望成为一名机器学习研究员。宾夕法尼亚大学就业服务中心的资助让我……

来源:宾夕法尼亚大学职业服务博客

Max Rubin-Toles,COL ’25,亚利桑那州图森

Max Rubin-Toles,COL ’25,亚利桑那州图森

去年秋天,我写了我的第一个证明。今年秋天,我申请了理论计算机科学博士课程,希望成为一名机器学习研究员。宾夕法尼亚大学就业服务中心的资助让我能够迅速转型:今年夏天,我在之前几乎没有任何领域经验的情况下开始了第一次实质性的学术研究经历。

我有幸与计算机和信息科学教授 Surbhi Goel 和同为本科生的 Maya Gambhir(人工智能,’26)一起工作。我们着手理解和缓解语言模型幻觉(ChatGPT 正是在这种幻觉中令人信服地、流畅地产生错误输出,甚至可能导致律师败诉),并确定了一种称为共形预测的统计技术,该技术允许用户将模型输出校准到所需的事实水平,为此牺牲一些特异性。这项技术最初是为了通过将单个输出转换为不确定性集(例如,如果模型不确定哪个是正确的,则为 {cat, dog})来提高线性预测器和图像分类器等模型的准确性而开发的,但我们试图扩展的斯坦福大学 Christopher Mohri 和 Tatsunori Hashimoto 最近的一项研究提出将这项技术应用于语言模型输出,而语言模型输出是出了名的错误百出。

案例

这个研究项目是我承担过的最艰难的挑战。因此,我为我们取得的进展感到自豪。我被迫面对失败、陌生和无知的不适:我迫不及待地想以此为职业。

这是 2024 年职业服务暑期资助金获得者发布的一系列帖子的一部分。我们要求资助获得者反思他们的暑期经历,并谈论他们度过暑期的行业。您可以在此处阅读整个系列

您可以在此处阅读整个系列