我的模型失败了。这就是我成为一名更好的数据科学家的方式。

数据泄露、真实世界模型以及医疗保健领域的 AI 生产之路我的模型失败了。这就是我成为一名更好的数据科学家的方式。首先出现在《走向数据科学》上。

来源:走向数据科学

医疗保健领域的第一个预测模型看起来像是一个本垒打。

它回答了业务问题。绩效指标非常强劲。逻辑很清晰。

它在生产中也会遭遇惨败。

那一课改变了我对数据科学的看法,以及如何在人工智能时代的医疗保健领域取得成功。

回想起来,这种失败在我的职业生涯中会重演,但它对我作为一名数据科学家的成长和成功至关重要:如果你不了解你的模型所适用的环境,那么笔记本中的复杂模型就毫无价值。

数据分析师

经过三个月艰苦的努力,在现实世界中寻找我的第一份工作,在一个对数据有着新的需求但也充满人才的市场中,我终于迎来了人生的第一个重大突破。我在一家大型医院系统的商业智能团队中获得了入门级数据分析师的职位。有很多东西需要学习。一个巨大的障碍,也是许多想要进入医疗保健数据领域的人也必须跨越的一个障碍,是熟悉 Epic 的来龙去脉,Epic 是市场份额最大的 EHR(电子健康记录)供应商。用 SQL 处理 EHR 中极其复杂的数据并不是一件容易的事。在最初的几个月里,我依靠我的高级同事来编写分析所需的 SQL。这让我很沮丧;我怎么可能刚刚完成统计学硕士学位,却仍在努力学习 SQL 思维方式呢?

嗯,通过实践(大量的实践)和我同事的耐心(大量的耐心),这一切最终开始在我的脑海中变得有意义。随着我的舒适感增强,我开始进入 Tableau 和仪表板的世界。我越来越着迷于制作美观的仪表板的过程,这些仪表板讲述了迫切需要讲述的数据故事。

数据科学家 I

数据科学家 II

总结

我的模型失败了。

这些失败塑造了我的职业生涯。