详细内容或原文请订阅后点击阅览
他们要求的。我建造了它。没有人用过它。
为什么好的数据工作在交付后会被忽略。他们要求的帖子。我建造了它。没有人用过它。首先出现在《走向数据科学》上。
来源:走向数据科学向我们索取模型。
我们构建了概念验证。拿到绿灯了。交付了模型。
几周的工作……却什么也没听到。
这是一个古老的故事,困扰着从分析师到机器学习工程师等各地数据专业人士。
那么,发生了什么?
你的模型是个谜
我们的职业植根于现代计算机科学和技术进步。我们触手可及的许多最强大的解决方案在几十年前计算成本太高。随着对最新、最有能力的技术突破的依赖,怀疑也随之而来。
在数据科学中,我们有能力创建极其复杂的模型。仅我的团队就在我们的特征库中拥有数百个标准特征,我们为每个新模型构建提供这些特征。我们调整了数十个超参数,并使用强大的算法来迭代数百次运行,以最大限度地提高预测性能。这个过程可以创建具有令人难以置信的准确性的模型,但它是有代价的:可解释性。
强大的模型和黑匣子之间存在着微妙的界限,甚至无法由构建它的人来解释。
可解释性与准确性的权衡是我所在行业(尤其是医疗保健行业)的一个重要因素。客户和利益相关者通常是医生和临床医生。这些医生习惯于利用他们多年的专业知识和深入的医学知识做出临床判断。虽然预测模型可能擅长预测给定的结果,但如果不能很好地解释,临床医生就会质疑其可信度。如果医生必须在值得信赖且经过验证的临床流程与具有神秘特征和无法解释算法的黑匣子模型之间进行选择,他们很可能每次都会选择临床流程。
您的解决方案花费的时间太长
你的模型不容易使用
如果预测会带来摩擦,那么您就是在开辟一条放弃之路,而不是采用之路。
