详细内容或原文请订阅后点击阅览
不要在 AI 中以数据为导向
数据驱动通常被理解为积极的内涵,但当我听到这个词时,我对即将发生的“数据驱动”决策感到有些焦虑。让我来解释一下原因。根据维基百科,数据驱动的意思是“形容词数据驱动意味着活动的进展是由数据推动的,而不是由直觉或个人经验推动的。”换句话说 - 将数据视为采取行动的主要信息来源。当数据给你一个行动的理由时,你就采取行动。乍一看,这似乎是一种非常合理的工作方式,尤其是在人工智能领域,因为人工智能在很多方面都依赖于数据。但事实上,在使用人工智能时,数据驱动可能会非常成问题。我认为那些说自己是数据驱动的人走错了路。这并不意味着我反对花很多精力去理解你的数据。我实际上坚信,为人工智能项目收集、理解和准备数据应该是分配最多资源的活动。所以我支持好的数据科学,但反对由数据驱动,我认为这是两件非常不同的事情。但为什么数据驱动会如此成问题呢?我的主要论点是,决策和活动背后的驱动力不应该是你拥有的数据,而是对问题和周围世界的好奇心。从某种意义上说,这意味着由你没有的数据驱动。人工智能项目的最终目标往往是解决一个问题
来源:Dan Rose AI | 应用人工智能博客数据驱动通常被理解为积极的内涵,但当我听到这个词时,我对即将发生的“数据驱动”决策感到有些焦虑。让我来解释一下原因。
根据维基百科,数据驱动的意思是“形容词数据驱动意味着活动的进展是由数据推动的,而不是由直觉或个人经验推动的。”换句话说 - 将数据视为采取行动的主要信息来源。当数据给你一个行动的理由时,你就采取行动。乍一看,这似乎是一种非常合理的工作方式,尤其是在人工智能领域,因为人工智能领域在很多方面都依赖于数据。但事实上,在使用人工智能时,数据驱动可能会非常成问题。我认为那些说自己是数据驱动的人走错了路。这并不意味着我反对花很多精力去理解你的数据。我实际上坚信,为人工智能项目收集、理解和准备数据应该是分配最多资源的活动。所以我支持好的数据科学,但反对由数据驱动,我认为这是两件非常不同的事情。
但为什么数据驱动会如此成问题?
即使在用尽所有潜在数据源之后,您也极少会拥有与问题相关的所有数据。因此,当您根据现有数据得出结论时,结论至少总会有点偏差。这并不意味着数据没有用,结论也没有用,但您总是会至少有点错误。正如统计学家所说:“所有模型都是错误的,但有些是有用的”。
数据驱动的另一个问题是,有一种说法认为基于数据的决策比基于直觉的决策更好。虽然有时可能确实如此,但数据并不是一成不变的,有时非常有用,有时却非常具有误导性。