你闻到了吗?人工智能开发中隐藏的技术债务

为什么没有标准的速度会创造出脆弱的人工智能产品你闻到了吗?人工智能开发中的隐藏技术债务首先出现在《走向数据科学》上。

来源:走向数据科学

首先“闻”它们。在实践中,代码异味是预示未来问题的警告信号。该代码今天可能可以工作,但其结构暗示它将变得难以维护、测试、扩展或安全。气味不一定是虫子;它们是设计债务和长期产品风险的指标。

这些异味通常表现为交付速度较慢、变更风险较高、回归和生产事件更加频繁、AI/ML 结果不太可靠,而这些结果通常是由破坏评估和泛化的泄漏、偏差或漂移造成的。

从原型到生产的路径

数据/人工智能产品开发的大多数阶段可能有所不同,但它们通常遵循相似的路径。通常,我们从原型开始:首先勾勒出一个想法,然后通过一个小型实现来展示价值。 Streamlit、Gradio 或 n8n 等工具可用于使用合成数据来呈现非常简单的概念。在这些情况下,您可以避免使用敏感的真实数据并减少隐私和安全问题,尤其是在大型、隐私敏感或受到严格监管的公司中。

随后,您将转向 PoC,在其中使用真实数据样本并深入了解功能,同时与业务部门密切合作。之后,您将转向产品化,构建一个随着您验证和捕获业务价值而不断发展的 MVP。

大多数时候,原型和概念验证都可以快速构建,而人工智能则可以更快地交付它们。问题是这段代码很少符合生产标准。在变得健壮、可扩展和安全之前,通常需要跨工程(结构、可读性、测试、可维护性)、安全性(访问控制、数据保护、合规性)和 ML/AI 质量(评估、漂移监控、再现性)进行重构。

您看到或未看到的典型气味 🫥

当团队追求快速胜利时,这种隐藏的技术债务(通常表现为代码异味)很容易被忽视,而“氛围编码”可以放大它。因此,您可能会遇到以下问题:

这有什么帮助