摘要 — 数据整理任务(例如从各种来源获取和链接数据、转换数据格式和更正错误记录)可占典型数据工程工作的 80%。尽管机器学习和人工智能兴起,但数据整理仍然是一项繁琐且手动的任务。我们引入了 AI 助手,这是一类半自动交互式工具,用于简化数据整理。AI 助手通过推荐合适的数据转换来指导分析师完成特定的数据整理任务,该转换尊重通过与分析师交互获得的约束。我们正式定义了 AI 助手的结构,并描述了将数据清理视为优化问题的现有工具如何符合定义。我们为四种常见的数据整理任务实现了 AI 助手,并通过利用它们遵循的通用结构,使数据分析师可以在数据科学的开源笔记本环境中轻松访问 AI 助手。我们通过三个示例场景对我们的 AI 助手进行了定量和定性评估。我们表明,统一的交互式设计可以轻松执行手动或使用全自动工具难以完成的任务。
摘要 — 数据整理任务(例如从各种来源获取和链接数据、转换数据格式以及更正错误记录)可占典型数据工程工作的 80%。尽管机器学习和人工智能兴起,但数据整理仍然是一项繁琐且手动的任务。我们引入了 AI 助手,这是一类半自动交互式工具,旨在简化数据整理。AI 助手通过推荐合适的数据转换来指导分析师完成特定的数据整理任务,该转换尊重通过与分析师交互获得的约束。我们正式定义了 AI 助手的结构,并描述了将数据清理视为优化问题的现有工具如何符合该定义。我们为四种常见的数据整理任务实现了 AI 助手,并利用它们遵循的通用结构,使数据分析师可以在数据科学的开源笔记本环境中轻松访问 AI 助手。我们通过三个示例场景对我们的 AI 助手进行了定量和定性评估。我们表明,统一和交互式的设计使得执行手动或全自动工具难以完成的任务变得容易。
本文件已提交给联邦公报局 (OFR) 进行发布,目前正在等待 OFR 公开展示和在联邦公报上发布。如果 OFR 审查过程中进行了微小的编辑更改,则该文件可能与已发布的文件略有不同。在联邦公报上发布后,可以在 www.federalregister.gov 、 www.regulations.gov 和 www.treasury.gov 上找到拟议法规。在联邦公报上发布的文件是官方文件。
本文件已提交给联邦公报办公室 (OFR) 进行发布,目前正在等待在 OFR 公开展示并在联邦公报上发布。如果在 OFR 审查过程中进行了微小的编辑更改,则该文件可能与已发布的文件略有不同。在联邦公报上发布后,可以在 www.federalregister.gov 、 www.regulations.gov 和 www.treasury.gov 上找到该文件。在联邦公报上发布的文件是官方文件。在联邦公报上发布后 45 天内,欢迎公众发表评论。
bis已提交此临时最终规则(IFR),以在联邦公报上发布。这是IFR的出版前互联网版本,就《联邦法规守则》的目的,也不是该规则的官方版本,也不是计算评论期或有效日期的目的。尽管我们采取了步骤确保IFR的互联网版本的准确性,但官方版本可能包括以下未反映的技术或其他修订。请参阅即将发布的官方版本,该版本将出现在联邦注册簿网站(www.federalregister.gov)的办公室中;它也将出现在法规中。一旦该文档的官方版本发布在联邦注册簿中,此版本将被从互联网中删除,并替换为指向官方版本的链接。在任何差异的情况下,联邦登记册中的版本都将控制。
和法定委员会根据《1973 年统计法》在宪报上公布,收集其管辖范围内的数据用于统计目的。其他部委和法定委员会中未在宪报上公布的 RSU 可根据其上级组织的行政法规或立法收集数据。
该文档计划于20121年6月7日在联邦公报上发布,并在Funel.gov/d/2021-12019和govinfo.gov
该文档计划于2010年1月17日在联邦公报上发布,并在https://federalregister.gov/d/2024-00749上在线提供,以及https://govinfo.gov