大多数应用程序都有理想的数据模型,应通过以下方式通过:通过关系,社交网络,通过图表进行社交网络,通过文档进行消息应用程序和向量的机器学习。不幸的是,需要针对“不那么理想的”(我们使用“强加”一词)的数据模型来实施许多应用程序:业务数据存储在文档中,学习的模型必须嵌入在向量中。该问题的教科书解决方案是物理集成:从施加的数据模型中提取,转换和加载数据。虽然有效,但此ETL过程却很昂贵,并导致稳定性。虚拟集成(通过查询重写)避免了这些问题,但会导致理想到型模型映射的组合爆炸。我们建议通过开发一个“桥式表示”来解决此问题,该“桥梁表示”可在可能的情况下通过查询翻译实现虚拟集成,并在必要时通过数据转换来实现虚拟集成。在本文中,我们概述了这个想法,研究了许多指导用例,并将研究议程制定针对这种桥梁表示和实现该方法的系统。我们还提供了一些初步结果,表明即使是非基础数据模型集成,也可以在物理整合成本的一小部分中支持矢量嵌入。
Jason Silbergleit 先生 IBM 研究业务开发副总裁 Jason 在 IBM 担任职务期间,领导着一个全球组织,负责利用 IBM 研究技术创建早期技术产品和构建业务交易。Jason 和他的团队管理着一个大型研究组合,包括:人工智能、混合云、量子计算、安全和影响科学。他们共同支持 IBM 全球实验室的 3000 多名研究人员,这些研究人员为 IBM 的创新和 28 年的美国专利领导地位做出了巨大贡献。Jason 于 1996 年加入 IBM 微电子部门,此前他获得了阿尔弗雷德大学陶瓷工程学士学位和佛蒙特大学工商管理硕士学位。