在Google上用于生产准备模型的汽车平台的研究和应用工程工作。设计了我们的团队使用的一种方法来选择参数,以降低10×的计算,以进行生产性能。引用了该方法的论文。此外,还指导高级工程师,以最佳的高参数优化方法和促进尖端方法。
鉴于互联网的开放环境,防止青少年接触不适当的网络内容是一项挑战。我们进行了研究,选择人工智能界面来训练和选择特定图像是否代表露骨内容。我们审查了十家潜在供应商,并选择了 Google Automl Cloud ® 进行训练和验证测试。不幸的是,很难获得足够大的已批准图像档案来完成最初设想的训练和测试程序。我们最终获得了一个中等大小的图像数据库,并使用一个小数据集成功测试了代码,尽管结果没有包含足够的样本来建立进一步测试所需的商业级可靠性。关键词
技术规格 Dell VxRail 超融合基础架构和带有 PowerSwitch 网络的 PowerScale 存储为该解决方案提供了硬件基础。VxRail 是经过 NVIDIA 认证的系统,可通过 NVIDIA GPU 加速。带有 VMware Tanzu 的 VMware vSphere 虚拟化可提供容器的可预测性和安全性。NVIDIA AI Enterprise Suite 提供了一套云原生数据科学工具和框架。英特尔的 cnvrg.io 软件简化了 MLOps。H2O.ai AutoML 可自动进行算法选择、特征生成、超参数调整、迭代建模和模型评估。所有工程验证、测试和调整都经过协同工作,这种经过验证的 AI 设计简化了 AI,通过经过验证的 AI 专业知识更快地提供洞察。
机器学习 (ML) 模型本质上很脆弱,部署后它们都会以不同的速度和不同的原因衰减。因此,所有 ML 模型都需要运营和维护 (O&M),这需要基础设施、人员和工具来确保生产级 ML 模型在运营环境中尽可能地发挥最佳性能。机器学习运营 (MLOps) 是成功实现 AI 的基础。目前大多数 MLOps 平台都专注于 AutoML,非常适合模型开发和训练、打包、测试/验证和部署。然而,很少有 MLOps 平台设计用于处理动态 DOD 和 IC 传感器数据,这还需要能够在严酷的环境中监控模型性能,并在检测到模型衰减时触发半自动或自动再训练。
这篇全面的探索文章考察了生成式人工智能时代人工智能产品管理的演变格局,重点关注了传统产品管理角色通过技术进步的转变。本文探讨了成功的人工智能产品管理所需的技术专业知识和商业敏锐度的关键交集,分析了从工程和数据科学背景的转变路径。它深入探讨了现代人工智能产品经理采用的基本技术基础、工具和框架,同时还研究了边缘人工智能、AutoML 和联邦学习等新兴趋势。本文强调了平衡技能组合的重要性,将深厚的技术理解与战略业务洞察力相结合,并展示了这种混合专业知识如何推动人工智能产品开发的创新和成功。
在本文中,我们介绍了自动因果发现(AUTOCD)的概念(不要与自动因果推理相混淆[14,26];请参见第3节),定义为完全自动化因果发现和因果关系的努力。AutoCD的目标不仅是提供适合数据的最佳因果模型,而且还提供了所有信息,对查询的答案,可视化,解释和解释以及人类专家分析师都可以的解释。AutOCD旨在使非专家可访问一个深奥的字段及其方法。这些容易出现错误,并产生结果,其解释需要对因果建模理论有深入的了解。就像在预测建模的术语中(自动化机器学习)一样,“自动”一词的使用意味着,除其他外,还在进行了(因果关系)机器学习管道的优化。
- Introduction: applications, computational models for vision, perception and prior knowledge, levels of vision, how humans see - Pixels and filters: digital cameras, image representations, noise, filters, edge detection - Regions of images and segmentation: segmentation, perceptual grouping, Gestalt theory, segmentation approaches, image compression - Feature detection: RANSAC, Hough transform, Harris corner detector - Object recognition: challenges, template matching, histograms, machine learning - Convolutional neural networks: neural networks, loss functions and optimization, backpropagation, convolutions and pooling, hyperparameters, AutoML, efficient training, selected architectures - Image sequence processing: motion, tracking image sequences, Kalman filter, correspondence problem, optical flow
除了大型科技公司外,其他公司都缺少数据科学家。借助 H2O Driverless AI,专家和新手数据科学家都可以快速自动构建高度透明的精确模型。H2O Driverless AI 是一款屡获殊荣的 AutoML 产品,它嵌入了来自世界顶尖工程和数据科学专家(包括世界顶级 Kaggle 大师)的数据科学最佳实践。它使用独特的遗传算法来确定每个用例的特征、模型和调整参数的最佳组合。集成的最佳实践和护栏可确保模型不会过度拟合数据,并帮助解决新手数据科学家可能需要帮助的其他常见问题。H2O Driverless AI 使公司能够利用他们已有或可以轻松找到的人才开展更多用例。
深度研究深度人工神经网络(DANN)的体系结构以提高其预测性能。但是,探索了丹恩的架构与噪声和对抗性攻击之间的稳健性之间的关系。我们调查了丹尼斯的鲁棒性与它们的基础图架构或结构之间的关系。这项研究:(1)首先使用图理论鲁棒性测量探索Danns架构的设计空间; (2)将图形转换为DANN体系结构,以训练/验证/测试各种图像分类任务; (3)探讨了训练有素的丹尼斯针对噪声和对抗性攻击的鲁棒性与通过图理论测量估计的基础体系结构的鲁棒性之间的鲁棒性之间的关系。我们表明,底层图的拓扑熵和olivier-Ricci曲率可以量化DANN的稳健性性能。上述关系对于复杂的任务和大型丹恩来说更牢固。我们的工作将使汽车和神经架构搜索社区能够探索强大而准确的Danns的设计空间。
开源代码贡献: Github 统计:17 个公共存储库,拥有超过 1400 个“star”和超过 250 个“fork”(不包括对学生开发的存储库提供建议) 一些代码已移植到 autoML 系统中,网址为 http://datadrivendiscovery.org 具有非牛顿动量的汉密尔顿动力学用于快速采样 2021 https://github.com/gregversteeg/esh_dynamics 使用线性 CorEx 进行线性因子模型和协方差估计 2017 https://github.com/gregversteeg/linearcorex 针对欠采样、高维生物医学数据优化的非线性 CorEx 模型。 2017 https://github.com/gregversteeg/bio_corex 使用 CorEx 构建主题模型 2016 https://github.com/gregversteeg/corex_topic 离散信息筛选 2016 https://github.com/gregversteeg/discrete_sieve 高斯化数据 2015 https://github.com/gregversteeg/gaussianize 信息论深度学习: 2014 https://github.com/gregversteeg/CorEx 非参数信息论估计代码: 2013 https://github.com/gregversteeg/NPEET