这篇论文(博士学位)是由达特茅斯数字共享的这些论文和论文免费带给您的。已被达特茅斯数字共享授权管理人纳入达特茅斯学院博士学位论文。有关更多信息,请联系dartmouthdigitalcommons@groups.dartmouth.edu。
少量学习 (FSL) 是从少量训练示例中学习识别以前未见过的图像类别的任务。这是一项具有挑战性的任务,因为可用的示例可能不足以明确确定哪些视觉特征最能体现所考虑类别的特征。为了缓解这个问题,我们提出了一种额外考虑图像类别名称的方法。虽然之前的工作已经探索过类名的使用,但我们的方法在两个关键方面有所不同。首先,虽然之前的工作旨在直接从词嵌入中预测视觉原型,但我们发现通过分别处理视觉和基于文本的原型可以获得更好的结果。其次,我们提出了一种使用 BERT 语言模型学习类名嵌入的简单策略,我们发现该策略大大优于之前工作中使用的 GloVe 向量。此外,我们提出了一种处理这些向量高维性的策略,该策略受到跨语言词嵌入对齐模型的启发。我们对 miniImageNet、CUB 和 tieredImageNet 进行了实验,结果表明我们的方法能够持续提高基于度量的 FSL 的最新水平。
从人脑活动中解码的视觉表示已成为繁荣的研究领域,尤其是在大脑计算机界面的背景下。我们的研究提出了一种创新的方法,该方法采用知识蒸馏来培训EEG分类器并从ImageNet和Thicke-eeg 2数据集中重建图像,仅使用脑电图(EEG)数据集(EEG)数据,这些数据是来自参与者的数据,这些数据本身就查看了图像(即''大脑解码')。我们分析了来自6位参与者的eeg录音,用于Imagenet数据集,为Things-EEG 2数据集进行了10个录音,这些数据集暴露于跨越独特语义类别的图像。这些脑电图读数被转换为频谱图,然后将其用于训练卷积神经网络(CNN),该卷积神经网络(CNN)与知识蒸馏程序集成了基于预先训练的对比语言图像 - 训练前训练(CLIP)基于基于图像的图像分类教师网络。这种策略使我们的模型可以达到87%的前5个精度,显着优于标准CNN和各种基于RNN的基准测试。此外,我们根据预训练的潜扩散模型合并了图像重建机制,这使我们能够生成引起脑电图活性的图像的估计。因此,我们的体系结构不仅解码了神经活动中的图像,而且还提供了仅从脑电图中重建的可信图像重建,为例如迅速,个性化的反馈实验铺平了道路。
Twelve Labs 使用多模态视频语言基础模型来捕获视频的完整语义和上下文内容——这意味着捕获的语义和上下文内容存储在称为“嵌入”的矢量表示中,然后实现对视频的人类层面的理解。媒体服务平台 VidiNet 和 Twelve Labs 产品的集成提供了一种解决方案,使手动记录和元数据生成变得过时。将 Twelve Labs 的视频语言基础模型集成到直观的用户界面 MediaPortal 中,改变了用户搜索资料的方式,因为它无需在核心服务 Vidi-Core 中索引所有静态元数据字段。用户现在可以使用自然语言查询精确定位视频档案中的特定时刻,并与 VidiNet 索引的元数据无缝合并。但这到底意味着什么呢?用户现在可以使用自然语言查询在他们的视频中找到确切的时刻,并将它们与来自 Vidispine 应用程序的元数据相结合。
每天,这些摄像头都会产生大量宝贵的数据。这些信息可以改变城市规划者、运营经理和企业主的工作方式,以应对这个美好新世界的挑战。数据可以优化基础设施,让社区更安全,增强整体客户体验,并支持新商业模式的发展。人工智能是一种工具,可以帮助从摄像头中提取宝贵的数据和见解,使企业能够优化运营并应对不断的变化。
除了筛查屈光手术外,AI 还用于确保每种手术结果的准确性和可预测性。部署了严格的软件引擎来整合众多患者特定因素,例如年龄、处方、角膜和其他眼部特征以及环境因素,例如手术室的温度和湿度。通过这种整合,AI 可以生成指导治疗计划的公式。例如,对于 LASIK 和 PRK,AI 生成的公式可以指导每位患者每只眼睛的激光编程。对于晶状体植入手术,例如 EVO ICL 和 RLE,AI 可用于计算晶状体植入度数。将术后结果分析并输入 AI 软件,可以改进深度学习电路,优化未来的性能。
视频人工智能系统的成本和收益如何?视频人工智能:初始成本和长期收益 投资人工智能是许多公司经常谈论的事情。但您实际上投资的是什么?成本是多少?长期收益是什么?在本白皮书中,我们将解释如何以及为何投资视频人工智能。 为什么要投资视频人工智能?主要原因是视觉图像包含非常重要的数据。通过使用这些数据,您可以作为一家公司脱颖而出,目标是为您的客户提供更好的解决方案。 通过投资视频人工智能 (Video AI),您可以从视频数据中获得正确的智能信息。简而言之,人工智能 (AI) 以高度智能的方式识别、分类和索引镜头。在此基础上,可以搜索、编辑和量化收集和分类的数据。人工智能软件实时处理视频数据,以便您可以在发生检测警报时快速评估和响应。此外,可以轻松检索现有视频片段。因此,您可以快速搜索数千小时的镜头以查找所需的事件。当 AI 系统识别、分类和索引素材时,会产生额外的数据。从长远来看,这些收集到的元数据可以成为有价值的商业智能的额外来源。可以使用各种商业智能工具清晰地以图形方式显示这一点。当您考虑实施视频 AI 系统时,重要的是要正确评估总购置成本。换句话说,就是总拥有成本 (TCO)。当然,这些成本会根据每个组织的独特需求和情况而有所不同。本白皮书将概述系统要求、基础设施、网络和实施方面的各种实施因素和相关成本考虑因素。以及该产品可以提供的巨大长期节省。系统要求视频 AI 是一种智能软件技术,但为了使软件正常运行,外围设备必须到位。提前清楚了解所需的系统要求非常重要。IP 摄像机的数量、所需的 AI 功能以及安装类型(本地、远程或云)的组合决定了所需的系统要求。一些视频 AI 平台易于与已安装的 IP 摄像机结合使用。在销售过程中提出这一点很重要,因为它会影响初始投资。一个好的视频 AI 实施合作伙伴可以就所需的硬件为您提供建议。为了达到预期的效果,确定摄像机的类型和摄像机的位置非常重要。基础设施视频 AI 解决方案的基础设施因需求而异。有些人希望为多个位置提供集成解决方案,而其他人可能会考虑将视频 AI 用于单个位置。IP 摄像机、AI 服务器和 NVR/VMS 系统都可以位于一个物理位置本地,也可以位于多个物理位置。将物理位置上的摄像机与(公共)云中的软件相结合也是可能的。同样,正确的 AI 实施合作伙伴的作用非常重要。
视觉始于视网膜,该视网膜检测到环境中的光子,并传达有关大脑视觉场景的这些信号。视网膜神经节细胞中的视神经中继带有称为动作电位或尖峰的电信号到大脑的信息。视力中的一个关键挑战是,大脑必须解码约100万个视网膜神经节细胞的尖峰活动,以预测哪种视觉场景引起了视网膜尖峰。需要准确的解码才能正确地感知其视觉环境并采取适当的响应。在视觉中的另一个挑战是,在云彩的夜晚和阳光明媚的日子之间,环境中的平均光子数量变化了万亿倍。视网膜必须与这种广泛的光强度对抗,以成功地将视觉信息传输到大脑。有趣的是,视网膜神经节细胞峰值中信号和噪声的性质在这一光范围内发生了变化,从而使视觉信息如何由视网膜编码并由大脑读取,这给人带来了丰富的问题。我通过记录对视觉刺激的视网膜响应,从夜间到白天的光强度不等。i用大型多电极阵列进行了这些记录,它们具有500个电极,以同时记录数百个视网膜神经节细胞的尖峰活性。i接下来使用统计建模来描述视网膜反应并解码视觉刺激,询问光线条件中的变化(如夜间到夜间的变化)如何影响解码性能。我的结果阐明了视网膜神经节细胞尖峰的哪些方面对于大脑至关重要,即从星光到阳光读取视觉信息。这项工作也对建造脑机界面(例如假肢视网膜)具有影响,使大脑能够正确解释其从不同光条件上从假肢中获得的信号
来自成像方式的误差以及由于与 IC 样品的物理相互作用而直接导致的误差。由于设计实践和制造 IC 所用材料而在 RE 工作流程中引入的噪声被列为“ 代工厂/节点技术特定 ” 误差源。最后,由于人为相互作用而发生的误差列在“ 人为因素 ” 下。讨论这些噪声源的来源文献还介绍了抑制它的方法。例如,可以通过在 IC 芯片表面沉积薄层导电材料(如碳或铂)来防止与成像相关的误差源中的传导 [18, 11]。为避免冗余,这里不再详细讨论除版图特定误差源之外的各个噪声源。版图特定误差源(例如特征尺寸和接近度)是版图综合和所谓设计规则的直接结果。复杂的几何结构只有在成像方式的分辨率能力范围内才能成像。类似地,彼此靠近放置的结构也可能无法有效解析。简而言之,除非使用较小的视野或高放大倍数,否则这些特征可能会被 SEM 截断。表 1 显示了讨论每个错误源及其解决方法的著作。引用的著作中还提供了全面的模型验证。无法抑制或预防的错误源作为合成图像生成工作流程的一部分,以填充数据集。另一个值得关注的是,用于生成数据集的设计布局选择有限。任何数字设计的基本构建块都是标准单元。它们代表基本逻辑门、更复杂的门(例如全加器)和寄存器,并在整个设计中重复出现。流行的商业 IC 设计工具和开源标准单元库(均由 Synopsys 授权用于生成数据集)用于合成和布局布线高级加密标准 (AES) 设计。这些工具分别遵循 90nm 和 32/28nm 工艺设计套件 (PDK) 中指定的设计规则。
摘要:产品化和产品结构对公司在各种与产品相关的考虑方面都有好处。然而,对软件业务和软件产品的关注不足。本研究采用特定的软件视角,为产品化讨论提供软件业务视角。通过对软件产品的不同视角来考虑软件的产品化。在研究案例公司的产品化和软件产品结构时采用建设性的定性方法。实证研究揭示了与软件相关的挑战,并展示了产品化和产品结构如何也有利于软件业务,包括软件即服务 (SaaS) 业务模式。结果表明,软件业务还需要进一步关注产品结构和一致的产品化逻辑。实体产品或服务产品化的基本原则可能保持不变,但必须解决一些软件业务细节问题。因此,软件环境可能会影响产品化和产品结构逻辑。从事软件业务的公司可以从更好地了解其软件产品管理中受益。良好的产品化软件产品能够维持正在开发的软件的范围以及正在销售、交付和开具发票的软件的操作。这项研究是首批考虑产品化概念的研究之一,包括软件业务环境中的产品结构以表明环境细节。