目的:本政策旨在树立在学院内适当使用人工智能 (AI) 系统的概念;并解决人工智能对学院及其利益相关者的安全、隐私、信任、法律和监管、道德和社会影响。人工智能治理政策的纯文本目标:以下目标是人工智能治理政策中列出的目标的纯文本定义。这包括用于访问学院信息技术资源 (ITR) 上的人工智能系统的当前和未来技术。大型语言模型 (LLM) 一种计算模型,以其实现通用语言生成和其他自然语言处理任务的能力而著称。LLM 通过在计算密集型的自监督和半监督训练过程中从大量文本数据中学习统计关系来获得其能力。
LLM 代表了最先进的技术,在性能和语言质量方面超越了其他当前的 T2T 模型。因此,它们被认为是 T2T 模型考察的代表。LLM 是强大的神经网络,最多可拥有一万亿个参数。它们在大量文本语料库上进行训练,专门用于处理和生成文本。LLM 的训练通常可分为两个阶段:首先,进行无监督训练,使 LLM 对文本有大致的了解。接下来是微调,使 LLM 专门用于特定任务(NIST,2024)。文本是基于随机相关性生成的;概率分布用于预测在给定上下文中接下来可能出现哪个字符、单词或单词序列。LLM 的输出通常表现出很高的语言质量,因此通常与人类书写的文本难以区分。
神经算法推理旨在通过学习模型模仿经典算法的执行来捕获神经网络的计算。虽然共同体系结构具有足够的表现力,可以在权重空间中包含正确的模型,但当前的神经推理者正在努力概括分布数据。另一方面,经典计算不受分布变化的影响,因为它们可以描述为离散计算状态之间的过渡。在这项工作中,我们建议迫使神经推理者将执行轨迹保持为有限的预定状态的组合。为了实现这一目标,我们将离散和连续数据流分开,并描述它们之间的相互作用。在算法的状态转换上接受了监督训练,此类模型能够与原始算法完全保持一致。为了证明这一点,我们在多种算法问题上评估了我们的方法,并在单件任务和多任务设置中获得完美的考试成绩。此外,提出的架构选择使我们能够证明任何测试数据的学习算法的正确性。
摘要 — 掩模优化是先进技术节点 VLSI 制造过程中的重要步骤。作为最具代表性的技术之一,光学邻近校正 (OPC) 被广泛应用于提高可印刷性。由于传统 OPC 方法消耗的计算开销过大,近期研究已将机器学习技术应用于高效的掩模优化。然而,现有的判别学习模型依赖给定的数据集进行监督训练,而生成学习模型通常利用代理优化目标进行端到端学习,这可能会限制可行性。在本文中,我们率先引入了用于掩模优化的强化学习 (RL) 模型,该模型无需利用可微代理即可直接优化首选目标。大量实验表明,我们的方法优于最先进的解决方案,包括学术方法和商业工具包。
摘要 — 掩模优化是先进技术节点 VLSI 制造过程中的重要步骤。作为最具代表性的技术之一,光学邻近校正 (OPC) 被广泛应用于提高可印刷性。由于传统 OPC 方法消耗的计算开销过大,近期研究已将机器学习技术应用于高效的掩模优化。然而,现有的判别学习模型依赖给定的数据集进行监督训练,而生成学习模型通常利用代理优化目标进行端到端学习,这可能会限制可行性。在本文中,我们率先引入了用于掩模优化的强化学习 (RL) 模型,该模型无需利用可微代理即可直接优化首选目标。大量实验表明,我们的方法优于最先进的解决方案,包括学术方法和商业工具包。
摘要。现有的用于脑图像分析的机器学习方法大多基于监督训练。它们需要大量的标记数据集,而这些数据集可能成本高昂甚至无法获得。此外,训练后的模型仅适用于标签定义的狭窄任务。在这项工作中,我们开发了一种基于基础模型概念的新方法来克服这些限制。我们的模型是一个基于注意力的神经网络,使用一种新颖的自监督方法进行训练。具体而言,该模型被训练以逐块方式生成脑图像,从而学习脑结构。为了便于学习图像细节,我们提出了一种新方法,该方法使用具有随机权重的卷积核对高频信息进行编码。我们在 10 个公共数据集上训练了我们的模型。然后,我们将该模型应用于五个独立的数据集,以执行分割、病变检测、去噪和脑年龄估计。结果表明,基础模型在所有任务上都取得了有竞争力或更好的结果,同时显著减少了所需的标记训练数据量。我们的方法能够利用大量未标记的神经影像数据集来有效地解决各种大脑图像分析任务,并减少获取标签的时间和成本要求。
摘要 — 脉冲神经网络 (SNN) 是一种生物学上合理的模型,具有高计算能力和低功耗的优点。而深度 SNN 的训练仍然是一个悬而未决的问题,这限制了深度 SNN 的实际应用。在这里,我们提出了一种名为 Spiking SiamFC++ 的深度 SNN 架构,用于通过端到端直接训练进行对象跟踪。具体而言,在时间域上扩展 AlexNet 网络以提取特征,并采用代理梯度函数实现深度 SNN 的直接监督训练。为了检查 Spiking SiamFC++ 的性能,考虑了几个跟踪基准,包括 OTB2013、OTB2015、VOT2015、VOT2016 和 UAV123。发现与原始 SiamFC++ 相比,精度损失很小。与现有的基于 SNN 的目标跟踪器(例如 SiamSNN)相比,所提出的 Spiking SiamFC++ 的精度(连续性)达到 85.24%(64.37%),远高于 SiamSNN 实现的 52.78%(44.32%)。据我们所知,Spiking SiamFC++ 的性能优于现有的基于 SNN 的对象跟踪的先进方法,这为 SNN 在目标跟踪领域的应用提供了一条新途径。这项工作可能会进一步促进 SNN 算法和神经形态芯片的发展。
深度神经网络是生物医学图像分割的有力工具。这些模型通常经过严格监督训练,依赖于图像对和相应的体素级标签。然而,在大量情况下获得解剖区域的分割成本可能非常高。因此,迫切需要基于深度学习的分割工具,这些工具不需要严格监督并且可以不断适应。在本文中,我们提出了一种将分割视为离散表示学习问题的新视角,并提出了一种灵活且自适应的变分自动编码器分割策略。我们的方法称为分割自动编码器 (SAE),它利用所有可用的未标记扫描,并且仅需要分割先验,它可以是单个未配对的分割图像。在实验中,我们将 SAE 应用于脑部 MRI 扫描。我们的结果表明,SAE 可以产生高质量的分割,尤其是当先验良好时。我们证明马尔可夫随机场先验可以产生比空间独立先验更好的结果。我们的代码可在 https://github.com/evanmy/sae 免费获取。关键词:图像分割、变分自动编码器
非盲反卷积的目的是从鉴定获得的内核中恢复其模糊的图像。iS iSTING TEEP神经体系结构通常是基于大型地面真相图像的大型数据集建立的,并接受了监督训练。并不总是可用的,尤其是针对生物化应用,敏锐的高质量地面真相图像并不总是可用的。这严重阻碍了当前方法在实践中的适用性。在本文中,我们提出了一种新型的非盲卷曲方法,该方法利用了深度学习和经典迭代反卷积算法的力量。我们的方法结合了一个预先训练的网络,从输入图像中提取深度特征以及Itera的Richardson-Lucy反卷积步骤。随后,采用零射击优化过程来集成反浏览特征,从而产生高质量的重建图像。通过使用经典的迭代反卷积方法进行初步重构,我们可以有效地利用较小的网络来产生最终图像,从而加速重建,同时减少需求量,以减少有价值的计算资源。我们的方法证明了各种现实世界应用程序中的显着改进。
从记录的神经活动中解码刺激或行为是研究中研究大脑功能的常用方法,也是脑机接口和脑机接口的重要组成部分。即使是从小的神经群体中也能进行可靠的解码,因为高维神经群体活动通常占据低维流形,而这些流形可以用合适的潜在变量模型发现。然而,随着时间的推移,单个神经元活动的漂移和神经记录设备的不稳定性可能会很大,使得几天和几周的稳定解码变得不切实际。虽然这种漂移无法在单个神经元层面上预测,但当底层流形随时间稳定时,连续记录会话中的群体水平变化(例如不同的神经元组和记录数据中一致神经元的不同排列)可能是可以学习的。在会话中对一致和不熟悉的神经元进行分类,并考虑在记录会话中记录数据集中一致记录神经元顺序的偏差,可以保持解码性能。在这项工作中,我们表明深度神经网络的自监督训练可用于补偿这种会话间变异性。因此,连续自动编码模型可以在未来几天内为完全未见过的记录会话保持最先进的行为解码性能。我们的方法只需要一个记录会话来训练模型,这是朝着可靠、无需重新校准的脑机接口迈出的一步。