本文研究了如何使用大型语言模型 (LLM) 从全篇材料科学研究论文中提取聚合物纳米复合材料 (PNC) 的样本列表。挑战在于 PNC 样本的复杂性,它们在整个文本中散布着许多属性。注释 PNC 上的详细信息的复杂性限制了数据的可用性,由于创建全面的命名实体跨度注释的挑战,传统的文档级关系提取技术变得不切实际。为了解决这个问题,我们为这项任务引入了一个新的基准和评估技术,并以零样本方式探索了不同的提示策略。我们还结合了自一致性来提高性能。我们的研究结果表明,即使是先进的 LLM 也很难从一篇文章中提取所有样本。最后,我们分析了在这个过程中遇到的错误,将它们分为三个主要挑战,并讨论了未来研究中克服这些挑战的潜在策略。
通过观察、问卷调查和其他技术,心理学家已经能够引出个体操作员(通常是飞行员)的心理模型。然而,将设计与特定个体的心理模型进行比较只能提供非常具体的信息;我们感兴趣的是设计是否容易产生模式混淆,为此,将设计与通用心理模型进行比较比将设计与个体心理模型进行比较更有用。这种通用模型可以从培训材料中提取(培训手册的目的之一,通常是隐含的,就是诱导足够的心理模型),也可以指定为明确的要求(例如,“这个按钮应该像一个切换按钮一样运行”)。认知研究对这些模型的性质提供了两个重要见解:首先,它们可以用称为“状态机”的数学结构紧凑地表示;第二,它们往往相当简单(这可以通过应用两个规范的简化来解释[3])。
摘要 — 大脑中的神经元会产生电信号,这些电信号的集体发射会产生脑电波。这些脑电波信号是使用 EEG(脑电图)设备以微电压形式捕获的。EEG 传感器捕获的这些信号序列具有可用于分类的嵌入特征。这些信号可作为严重运动障碍患者的替代输入。不同颜色的分类可以映射到许多功能,例如定向运动。在本文中,使用基于注意力的深度学习网络对来自 NeuroSky Mindwave 耳机(单电极 EEG 传感器)的原始 EEG 信号进行分类。基于注意力的 LSTM 网络已经用于对两种不同颜色和四种不同颜色进行分类。使用上述基于注意力的 LSTM 网络,两种颜色的分类准确率为 93.5%,四种信号的分类准确率为 65.75%。
单个被捕获的中性原子阵列是量子模拟、计算和计量的一个新兴平台[1-3]。通过与捕获离子类似的从头控制,可以制备和纠缠单个原子[4-6],并且越来越有望实现可扩展的量子计算[7-9]。然而,实用的量子计算需要在降低错误率和增加量子比特数方面取得实质性进展。中性原子阵列面临的一个突出挑战是开发可扩展的多功能光学元件,以实现超精细态和里德堡激发的选址操控,在受限环境中操作,并实现低散射和串扰。在离子阱实验中,长期以来在开发集成光学元件方面的努力已经提高了并行性和寻址能力[10-12]。中性原子需要类似的轨迹,并有许多独特的要求。例如,对单个中性原子的控制在很大程度上依赖于光势来捕获,无论是在晶格中还是在紧密聚焦的激光束阵列中,这被称为光镊。
Landsat 诞生于二战后的研究、工业和工程领域,是监测地球陆地面积的先驱。Landsat 最初被命名为“ERTS”(地球资源技术卫星),在卫星数据收集方面实现了多项“第一”:首次从太空平台获取数字编码的地球数据、首次在同一地方太阳时以固定间隔重复拍摄的场景图像、首次在多个光谱带中以足够的几何保真度对地面进行成像,从而可以对这些通道的响应进行有意义的比较。聪明的用户从数据中收集了大量信息,并获得了全球视野。农业清单、精确地图、地质线分类和灾害损失评估也随之而来。完全依赖个人在地面上徒步走遍每个方格并目测每片种植地以及依靠飞机飞行有限航线的时代已经一去不复返。我们怀着怀旧之情回忆那些日子,但并不后悔。
本文研究了使用大型语言模型(LLM)从全长材料科学研究论文中提取聚合物纳米复合材料(PNC)的样本清单。挑战在于PNC样品的复杂性质,这些属性具有散布在整个文本中的许多属性。关于PNCS的注释详细信息的复杂性限制了数据的可用性,从而使文档级别级别的关系提取技术不切实际,这是由于综合命名实体的挑战跨度跨度。为了解决这个问题,我们为此任务介绍了一种新的基准和评估技术,并以零拍的方式探索了不同的提示策略。我们还结合了提高性能的自我一致性。我们的发现表明,即使是先进的LLMS陷入困境,也可以从文章中提取所有样本。最后,我们分析了此过程中遇到的错误,将它们归类为三个主要挑战,并讨论了未来研究的潜在策略以克服它们。
基于异常的检测可有效防止不断发展的内幕威胁,但精度仍然低。当前的数据处理可能会导致信息丢失,并且模型通常会努力区分良性异常和实际威胁。这两个问题都阻碍了精确检测。为了解决这些问题,我们提出了基于大语言模型(LLM)微调的精确异常检测解决方案。通过代表自然语言的用户行为,我们减少了信息丢失。我们使用用户行为模式对比度对异常检测的任务进行微调,使用两阶段策略:首先学习一般行为模式,然后使用特定于用户的数据来改进,以改善良性异常和威胁之间的差异化。我们还实施了一个细粒度的威胁追踪机制,以提供行为级别的审计步道。据我们所知,我们的解决方案是第一个在内幕威胁检测中应用LLM微调的方法,在CERT V6.2数据集中达到了0.8941的F1分数,超过所有基线。
研究文章是学术话语中最重要的,最重要的流派之一。研究文章的引言部分据报道很难写(Flowerdew,1999; Hsu and Kuo,2009)。学者长期以来已经认识到修辞学在学术写作中的核心作用。对结构的众所周知的分析,即“创建一个探索空间”(CARS)模型(Swales,1990,2004)是Acameciscoress类型研究的事实上的标准,以及Hyland(2005,2018)的元音乐模型。Swales(1990)的汽车模型观察了学术研究文章中发现的共同模式,其中包括三个修辞动作(可以看作是任何旨在实现特定功能的文本功能的任何textual单位,通常是一个或多个句子)。每个举动都可以分解为更细的步骤,而某些步骤是“可选的”,并且有些“强制性”或进行了说明。在教学环境中,这些动作和步骤可用于指导新手作者在上下文,目的,目标,文献
对机器任务的深视频压缩(DVC)的事先研究通常需要为每个特定任务培训一个独特的编解码器,从而规定每个任务的专用解码器。相比之下,传统视频编解码器采用了flex ible编码器控制器,从而通过模式预测等机制使Single编解码器适应了不同的任务。从中汲取灵感,我们引入了一个创新的编码器控制器,以用于机器的深度视频压缩。此控制器具有模式预测和一组图片(GOP)选择模块。我们的AP-ARACH在编码阶段集中控制控制,从而允许跨不同任务(例如检测和跟踪)进行适应性的编码器调整,同时与标准的预训练的DVC解码器保持合理性。示例证明我们的方法是在具有各种现有预训练的DVC的多个任务中适用的。此外,广泛的实验表明,对于不同的任务,我们的方法比以前的DVC比以前的DVC大约25%,只有一个预先训练的解码器。
摘要。随着机器学习越来越多地用于辅助决策,人们要求这些决策是可解释的。可以说,最可解释的机器学习模型使用决策规则。本文重点介绍决策集,这是一种具有无序规则的模型,它用单个规则解释每个预测。为了便于人类理解,这些规则必须简洁。早期关于生成最佳决策集的工作首先最小化规则数量,然后最小化文字数量,但得到的规则通常会非常大。在这里,我们考虑一个更好的衡量标准,即决策集的总大小(以文字为单位)。因此,我们不会被一组需要大量文字的小规则所驱使。我们提供了第一种方法来确定实现最小经验风险的最小规模决策集,然后研究稀疏替代方案,以牺牲准确性换取规模。通过找到最佳解决方案,我们可以构建几乎与最佳启发式方法一样准确的决策集分类器,但更加简洁,因此更具可解释性。