摘要。由于其普遍适用性,机器学习模型(ML)在过去二十年中一直是一个热门话题。尽管它们有效,但一些ML模型表现出效率低下,尤其是在大数据分类中。此外,某些ML模型在某些小数据集上有效。在这方面,由于在线数据的可访问性越来越大,自动数据分类技术吸引了很多研究兴趣。因此,在文本分类字段中已经开发了许多独特的学习策略。基于质心的分类器(CBC)是其中最广泛使用的技术之一。专注于增强NC分类器时,本文旨在简要研究某些ML模型对中小型数据集分类的影响。在这些模型中:N-中心技术(NC)作为简单设计的分类器,支持向量机(SVM)和多项式贝叶斯(MNB)。最重要的是,本文通过与两个相似性度量的集成,即基于集合理论的相似性度量(STB-SM)和改进的余弦相似度量(ISC),引入了NC的结合变化。在有效性和效率方面,综合NC分类器的性能被认为是有希望的。
使用安装在 J-PARC 材料与生命科学实验设施的单晶衍射仪 SENJU (BL18) 和超高分辨率粉末衍射仪 SuperHRPD (BL08) 收集飞行时间中子衍射数据。如图 1(a) 所示,在 MASnBr 3 的五个相中观察到的衍射图案彼此明显不同,表明晶体结构通过四个相变依次变化。该结果需要重新考虑 g、d 和 e 相的结构,其中 b - g 相和 d – e 相之间没有观察到明显的结构变化[1]。对于 MASnI 3 ,如先前报道的那样[2][3],识别出三个具有不同结构的相(图 1(b))。最低温相的结构仍然不确定,但 b 相和 g 相之间衍射图案的剧烈变化表明结构对称性从四方晶系到三斜晶系显著降低。立方a相单晶结构分析表明MA分子的质心位于立方晶胞中心之外,用最大熵法合成的分子核密度沿立方轴呈现各向异性分布。这些趋势在MASnBr 3 中表现得更为明显,表明X = Br晶体中有机-无机相互作用的影响更强。
测量文本的语义相似度在自然语言处理领域的各种任务中起着至关重要的作用。在本文中,我们描述了一组我们进行的实验,以评估和比较用于测量短文本语义相似度的不同方法的性能。我们对四种基于词向量的模型进行了比较:Word2Vec 的两个变体(一个基于在特定数据集上训练的 Word2Vec,另一个使用词义的嵌入对其进行扩展)、FastText 和 TF-IDF。由于这些模型提供了词向量,我们尝试了各种基于词向量计算短文本语义相似度的方法。更准确地说,对于这些模型中的每一个,我们测试了五种将词向量聚合到文本嵌入中的方法。我们通过对两种常用的相似度测量进行变体引入了三种方法。一种方法是基于质心的余弦相似度的扩展,另外两种方法是 Okapi BM25 函数的变体。我们在两个公开可用的数据集 SICK 和 Lee 上根据 Pearson 和 Spearman 相关性对所有方法进行了评估。结果表明,在大多数情况下,扩展方法的表现优于原始方法。关键词:语义相似度、短文本相似度、词嵌入、Word2Vec、FastText、TF-IDF
摘要:介绍了一种在最终状态下寻找一个顶夸克且横向动量缺失的事件的方法。通过选择具有重建的增强顶夸克拓扑结构的事件(这些事件与较大的横向动量缺失有关),探索顶夸克的完全强子衰变。分析使用了 2015-2018 年大型强子对撞机的 ATLAS 探测器记录的 139 fb − 1 个质子-质子碰撞数据,质心能量为 √ s = 13 TeV。结果是在暗物质粒子产生和单个矢量类 T 夸克产生的简化模型的背景下解释的。在没有明显超出标准模型预期的情况下,获得了相应截面的 95% 置信度上限。对于标量(矢量)介质的质量高达 4 的情况,不包括与单个顶夸克相关的暗物质粒子的产生。 3 (2.3) TeV,假设 m χ = 1 GeV,模型耦合 λ q = 0.6 和 λ χ = 0.4(a = 0.5 和 g χ = 1)。假设与顶夸克的耦合 κ T = 0.5 且 T → Zt 的分支率为 25%,则对于低于 1.8 TeV 的质量,不会产生单个矢量 T 夸克。
抽象的Osmanthus Fragrans是一棵有价值的美化树,在全球范围内受到赞赏。但是,O的最佳环境条件。芬兰种植尚未详细研究,这阻碍了该植物的野生资源及其商业剥削的保存。应用最大熵模型来评估影响O的环境变量的重要性。Faprans分布。将来自O的629个全局分布点的数据组合在一起。Fragn,对气候变化对当前物种和未来的合适栖息地的地理分布的潜在影响做出了预测。结果表明o。Faprans更喜欢温暖而潮湿的生长环境。在当前气候条件下,o的潜在栖息地。Faprans主要位于大陆的东部沿海地区中等和低纬度地区。影响其分布的主要环境变量是最温暖的季度,温度季节性和最温暖季度的平均温度。分析表明,气候变化中当前趋势的延续将导致O的合适栖息地进一步降低。Faprans的增长,全球质心将转移到东南。这些发现提供了对气候变化对O的影响的见解。Faprans栖息地,并为该物种的野生资源保存和未来抗气候变化的品种提供了指导。
线性和角航天器动力学。已经针对捕获应用进行了研究,因为潜在的翻滚目标需要经过调整的机械手方法。通过 Giordano 等人 (2018) 提出的工作空间调整策略或 Giordano 等人 (2019) 同时控制全局质心和航天器姿态,已经研究了如何有效使用推进器来补偿机械手运动。同样,当仅控制机械手时,Pisculli 等人 (2015) 开发了反应零空间控制,以减少机械手和航天器底座之间的相互作用。还可以注意到没有考虑底座执行器的情况。更一般地说,轨迹规划被认为可以减少机械手运动和/或外部干扰对底座的影响,至少对于无奇点轨迹而言。Rybus 等人采用了非线性模型预测控制。 (2017) 确保机械手实现优化轨迹,最大限度地减少机械手对卫星的干扰,同样在捕获接近阶段,Lu 和 Yang (2020) 研究了笛卡尔轨迹规划,以最大限度地减少姿态干扰,Seddaoui 和 Saaj (2019) 提出了一种用于燃料消耗优化的无碰撞路径和无奇点路径的通用轨迹规划,同时采用 H ∞ 控制和前馈补偿处理内部和外部扰动。
本文介绍了合成,晶体生长,检测器制造,辐射硬化研究,MCNP建模以及二依依氏锂或Inse 2的表征。这个新开发的室温热中子检测器具有半导体和闪烁的特性,适用于中子检测应用。liinse 2是从元素li开始合成的,由于Li的高反应性,分为两个步骤。使用垂直Bridgman方法生长了一个含Iinse 2的单晶。使用光吸收测量值发现室温带隙为2.8 eV。散装电阻率。光电导率测量2晶片的光电识别在445 nm左右的光电流中。核辐射探测器是用单晶晶片制成的,并测量了各种偏见的α颗粒的响应。估计了千篇一律的产物。γ辐照研究的吸收剂量范围为0.2126至21,262 Gy。在每次辐照后都进行了两个晶圆的表征。γ辐射产生的光产率降低,这转化为alpha检测光谱质心的较低通道数。它也显示出第一次辐照后的衰减时间大大减少。这些是对这种材料进行伽马辐射硬化的第一批研究。
重离子碰撞计划的目标是,其质心能量在几 GeV 到几百 GeV 范围内,研究所产生的致密重子介质的性质,特别是它的状态方程 (EoS) 和传输系数。流体动力学方法对于实现这一目标至关重要,因为它可以相对轻松地纳入不同的状态方程。流体动力学方法在高能 √ s NN = 200 GeV 及以上的核 - 核碰撞中的应用非常成功。在那里,人们通常将动力学分为初始状态和后续流体阶段,其中发生初始硬散射,据称会导致介质的各向同性或有效流化,其中演化由流体动力学方程控制。然而,在模拟较低能量的重离子碰撞时,人们面临着一个挑战。入射原子核的洛伦兹收缩并不强,两个原子核完全穿过对方并发生所有初级 NN 散射需要几 fm / c 的时间。在发生第一次核子-核子散射的区域可能已经形成了稠密介质,而最后的核子仍在接近它们第一次相互作用的点。多流体动力学是一种优雅但现象学的方法,可以解释中能级原子核-核碰撞的复杂时空图景。在多流体方法中,人们将入射原子核近似为两个冷且富含重子的团块
摘要 - dysarthria是一种运动语音障碍,通常与脑瘫,帕金森氏病,肌萎缩性侧面硬化症和中风有关。患有构音障碍的人通常会出现严重的语音困难,包括不精确的表达,缺乏流利性,言语缓慢以及量减少和清晰度,这可能会阻碍他们与他人有效沟通的能力。我们提出了一种两级语音转换方法,以增强违反语音的重建。在第一阶段,我们基于相同的性别回应策略开发了一种KNN-VC方法,以预先修复质心语音。在此阶段,我们仅将违反语音与同一性别的正常语音相匹配。在第二阶段,我们适应了So-Vits-SVC来恢复扬声器的音色,并提高了第一阶段修复的演讲的声音质量。在低资源构件构想唤醒单词斑点挑战(LRDWWS挑战)的数据集中进行了客观和主观评估,这表明,所提出的方法可以在说话者的相似性,语音清晰度和不知名的扬声器方面取得一些改善,这些评估也表明我们的方法还表明我们的方法具有良好的零料性能。我们的音频样本可以在线访问1。索引术语 - dysarthric语音重建,任何一对零射,语音转换
高内涵显微镜在生物学和医学领域取得了许多进展。这种快速发展的技术正在将细胞生物学转变为大数据驱动的科学。计算机视觉方法用于自动分析显微镜图像数据。近年来,深度学习变得流行起来,并在计算机视觉领域取得了重大成功。大多数可用的方法都是为处理自然图像而开发的。与自然图像相比,显微镜图像带来了特定领域的挑战,例如训练数据集小、对象聚类和类别不平衡。本文介绍了用于显微镜图像中对象检测和细胞分割的新型深度学习方法。对于荧光显微镜图像中的粒子检测,提出了一种基于领域自适应反卷积网络的深度学习方法。此外,提出了一种在异质组织病理学图像中有丝分裂细胞检测的方法,该方法结合了深度残差网络和霍夫投票。该方法用于乳腺癌全切片组织学图像的分级。此外,介绍了一种基于物体质心的粒子检测和细胞检测方法,该方法可以端到端训练。它包括一个新的质心提议网络、一个用于在图像尺度和锚点上集成检测假设的层、一个有利于先前锚点而不是回归位置的锚点正则化方案以及一种改进的非最大抑制算法。此外,提出了一种基于归一化互信息的新型损失函数,该函数可以应对强烈的类别不平衡,并且是在贝叶斯框架内推导出来的。对于细胞分割,引入了一种具有增加的接受场以捕获丰富语义信息的深度神经网络。此外,提出了一种结合卷积神经网络的多尺度特征聚合和循环神经网络的迭代细化的两种范式的深度神经网络。为了提高训练的鲁棒性并改善分割,提出了一种新的焦点损失函数。此外,还提出了一种用于生物医学图像分析流程的黑盒超参数优化框架。该框架具有模块化架构,将超参数采样和超参数优化分开。建议基于最小投影对损失函数进行可视化,以进一步了解优化问题。此外,还提出了一种迁移学习方法,该方法仅使用一个颜色通道进行预训练,并对更多颜色通道进行微调。此外,还提出了一种用于组织病理学幻灯片的无监督域自适应方法。最后,介绍了 Galaxy Image Analysis,这是一个基于 Web 的显微镜图像分析平台。已经开发了用于细胞培养中的细胞分割、小鼠脑组织中的粒子检测和 MALDI/H&E 图像配准的 Galaxy Image Analysis 工作流程。所提出的方法已应用于具有挑战性的合成和真实
