医学图像分析在临床上引起了广泛关注。借助现代算法,计算机辅助诊断可帮助医生处理病理学以及观察者内和观察者之间的巨大差异。深度学习及其高计算能力将人为设计的特征转换为基于学习的特征提取过程。即使没有该领域的先验知识,模型也可以直接从数据中学习有意义的特征 [1]。因此,构建深度学习算法以学习分层特征表示需要大量数据。使用大数据集实现高精度使卷积神经网络 (CNN) 在医学图像分析任务中广受欢迎,例如肝病变分类 [2]、脑部分析 [3] 和视网膜图像分析 [4]。例如,谷歌提出的方法使用 128 万张视网膜图像来训练其系统以诊断糖尿病视网膜病变 [5],而深度 CNN 在皮肤病变分类方面也取得了理想的效果 [6]。不幸的是,在实际的医疗应用中,如此大量的带标签数据并不总是可访问的。有两个原因限制了医学图像领域对带标签数据的访问。首先,这是一项耗时而繁琐的任务,需要经验丰富的专家花费很长时间进行注释。其次,由于疾病并不常见,因此在应用中也很难获得所需数量的疾病图像。根据差异的类型,图像特征可分为两类,即相关特征和非相关特征 [7]。在医学图像中,相关特征包含确定器官或病变的最有用信息,而非相关特征则是图像之间变化的特征,例如强度差异。对于大多数医学图像应用而言,很难建立大型数据集,尤其是由于罕见疾病和患者隐私。训练小型数据集不利于模型捕捉广义的相关特征,并且可能由于过拟合问题导致性能下降。为了避免过拟合问题并提高深度学习算法的性能[8],研究人员尝试利用数据增强技术[9-12]。数据增强是一种通过向模型提供不同来源的数据来消除不相关方差的方法,它已被研究
缺乏一致、可靠的通信能力继续严重限制美国海岸警卫队 (USCG) 在阿拉斯加第 17 区 (D17) 执行搜索和救援 (SAR) 行动的能力。这个广阔的责任区包括超过 380 万英里的极其偏远的地区以及恶劣的天气和海况。现有的救援 21 (R21) 海上“911”通信系统利用地面塔接收并向海员中继甚高频遇险通信。这些塔的覆盖范围延伸到离岸约 20 海里。但是,现有的 R21 基础设施频繁停电,加上其地处偏远、缺乏基础设施以及条件恶劣,使维护它们具有挑战性并导致长时间停电。这些停电削弱了海岸警卫队接收和响应这些危险地区海上遇险警报的能力。
a 横滨市立大学认知信息科学实验室,日本横滨市金泽区濑户 22-2 b 日本理化学研究所信息系统和网络安全总部计算工程应用部,日本埼玉县和光市广泽 2-1 c 西班牙加泰罗尼亚维多利亚中央大学工程系数据与信号处理研究组,维多利亚 08500 d 英国剑桥大学精神病学系,剑桥 CB2 3EB e 南开大学人工智能学院,天津 300071 f 俄罗斯莫斯科斯科尔科沃科学技术研究所张量网络与深度学习数据挖掘应用实验室 g 日本东京理化学研究所高级智能项目中心张量学习团队 h 阿里巴巴集团阿里巴巴量子实验室,北京 100102 i 三峡大学经济管理学院,宜昌
数字化改变了许多创新管理研究的基础假设。在探索数字创新管理如何脱颖而出的早期阶段,需要对该领域进行进一步的研究。先前关于公司如何使用人工智能的研究区分了自动化和增强人类活动。在本文中,我们探讨了公司如何在研发领域实施人工智能。利用一个涵盖 2020 年出版的 122 份报纸的 956 篇文章的国际新闻数据库,我们发现人工智能主要用于增强研发领域的人类活动(55%),而不是用于自动化事务(11%)。我们观察到在政府、信息和通信技术 (ICT) 以及技术和软件等自动化更为常见的行业之间存在差异。我们的系统编码表明,人工智能主要用于探索性研究和开发(64%),而不是开发(5%)。基于这些发现,我们得出结论,人工智能的研究和开发主要侧重于新市场和运营领域,而不是增强现有的产品市场和活动。此外,它增强了人类劳动力,而不是取代它;因此,与人工智能相关的失业似乎并未发生在研发领域。
处理步骤,但对于带有可变音调的打印图案,它的灵活性较小。此外,将DSA应用于高量制造的主要挑战之一是观察到的缺陷密度,该缺陷密度分别大于所需的缺陷密度为1和0.01缺损cm 2用于记忆和逻辑应用。最常见的缺陷是桥梁和位错。,即使EUVL也没有缺陷问题,如先前的工作4、5所述,并且被证明会导致桥梁缺陷。为了解决大型缺陷密度的关注,尤其是在DSA中,采用各种过程的选择步骤来确定可以减少整体缺陷密度的重要因素;优化步骤包括不同的退火条件,表面模式的周期性,指南线的宽度,模式的地形以及背景化学等。对于列出的处理步骤的每一个组合,进行扫描电子显微镜(SEM)图像的缺陷检查以评估处理条件的性能是必不可少的。这涉及为统计目的收集足够数量的SEM图像,并手动执行缺陷检测或使用图像处理工具。随着处理步骤的不同组合的数量增加,缺陷的手动标记效率低下。解决方案之一是使用新兴的深度学习算法来检测和分类不同类型的缺陷。在材料科学领域,已经应用了许多算法来从给定的图像集中学习复杂的缺陷特征。例如,(1)Xie等。6使用多级支持向量机算法来检测印刷电路板和晶圆中最常见的缺陷。这些缺陷涉及环,半圆,簇和划痕。(2)Zheng和Gu 7采用了学习算法的机器,以检测具有高准确性的石墨烯中多个空缺数量。(3)Tabernik等。8报道了一项研究,在该研究中,他们利用基于细分的深度学习体系结构从某些工业应用的角度来检测成品中的表面异常。对缺陷的深度学习辅助识别不仅限于材料科学领域,因此已在其他各个领域中用于诸如下水道管道9、10和水果缺陷检测中的缺陷检测。11我们认为,使用这种自动化方法来计算不同类型的缺陷,并指定其在线路和空间(L/S)模式中的位置,可以帮助过程工程师快速收集足够的统计数据,并提供更准确,更一致的方法来评估每个处理条件的组合。通常,需要大量培训样本以确保网络的高精度。不幸的是,如前所述,由于人类的努力和专业知识所需的负载,因此要求SEM图像中存在的缺陷标记的时间耗时的过程。这为收集足够的数据构成了深度学习网络所需的精度的障碍。13,14另一种数据增强方法是通过执行模拟来扩展数据集。数据增强是一种可行的选择,可以通过利用原始数据集中的更多信息来夸大培训数据集。如Shorten和Khoshgoftaar的评论论文所讨论的,12个增强策略包括几何和颜色变换,随机擦除和特征空间扩展。翻转图像是最简单,最便宜的策略之一,结合了其他几何形状转换,旋转和缩放的几何变换可提高深度学习算法的准确性。在Carrasco-Davis等人的天文事件的分类中探索了这种策略,15,其中作者依靠基于物理的模型来生成模拟数据集。参考。16,如Holtzman等人所述,使用点散射模型生成的模拟数据集为雷达图像模拟。17与真实的数据集混合在一起,可以提高船舶合成孔径雷达图像中目标识别的准确性。在这项工作中,使用最小的SEM数据集进行培训[O(100)图像],我们使用了一个受良好版本3的启发的对象分类和检测网络。在剪切 - 索尔沃退火条件下使用圆柱体组成共聚物进行实验后,收集了SEM数据集。19网络中的卷积层和过滤器的数量已针对网络的准确性进行了优化。实施了各种激活功能和不同损失功能的进一步检查。使用两种策略夸大了具有有限数量SEM图像的初始数据集:(1)几何转换
训练分割网络需要大量带注释的数据集,而这在医学成像中很难获得。尽管如此,我们认为数据增强尚未在脑肿瘤分割中得到充分探索。在本项目中,我们在训练标准 3D U-Net 时应用了不同类型的数据增强(翻转、旋转、缩放、亮度调整、弹性变形),并证明增强在许多情况下可显著提高网络性能。我们的结论是亮度增强和弹性变形效果最好,与仅使用一种增强技术相比,不同增强技术的组合并不能带来进一步的改进。我们的代码可在 https://github.com/mdciri/3D-augmentation-techniques 获得。
摘要 在本研究中,我们提出了聊天机器人与人工智能交互 (CI-AI) 框架,作为一种训练基于转换器的聊天机器人类架构的方法,用于任务分类,重点是人与机器的自然交互,而不是界面、代码或正式命令。智能系统通过人工释义来增强人类来源的数据,以便为自然语言处理 (NLP) 的进一步经典、注意力和基于语言转换的学习方法生成大量训练数据。要求人类释义命令和问题以进行任务识别,从而进一步执行算法作为技能。命令和问题分为训练集和验证集。共记录了 483 个回复。其次,训练集由 T5 模型释义,以便用进一步的数据进行扩充。在对训练数据进行两个时期的微调后,对七种最先进的基于 Transformer 的文本分类算法(BERT、DistilBERT、RoBERTa、DistilRoBERTa、XLM、XLM-RoBERTa 和 XLNet)进行了基准测试。我们发现,当训练数据通过 T5 模型增强时,所有模型都得到了改进,分类准确率平均提高了 4.01%。最好的结果是在 T5 增强数据上训练的 RoBERTa 模型,其分类准确率达到了 98.96%。最后,我们发现,通过输出标签预测的逻辑回归,五个表现最佳的 Transformer 模型的集合在人类反应数据集上的准确率达到了 99.59%。高性能模型允许智能系统通过类似聊天机器人的界面在社交互动层面解释人类命令(例如“机器人,我们可以聊天吗?”),并允许非技术用户更好地访问人工智能。
摘要 — 脑机接口 (BCI) 系统中分类器的性能高度依赖于训练数据的质量和数量。通常,训练数据是在实验室中收集的,用户在受控环境中执行任务。然而,在现实生活中的 BCI 应用中,用户的注意力可能会分散,这可能会降低分类器的性能。为了提高分类器的鲁棒性,可以在这种情况下获取额外的数据,但在几个长时间的校准会话中记录脑电图 (EEG) 数据是不切实际的。一种潜在的省时省钱的解决方案是人工数据生成。因此,在本研究中,我们提出了一个基于深度卷积生成对抗网络 (DCGAN) 的框架,用于生成人工 EEG 来扩充训练集,从而提高 BCI 分类器的性能。为了进行比较研究,我们设计了一个具有分散和集中注意力条件的运动任务实验。我们使用端到端深度卷积神经网络,利用 14 名受试者的数据对运动意图和休息进行分类。在没有数据增强的情况下,留一法 (LOO) 分类的结果显示,注意力转移的基线准确率为 73.04%,集中注意力的基线准确率为 80.09%。使用所提出的基于 DCGAN 的增强框架,结果显著提高了注意力转移 7.32%(p < 0.01),集中注意力 5.45%(p < 0.01)。此外,我们在 BCI 竞赛 III 的数据集 IVa 上实现了该方法,以区分不同的运动想象任务。所提出的方法将准确率提高了 3.57%(p < 0.02)。这项研究表明,使用 GAN 进行 EEG 增强可以显著提高 BCI 性能,尤其是在现实生活中的应用中,用户的注意力可能会被转移。
引言2011年莫哈韦沙漠乌龟的恢复计划将“人口增强”确定为恢复乌龟的关键战略因素,这是由于整个范围内的乌龟种群的明显下降以及多方面的相互作用威胁和自然人口增长速度的降低(USFWS 2011)。本文件应用国际自然/物种生存委员会的重新引入和其他保护易位的指导(IUCN/SSC 2013),概述了一种加强乌龟数量的策略,其中低密度排除该物种迅速增加,从而从人口统计学脆弱中恢复了。该策略主要预期使用“缓解易位” - 通过人为的土地利用变化和替代地点释放而丧失的生物体,从栖息地造成生物体,但主要重点将放在接收人群的保护益处,而不仅仅是迅速将个人从HARM中移除的人(IUCN/SSC 2013)。我们已经确定了区域增强站点以实现此目的的必要性(USFWS 2011,2020)。也正在进行一些实验性的启动项目,并且可以根据鱼类和野生动物服务局的受控繁殖政策将其整合到特定的增强计划中(USFWS 2000)。人口增强并不是为了保护沙漠乌龟的长期战略,而是一种旨在通过自然过程更快地增加人口的中级策略(USFWS 2011)。人口增强直接适用于前两个恢复标准:此策略为制定个人增强计划提供了背景,该计划还应包括设计,可行性和风险评估,实施,监测,评估和调整元素(IUCN/SSC 2013)。目标和目标该策略的目标是利用人口增强,以明显地帮助实现恢复计划中确定的五个恢复单元中的每个单元(USFWS 2011)。
