gpadmapriyame@gmail.com,rajiv5757@yahoo.co.in摘要:现在,一天的在线Web应用程序或在线数据库应用程序越来越多地暴露于各种攻击中。这样的一种窃取数据的攻击称为SQL注入攻击,其中攻击者修改用户启动的SQL查询,并添加恶意代码以访问和操纵Web应用程序或数据库中的信息。防止此类攻击的一种方法是定期更新和测试Web应用程序防火墙(WAF)。由于技术的巨大增长,打算攻击应用程序的攻击者找到了许多进入系统的新方法。在本文中,我们将机器学习的概念与WAF结合起来,从而最大程度地提高了现有系统的有效性。本文采用的方法是无监督的机器学习技术,该技术使用K-均值聚类算法。建议的系统的流量可以给出:最终用户在Web应用程序中进行查询,并提取查询值并将其发送到SQL注入检测器,该检测器提供两层安全性。在第一层安全性中,使用无上下文语法(CFG)创建模式,以用于低级攻击。使用无监督的学习算法对高级攻击的第二层安全性进行了训练。关键字:机器学习,无监督学习,SQL注入,WAF,CFG 1。简介Web应用程序防火墙(WAF)从一系列应用程序层攻击(例如跨站点脚本(XSS),SQL注入和Cookie Disuning等)中,将Web应用程序或在线数据库应用程序中的应用。HTTP应用程序使用Web应用程序防火墙(WAF)作为应用程序防火墙。在HTTP对话中,它应用了一系列规则。通常,这些规则允许跨站点等常见攻击
抽象的神经生理实验室研究通常受到直接地理环境的限制,并且可以在时间上受到限制。对发现的生态有效性,可伸缩性和概括性的局限性对在Terfaces(BCIS)开发脑部计算机(BCIS)的开发构成了挑战,最终需要在任何CON文本中在消费级硬件上发挥作用。我们介绍了MYND:一个开源框架,该框架将消费级记录ING硬件与易于使用的应用程序融合在一起,以对BCI控制策略进行无关的评估。受试者是通过实验选择,硬件拟合,记录和数据上传的指导,以便自我管理多日研究,其中包括神经生理记录和在家中的问卷调查。作为用例,三十个受试者通过MYND对四通道脑电图(EEG)评估了两种BCI控制策略(“正面记忆”和“音乐图像”)。始终可以用平均地位准确度为68.5%和64.0%的神经活动。始终可以用平均地位准确度为68.5%和64.0%的神经活动。
大于 80 Hz 的高频振荡 (HFO) 具有独特的特征,可将其与时频表示中可以充分证明的尖峰和伪影成分区分开来。我们引入了一种无监督的 HFO 检测器,它使用计算机视觉算法在二维 (2D) 时频图上检测 HFO 标志。为了验证检测器,我们引入了一个基于具有高斯包络的正弦波的 HFO 分析模型,可以推导出时频空间中的解析方程,这使我们能够在时域中常见的 HFO 检测标准与计算机视觉检测算法使用的频域标准之间建立直接对应关系。检测器在时频表示上识别潜在的 HFO 事件,如果满足有关 HFO 频率、振幅和持续时间的标准,则将其归类为真正的 HFO。根据分析模型,在存在噪声的情况下,对检测器进行了模拟 HFO 的验证,信噪比 (SNR) 范围从 -9 到 0 dB。检测器的灵敏度在 SNR 为 -9 dB 时为 0.64,在 -6 dB 时为 0.98,在 -3 dB 和 0 dB 时 > 0.99,而其阳性预测值均 > 0.95,无论 SNR 如何。使用相同的模拟数据集,我们的检测器与四个之前发布的 HFO 检测器进行了对比。F 度量是一种同时考虑灵敏度和阳性预测值的组合指标,用于比较检测算法。我们的检测器在 -6、-3 和 0 dB 时超越其他检测器,在 -9 dB SNR 时拥有仅次于 MNI 检测器的第二好 F 分数(0.77 对 0.83)。研究人员在 6 名患者的一组 36 个颅内脑电图 (EEG) 通道上测试了在临床记录中检测 HFO 的能力,其中 89% 的检测结果由两名独立审阅者验证。结果表明,基于时频图中的 2D 特征对 HFO 进行无监督检测是可行的,并且其性能与最常用的 HFO 检测器相当或更好。
摘要 刀具状态监测 (TCM) 对于确保产品质量和避免停机至关重要。机器学习已被证明对 TCM 至关重要。然而,现有的研究主要基于监督学习,这阻碍了它们在实际制造环境中的适用性,因为在役机器上的数据标记既麻烦又昂贵。此外,现有的无监督解决方案主要处理基于二元决策的 TCM,无法完全反映刀具磨损进展的动态。为了解决这些问题,我们提出了不同的无监督和半监督五类刀具磨损识别框架,分别处理完全未标记和部分标记的数据。底层方法包括拉普拉斯得分、稀疏自编码器 (SAE)、堆叠 SAE (SSAE)、自组织映射、Softmax、支持向量机和随机森林。对于半监督框架,我们考虑了标记数据仅影响特征学习、分类器构建或两者的设计。我们还研究了 SSAE 在监督层面的不同训练配置。我们将框架应用于两个铣刀运行至故障数据集,使用麦克风和加速度计记录。评估中考虑了不同百分比标记训练数据下的单传感器和多传感器数据。结果显示了哪种框架在哪种数据设置下可产生最佳预测性能,并强调了传感器融合和判别性特征表示在应对标签不可用和稀缺性方面的重要性,以及其他发现。两个完全未标记数据的数据集实现的最高宏 F1 分别达到 87.52% 和 75.80%,当只有 25% 的训练观测值被标记时,最高宏 F1 超过 90%。
无监督的可见红外人员重新识别(USL-VI-REID)旨在匹配来自不同方式的同一身份的行人图像,而无需注释。现有作品主要集中于通过对齐未标记的样本的实例级特征来减轻模式差距。但是,跨模式簇之间的关系尚未得到很好的探索。为此,我们提出了一个新型的双边群集匹配的学习框架,以通过匹配的跨模式簇来弥补模态差距。特定的是,我们通过优化两部分图中的最大匹配问题来设计多到多的双边跨模式群匹配(MBCCM)算法。然后,匹配的成对簇在模型训练过程中利用共享的可见和红外伪标签。在这样的监督信号下,提出了一种特异性和模态性和情态的(MSMA)对比度学习框架 - 提议在集群级别上共同对齐特征。平均值,提出了交叉模式一致性约束(CC),以明确减少较大的模态差异。对公共SYSU-MM01和REGDB数据集进行了广泛的实验,证明了该方法的有效性,平均超过8.76%的地图超过了最先进的方法。
可变形图像注册对于临床诊断,治疗计划和手术导航至关重要。但是,大多数现有的注册解决方案都需要在可变形注册之前单独的刚性对准,并且可能无法满足较大的变形情况。我们提出了一个新型的边缘感知金字塔变形网络(称为EPREG),用于无监督的体积登记。特别是,我们建议从多级特征金字塔中充分利用有用的互补信息,以预测多尺度的位移场。这样的粗到细节估计促进了预测的注册场的进行性重新确定,这使我们的网络能够处理体积数据之间的大变形。此外,我们将边缘信息与原始图像作为双输入集成在一起,从而增强了图像内容的纹理结构,以促使所提出的网络额外注意以进行结构对齐的边缘感知信息。在包括MindBoggle101,LPBA40和IXI30在内的三个公共大脑MRI数据集上对我们的EPREG的效率进行了广泛的评估。实验证明,相对于骰子指数(DSC),Hausdorff距离(HD)和平均对称的表面距离(ASSD)的指标,我们的EPREG始终优于几种尖端方法。提出的EPREG是解决可变形体积登记问题的一般解决方案。
数据增强方法是手工设计或基于模型的。手工设计的方法,例如视觉效果中的颜色变化和随机裁剪或DNA序列中的突变,需要人类输入,并且通常是特定于数据的,并且与复杂的数据进行了斗争,在这些数据中,小变化显着影响语义。语义与无关的方法(例如添加噪声)存在,但并不总是有效的。此外,手工设计的方法需要更多样本来减轻微妙的语义变化中的风险,这在诸如生物学之类的昂贵域中挑战。使用生成模型(VAE,GAN,扩散)的基于模型的方法改善了视力任务和监督学习的训练,但面临着对多样性,概括和对外部数据的依赖的担忧。
由于带注释的样本稀缺,病理性脑损伤在图像数据中的复杂表现对监督检测方法提出了挑战。为了克服这个困难,我们将重点转移到无监督异常检测。在这项工作中,我们专门使用健康数据训练所提出的模型,以识别测试期间未见的异常。这项研究需要调查基于三元组的变分自动编码器,以同时学习健康脑数据的分布和去噪能力。重要的是,我们纠正了先前基于投影的方法中固有的一个误解,该误解依赖于这样的假设:图像内的健康区域在重建输出中将保持不变。这无意中暗示了病变图像和无病变图像在潜在空间表示上存在相当大的相似性。然而,这种假设可能并不成立,特别是由于病变区域强度对投影过程的潜在重大影响,特别是对于具有单一信息瓶颈的自动编码器。为了克服这个限制,我们将度量学习与潜在采样分离。这种方法确保病变和无病变输入图像都投影到相同的分布中,特别是无病变投影。此外,我们引入了一个语义引导的门控交叉跳过模块来增强空间细节检索,同时抑制异常,利用解码器更深层中存在的健壮健康大脑表示语义。我们还发现,将结构相似性指数测量作为额外的训练目标可以增强所提模型的异常检测能力。
摘要 — 深度学习通过使用卷积神经网络 (CNN) 对电路结构进行分割,在具有挑战性的电路注释任务中取得了巨大成功。深度学习方法需要大量手动注释的训练数据才能获得良好的性能,如果将在给定数据集上训练的深度学习模型应用于不同的数据集,则可能会导致性能下降。这通常被称为电路注释的域转移问题,其源于不同图像数据集之间的分布可能存在很大差异。不同的图像数据集可以从不同的设备或单个设备内的不同层获得。为了解决域转移问题,我们提出了直方图门控图像转换 (HGIT),这是一种无监督域自适应框架,它将图像从给定的源数据集转换到目标数据集的域,并利用转换后的图像来训练分割网络。具体而言,我们的 HGIT 执行基于生成对抗网络 (GAN) 的图像转换并利用直方图统计数据进行数据管理。实验是在适应三个不同目标数据集(无训练标签)的单个标记源数据集上进行的,并评估了每个目标数据集的分割性能。我们已经证明,与已报道的域自适应技术相比,我们的方法实现了最佳性能,并且也相当接近完全监督的基准。索引术语——深度学习、集成电路图像分析、无监督域自适应、图像到图像转换
在人工智能中了解了机器学习的过程。机器学习过程使工具具有从其经验中学习并改善自己的能力,而无需任何编码。在机器学习中,我们以用户希望通过机器完成的工作方式对计算机或机器进行编程。它可以提供此类工作,在此过程中,计算机根据数据已经与数据进行了工作并提供其性能。撰写论文的目的是基于无监督学习的模型数据集应用k-意味着聚类算法。我们过去在监督学习中将功能数据和标签标签传递给机器学习模型。但是,无监督学习算法的方法是不同的。在此中,我们不将功能数据和目标数据提供给模型。数据集模型仅使用输入数据进行处理,并且输出数据在模型中没有含义。基于数据和模型中的相似性预测所需的输出。k-means基于无监督的学习聚类算法,其中数据和对象分为不同的簇,以使具有相似属性的对象放在一个群集中,并且具有不同属性的对象被放置在单独的群集中。