抽象的各种故障会导致电动机故障,从而导致停机时间和资产损失。故障检测技术在行业中非常需要预测和防止此类故障。机器学习的最新进展已启用数据驱动的模型,这些模型可以从电动机中监视的信号中识别故障。但是,这些信号可能很复杂,并且表明故障的特征是微妙的。因此,需要提取与信号故障相关的信息特征的有效方法。在本文中,我们探讨了对比度学习在检测相位电流信号的轴承断层中的使用。我们开发了一个模型架构,该模型结构由两个部分,一个特征提取器和一个分类器组成,其中特征提取器使用监督的对比度学习进行了预训练。在Pader-Born University轴承故障数据集上进行了测试,我们的模型达到了87%的高故障分类精度,这表现优于常规机器学习模型。我们还进行了消融测试,以证明该模型中基于对比的学习培训的重要性。通过研究模型的分类结果和提取的特征,我们进一步探讨了对比度学习在提取区分不同类别的特征中的效果。我们预计对比度学习可以奠定更准确的故障检测模型的基础,并将其扩展到其他实际的故障检测任务。
传统的推荐系统(例如矩阵分解方法)主要集中于学习共享密集的设备空间,以表示项目和用户偏好。sub-sub-sub,诸如RNN,GRUS和最近的序列模型在顺序推荐的任务中出现并出色。此任务需要了解用户历史交互中存在的顺序结构,以预测他们可能喜欢的下一个项目。基于大型语言模型(LLM)在各种任务中的成功,最近使用在庞大的文本中鉴定的LLM进行了研究,以进行顺序建议。要使用LLM进行顺序推荐,用户交互的历史记录和模型对下一个项目的预测都以文本形式表示。我们提出了CALREC,这是一种两阶段的LLM登录框架,它使用两种对比性损失和语言建模损失的混合物以两位较高的方式对经过验证的LLM进行了验证:LLM首先是在来自多个域中的数据混合物上进行的,随后是一个目标域芬特芬特登录。我们的模型极大地胜过许多最先进的基准( + 37%的回忆@1和ndcg@10中的24%),我们的系统消融研究表明,(i)两种固定阶段至关重要,当结合使用时,我们在相反的绩效中获得了相似的绩效,以及(ii)对比的一致性在目标域中有效地探索了我们的实验。
传统命名实体识别(NER)模型通常是为特定于域的数据集而设计的,并且仅限于固定的预定义类型,这是难以推广到新域的困难。最近,基于及时的生成方法可以通过在不同的数据集上共同培训模式,并通过及时说明提取指定的实体,以减轻这种约束。但是,由于自回旋结构,这些方法无法直接建模实体跨度,并且会遭受缓慢的分解。为了解决这些问题,我们通过对比度学习(SUNER)提出了一个基于新颖的S基础的Unified Ner框架,该框架将文本跨度和实体类型表示在共享的语义空间中保持一致,以并行提取实体。具体来说,我们首先提取跨度,而无需考虑实体类型以更好地概括跨数据集。然后,通过利用构图的学习和精心设计的实体标记结构的力量,我们将候选人跨度及其textual类型描述映射到相同的矢量代表空间中,将其映射到跨多个方面的区分实体。对监督和零/少数拍摄设置进行了广泛的实验表明,与以前的最先进的统一NER模型相比,实现的Suner模型可实现更好的性能和更高的效率。
数据增强方法是手工设计或基于模型的。手工设计的方法,例如视觉效果中的颜色变化和随机裁剪或DNA序列中的突变,需要人类输入,并且通常是特定于数据的,并且与复杂的数据进行了斗争,在这些数据中,小变化显着影响语义。语义与无关的方法(例如添加噪声)存在,但并不总是有效的。此外,手工设计的方法需要更多样本来减轻微妙的语义变化中的风险,这在诸如生物学之类的昂贵域中挑战。使用生成模型(VAE,GAN,扩散)的基于模型的方法改善了视力任务和监督学习的训练,但面临着对多样性,概括和对外部数据的依赖的担忧。
本文介绍了我们为Semeval-2024任务8开发的系统,“多基因,多域和多语言的黑盒机器生成的文本检测”机器生成的文本是主要的结合文本之一,这是由于使用大型文本(LLM)在虚假的文本中使用大型语言模型(llm),在伪造的文本中,播放,或者在考试中作弊,或偶尔抄写。已经开发了许多系统来检测机器生成的文本。尽管如此,这些系统中的大多数都依赖于文本生成模型。在现实世界中,这种限制是不切实际的,因为通常无法知道用户使用哪种特定模型用于文本生成。在这项工作中,我们提出了一个基于对比度学习的单个模型,该模型使用了基线参数的40%(149m vs. 355m),但在测试数据集(137名参与者中的21位)上显示了可比的性能。我们的主要发现是,即使没有多个模型的集合,单个基本模型也可以在数据增强和对比度学习的帮助下具有可比性的性能。1
摘要 - 巨型镜像通常会遭受高水平的噪声,这可能会阻碍进一步的分析和解释。已经提出了解决此问题的内容感知图像恢复(CARE)方法,但是它们通常需要大量的培训数据并遭受过度填充。为了提出这些挑战,我们提出了一个新颖的框架,用于几个射击显微镜图像denoising。我们的方法结合了通过对比度学习(CL)训练的生成对抗网络(GAN)与两个结构保留损失项(结构相似性指数和总变异损失),以进一步使用很少的数据进一步提高DeNO.图像的质量。我们证明了我们的方法在三个知名的显微镜成像数据集上的有效性,并表明我们可以在保留脱索质量的同时大大减少训练数据的量,从而减轻获取配对数据的负担并实现几乎没有射击学习。提出的框架可以轻松扩展到其他图像恢复任务,并有可能显着推进显微镜图像分析的领域。
蛋白质通常表示为1D序列和2D/3D结构的多模式数据,为机器学习和计算生物学社区提供了一个激励示例,以推进多模式表示学习。蛋白质语言模型对结构的序列和几何深度学习学习了下游任务的出色单模式表示。因此,希望融合单模模型以更好地表示学习。,但仍然是一个公开的问题,即如何将它们有效地融合到多模式表示学习中,尤其是在适度的计算成本却具有显着的下游性能增益。要回答这个问题,我们建议利用单独验证的单模式模型,将它们集成到并行连接中,并在多模式的共同学习的框架下端到端端到端终极地预处理它们。技术挑战是在解决各种方式的异质性,尤其是各种语义鲁棒性的异质性的同时,构建内部和模式间对比的观点。我们通过对蛋白质同源性的领域知识来解决挑战,以告知积极观点的设计,特别是家庭的蛋白质分类(基于序列中的相似性)和超家族(基于结构的相似性)。我们还评估了与其他积极观点(例如身份和种植)相比,与其他积极观点相比,我们还评估了这种观点的使用。关于酶分类和蛋白函数预测基准的广泛实验证明了域信息构造构建和组合在多模式对比度学习中的潜力。
我们证明,飞秒光脉冲的时间对比度是透明介电内部激光写作的关键参数,允许不同的材料修饰。特别是,二氧化硅玻璃中的各向异性纳米孔由10 7飞秒YB的高对比度产生:kgw激光脉冲,而不是低对比度的10 3 yb纤维激光脉冲。差异起源于纤维激光器,该纤维激光器将其三分之一的能量的能量存储在最高200 ps的脉冲后。通过激光诱导的瞬时缺陷吸收脉冲的这种低强度分数,其寿命相对较长,激发能量(例如自捕获的孔)极大地改变了能量沉积的动力学和材料修饰的类型。我们还证明,低对比度脉冲可以有效地创建层状双重结构,该结构可能是由四极杆非线性库驱动的。
摘要。这项研究系统地研究了图像增强技术对基于卷积神经网络(CNN)基于脑肿瘤分离的影响,重点是直方图均衡(HE),对比度有限的适应性直方图均衡(CLAHE)及其杂化变量。在3064个大脑MRI图像的数据集中采用U-NET体系结构,研究深入研究了预处理步骤,包括调整和增强大小,以优化细分精度。提供了基于CNN的U-NET体系结构,培训和验证过程的详细分析。利用诸如准确性,损失,MSE,IOU和DSC等指标的比较分析表明,混合方法Clahe始终优于其他方法。结果强调了其优异的准确性(分别用于培训,测试和验证的0.9982、0.9939、0.9936)和鲁棒分割重叠,JACCARD值为0.9862、0.9847和0.9864,以及0.9864,以及0.993,0.993,0.9923,0.9923,和0.9923,和0.9923,和0.9923,和0.9923,和0.99999999999999999999999999999999999999999999999999999999999999999999999999999999993.9999999999999999999999993号。申请。该研究以分割方法进行完善,以进一步增强神经肿瘤学中的诊断精度和治疗计划。
抽象人工智能(AI)辅助疾病预测由于其支持临床决策的能力而获得了广泛的研究兴趣。现有作品主要将疾病预测作为多标签分类问题,并使用历史电子病历(EMR)来培训监督模型。然而,在现实世界中,这种纯粹的数据驱动方法提出了两个主要挑战:1)长尾巴问题:常见疾病的EMR过多,并且对于罕见疾病的EMR不足,因此对不平衡的数据集进行培训可能会导致在诊断中忽略偏见模型的偏见模型; 2)很容易误诊疾病:某些疾病很容易区分,而另一些疾病则更加困难。一般分类模型而不强调容易诊断的疾病可能会产生错误的预测。为了解决这两个问题,我们在本文中提出了一种医学知识增强的对比学习方法(MKECL)方法。MKECL将医学知识图和医学许可考试纳入建模中,以弥补有关稀有疾病的足够信息;为了处理难以诊断的疾病,MKECL引入了一种对比度学习策略,以分离容易被误诊的疾病。此外,我们建立了一个名为Jarvis-D的新基准,其中包含从各种医院收集的临床EMR。对实际临床EMR的实验表明,拟议的MKECL优于现有的疾病预测方法,尤其是在几乎没有射击和零拍的情况下。