大脑计算机界面(BCI)是处理大脑活动以从中解码特定命令的系统,例如在用户Image-Im-Ine运动时生成的运动成像模式。尽管对BCI的兴趣日益增加,但由于用户内部和内部的可变性,它们引起了重大挑战,尤其是在解码不同的神经模式方面。文献表明,各种预测因子与受试者的BCI绩效相关。在这些指标中,神经生理学的预测符似乎是最有效的,尽管研究通常涉及小样本,结果并未被复制,从而质疑其可靠性。在我们的研究中,我们使用了一个带有85位受试者的大型数据集来分析文献和BCI性能中确定的不同预测因子之间的关系。我们的发现表明,在此数据集中可以替换了测试的六个预测因子中的四个。这些结果强调了验证文献发现的必要性,以确保此类预测因子的可靠性和适用性。
抽象的网络钓鱼攻击在当今的数字世界中继续构成重大挑战。因此,需要复杂的检测技术来解决不断变化的策略。在本文中,我们提出了一种创新的方法,可以使用广泛的Phiusiil数据集识别网络钓鱼尝试。提议的数据集包括134,850个合法URL和100,945个网络钓鱼URL,为分析提供了强大的基础。我们将T-SNE技术应用于特征提取,将原始51个特征缩合为2,同时保留了高检测精度。我们评估了完整和减少数据集的几种机器学习算法,包括逻辑回归,天真的贝叶斯,k-nearest邻居(KNN),决策树和随机森林。决策树算法在原始数据集上显示出最佳性能,精度达到99.7%。有趣的是,所提出的KNN在功能提取的数据上表现出了显着的结果,其精度达到了99.2%。使用特征提取的数据集时,我们观察到逻辑回归和随机森林性能的显着改善。提出的方法在计算效率方面提供了可观的好处。功能提取的数据集需要更少的处理能力;因此,它非常适合资源有限的系统。这些发现为开发更强大,更灵活的网络钓鱼检测系统铺平了道路,这些系统可以在实时场景中识别和中和新兴威胁。
摘要:神经细胞的进行性变性会导致神经退行性疾病。例如,阿尔茨海默氏症和帕金森氏病逐渐降低了个人的认知能力和运动技能。借助治愈知识,我们的目标是通过诉诸康复疗法和药物来减缓其影响。因此,早期诊断在延迟这些疾病进展的过程中起着关键作用。发现针对特定任务的手写动力学分析被认为是提供这些分歧的早期诊断的有效工具。最近,引入了带有手写(Darwin)数据集的诊断阿尔茨海默氏症。它包含来自174名参与者(诊断为阿尔茨海默氏症与否)的手写样本的记录,执行25种特定的手写任务,包括命令,图形和副本。在本文中,我们探讨了降低维度,解释性和分类技术的Darwin数据集的使用。我们确定用于预测阿尔茨海默氏症的最相关和决定性的手写功能。从具有不同组的原始450个功能的原始集合中,我们发现了小的特征子集表明,执行空中运动所花费的时间是预测阿尔茨海默氏症的最具决定性的功能。
隐私的机器学习是一类密码方法,旨在分析私人和敏感数据的同时保留隐私,例如在大型加密数据上使用同型逻辑回归培训。在本文中,我们提出了一种有效的算法,用于使用同态加密(HE)对大加密数据进行逻辑回归训练,这是使用更快的渐变变体称为Quadratic梯度的最新方法的迷你批量版本。据称,二次梯度可以将曲线信息(Hessian矩阵)集成到梯度中,因此可以有效地加速一阶梯度(下降)算法。当加密的数据集如此之大,以至于必须以迷你批次方式加密时,我们还实现了其方法的全批量版本。我们将迷你批次算法与我们的全批量实施方法进行了比较,这些方法由422,108个带有200粒的样本组成的真实财务数据进行了比较。鉴于HES的效率低下,我们的结果令人鼓舞,并证明了大型加密数据集的Logistic回归培训具有可行性,这标志着我们理解的重要里程碑。
基础模型通过利用其预先训练的代表来捕获语音信号中的情感模式,在语音情感识别(SER)中表现出了巨大的希望。为了进一步提高各种语言和领域的SER性能,我们提出了一种新颖的方法。首先,我们收集了Emoset ++,这是一个全面的多语言,多种文化的语音情感语料库,具有37个数据集,150,907个类型,总持续时间为119.5小时。第二,我们介绍了exhubert,这是Hubert的增强版本,它是通过骨架扩展和对E Mo s et ++进行微调实现的。我们将每个编码器层及其权重填充,然后冻结第一个重复,集成了零零的线性层并跳过连接以保持功能并确保其适应性的能力,以便随后进行微调。我们在看不见的数据集上的评估显示了Exhubert的功效,为各种SER任务设定了新的基准标记。模型和有关E Mo S et ++的详细信息:https://huggingface.co/amiriparian/exhubert。索引术语:情感计算,语音情感识别,变形金刚,深度学习
蛋白质稳定性在多种应用中起着至关重要的作用,例如食物加工,治疗剂和致病突变的鉴定。工程运动企业寻求提高蛋白质稳定性,并且对简化这些过程有浓厚的兴趣,以便能够快速优化高度稳定的蛋白质,并且迭代较少。在这项工作中,我们利用巨型尺度数据集探索了为稳定性预测优化的蛋白质语言模型。ESM Therm受过训练,该培训是根据461个蛋白质结构域衍生的528K天然和从头序列的折叠稳定性训练,可以容纳缺失,插入和多点突变。我们表明,蛋白质语言模型可以进行微调以预测折叠稳定性。ESM Therm在小蛋白质结构域上合理地执行,并将其推广到训练集远端的序列。最后,我们讨论了模型的局限性,与其他最先进的方法相比,将其推广到较大的蛋白脚手架。我们的结果强调了对各种数据集上进行大规模稳定性测量的需求,该数据集反映了自然界中通常观察到的序列长度的分布。
Vision Transformer(VIT),与卷积神经网络的根本不同的架构具有多种优势,包括设计简单,鲁棒性和在许多视觉任务上的表现。然而,与卷积的旋转网络相反,视觉变压器缺乏固有的感应偏见。因此,对此类模型的成功培训主要归因于在大规模数据集上的预训练,例如具有1.2m的Imagenet或具有300m图像的JFT。这阻碍了小规模数据集的Vi-Sion变压器的直接适应。在这项工作中,我们表明可以直接从小规模数据集中学习自我监督的偏见,并作为微调的有效权重初始化方案。这允许在没有大规模预训练的情况下训练这些模型,更改模型体系结构或损失功能。我们提出了在五个小型数据集上成功训练整体石器和非孔子视觉转换器的thor outh实验,包括CIFAR10/100,CINIC10,SVHN,SVHN,Tiny-ImageNet和两个细粒度的数据集:飞机和汽车。我们的方法始终如一地提高视觉变压器的性能,同时保持其特性,例如关注显着区域和更高的鲁棒性。我们的代码和预培训模型可在以下网址获得:https://github.com/hananshafi/vits-for-small-scale-datasets。
摘要:心电图分类或心跳分类是心脏病学中极为有价值的工具。基于学习的深度技术,用于分析ECG信号的技术有助于人类专家及时诊断心脏疾病,并有助于挽救宝贵的生命。本研究旨在将ECG记录图像的数据集数字化到时间序列信号,然后在数字化数据集上应用深度学习(DL)技术。提出了将ECG信号分类为不同心脏类别的最新DL技术。多个DL模型,包括卷积神经网络(CNN),长期的短期记忆(LSTM)网络以及使用自动编码器的基于自律的学习(SSL)模型,并在本研究中进行了比较。这些模型是由来自巴基斯坦各种医疗机构的患者的ECG图产生的数据集培训。首先,将ECG图像数字化,将Lead II心跳分段,然后将数字化信号传递给了提出的分类深度学习模型。在本研究中使用的不同DL模型中,提出的CNN模型达到了约92%的最高精度。所提出的模型非常准确,并为实时和直接监视ECG信号提供了快速推断,这些ECG信号是从放置在身体不同部位上的电极(传感器)中捕获的。使用ECG信号的数字化形式而不是图像进行心律失常分类,可以使心脏病学家直接从ECG机器上直接在ECG信号上使用DL模型,以实时和准确地监视ECGS。
本文介绍了一种利用深度学习模型(特别是视觉变换器 (ViT) 模型)进行情绪分类的新方法,用于分析脑电图 (EEG) 信号。我们的研究实施了一种双特征提取方法,利用功率谱密度和差分熵来分析 SEED IV 数据集。这种方法对四种不同的情绪状态进行了详细分类。最初设计用于图像处理的 ViT 模型已成功应用于 EEG 信号分析。它表现出色,测试准确率达到 99.02%,方差很小。值得注意的是,它在这方面的表现优于 GRU、LSTM 和 CNN 等传统模型。我们的研究结果表明,ViT 模型在准确识别 EEG 数据中存在的复杂模式方面具有很高的有效性。具体而言,该模型的准确率和召回率超过 98%,而 F1 分数估计约为 98.9%。该研究的结果不仅证明了基于变压器的模型在分析认知状态方面的有效性,而且还表明它们在改善人机交互系统方面具有巨大的潜力。
3. 使用 K 最近邻 (KNN) 方法进行分析 K 最近邻 (KNN) 是一种通过考虑现有属性和训练样本来对新对象进行分类的算法。分类不需要使用模型,而仅基于记忆。在该算法中,将在查询点中搜索若干个𝐾个最近的训练点,并根据这些𝐾点中的大多数进行分类。 KNN 采用基于邻域的分类方法,通过计算查询实例到训练样本的最短距离来确定 KNN。 KNN算法对于预测新物体的分类非常简单而且有效。使用KNN方法的步骤如下: