摘要:无人机因其大小和工作量各不相同而广泛用于各种应用,例如监视、导航、在自主农业系统中喷洒农药、各种军事服务等。然而,携带有害物体的恶意无人机经常被用来侵入禁区并袭击关键公共场所。因此,及时发现恶意无人机可以防止潜在的危害。本文提出了一种基于视觉变换器 (ViT) 的框架来区分无人机和恶意无人机。在提出的基于 ViT 的模型中,无人机图像被分割成固定大小的块;然后,应用线性嵌入和位置嵌入,最终将得到的向量序列输入到标准 ViT 编码器。在分类过程中,使用与序列相关的额外可学习分类标记。将提出的框架与几个手工制作的深度卷积神经网络 (D-CNN) 进行了比较,结果表明,提出的模型的准确率达到了 98.3%,优于各种手工制作的和 D-CNN 模型。此外,通过将所提出的模型与现有的最先进的无人机检测方法进行比较,证明了所提出的模型的优越性。
药物研发是一个复杂的过程,具有研究周期长、成本高、成功率低的风险。一种新药从研发到批准需要数十亿美元和十多年的时间。1,2有效预测药物 - 靶标结合率(DTA)是药物研发中的重要问题之一。3 – 5药物通常表示为从简化分子输入线输入系统(SMILES)6获得的字符串,或用以原子为节点、化学键为边的分子图表示。靶标(或蛋白质)是氨基酸序列。结合率表示药物 - 靶标对相互作用的强度。通过结合,药物可以对蛋白质所执行的功能产生积极或消极的影响,从而影响疾病状况。 7 通过了解药物-靶标结合力,有可能找出能够抑制靶标/蛋白质的候选药物,并有利于许多其他生物信息学应用。8,9
视觉语言(VL)模型已获得了显着的重点,从而在多模式推理方面取得了显着进步。这些体系结构通常包括视觉编码器,大型语言模型(LLM)和一个将视觉特征与LLM的代表空间保持一致的投影模块。尽管他们成功了,但仍然存在一个关键的限制:愿景编码过程仍然与用户查询相关,通常是以与图像相关的问题的形式。因此,所得的视觉特征可能无法最佳地调整图像的特定元素。为了解决这个问题,我们介绍了QA-Vit,这是一种问题的多模式原因,这是一种问题,将问题意识直接嵌入到视觉编码器中。此集成导致动态视觉特征,重点是提出问题的相关图像方面。QA-VIT是模型 - 静态的,并且可以有效地将其置于任何VL体系结构中。广泛的经验证明了将我们的方法应用于各种多模式体系结构的有效性,从而导致跨不同任务的一致改进,并展示了其以增强视觉和场景文本理解的能力。
Vision Transformers(VIT)已成为代表学习中最新的架构,利用自我注意的机制在各种任务中脱颖而出。vits将图像分为固定尺寸的补丁,将其限制为预定义的大小,并需要进行预处理步骤,例如调整大小,填充或裁剪。这在医学成像中构成了挑战,尤其是在肿瘤等不规则形状的结构中。一个固定的边界盒子量产生的输入图像具有高度可变的前景与地面比率。进行医学图像可以降低信息并引入人工制品,从而影响诊断。因此,对感兴趣区域的裁缝量化作物可以增强特征代表能力。此外,大图像在计算上是昂贵的,尺寸较小,风险信息损失,表现出计算准确性的权衡。我们提出了Varivit,这是一种改进的VIT模型,该模型制定了用于处理可变图像尺寸的同时保持连贯的贴片大小。varivit采用新颖的位置嵌入调整大小方案,用于可变数量的斑块。我们还将在变量内实施一种新的批处理策略,以降低计算复杂性,从而导致更快的培训和推理时间。在我们对两个3D脑MRI数据集的评估中,变量超过了胶质瘤基因型预测和脑肿瘤分类中的香草vits和重新连接。它的F1得分分别为75.5%和76.3%,学习了更多的判别特征。与常规体系结构相比,我们提出的批处理策略将计算时间最多减少了30%。这些发现强调了图像表示学习中变量的功效。关键字:视觉变压器,建筑,表示,肿瘤分类
可配置逻辑设置、PLC 或远程控制是一种用于实际过程的数字计算机。PLC 用于许多行业和机械。与通用计算机不同,PLC 专为多输入而设计,还具有用于疏散、扩展温度、电噪声传输和抗振动冲击的布置。PLC 是一个困难的实时程序的例子,因为输出必须在有限的时间内响应孵化条件而产生,否则将发生意外操作。通过将负载发送到现有变压器的速率之上,无论是两个或多个变压器与现有变压器并联连接。开关并联连接,其中一个修改的负载超过其容量。可靠性随着性能的提高而提高,而不是拥有一个大型单元。当两个变压器并联连接时,存储空间的相关成本是小事。安装另一个变压器通常经济实惠,同样用一个更大的单元替换现有的变压器。两个并联单元的收敛状态下的其余单元的成本也低于主转换器的成本。此外,当然你最好有一个平等的转换器,因为他是忠实的。为此,至少部分负载可以由单个变压器输出电压提供。在这个项目中,我们创建了一个能够分配多个已安装负载源的系统。它是关于增加负载自动添加以下新电源变压器也将工作如果可能的话,减速负载源将自动切断。有三个修饰符在此项目中充当源。第一次,第一个变压器处于工作状态,并将保持其继续提供的状态。第二个转换器将自动执行它的角色,当发生任何损坏错误或当负载容量再次中断时,第一个将被删除。现在再举一个例子,想象第一个变压器再次工作,当负载变得高于平均电压时,2个变压器将自动执行添加到电路中,其他后续负载源将被添加,相反,当负载减少时,变压器将被移除。整个程序通过PLC完全运行。根据我们的要求,我们将发布一个 PLC,它将能够自动更改变压器周期,您将使用它们。电力分配起着非常重要的作用。因为它每天 24/7 工作并将负载馈送到不同的应用,但在某些情况下,变压器的负载会因过载而突然增加。这可能会损坏变压器。这项工作的主要目的是通过应用此方案为能源消费者提供不间断的弱电供应,我们试图避免变压器出现问题。
摘要 — 在三相四线低压配电系统中,不平衡负载会导致中性电流 (NC) 形成环路,从而导致功率损耗增加和中性电位变化。与传统电力变压器相比,智能变压器 (ST) 具有严格的电流限制以避免过流。然而,其在下游低压电网电压调节方面的优势可以提供调节过度 NC 的能力。本文提出了一种闭环 NC 优化控制,一方面,在满足标准 EN 50160 要求的正常运行中最小化 NC 电流,另一方面,在极端情况下抑制 NC 电流以避免 ST 过流损坏。根据曼彻斯特地区三相四线配电网,通过硬件在环设置和基于不平衡负载曲线下的 350kVA、10kV/400V、ST 供电配电网的案例研究,通过实验测试验证了所提出的控制策略。结果清楚地证明了所提出的NC优化控制策略对NC抑制和最小化的有效性和灵活性。
大学,Fayoum,埃及sn1279@fayoum.edu.eg摘要:技术始终是一把双刃剑,随着技术的惊人进步,预计深层效果问题将变得更加普遍和严重。 DeepFake最近造成了很多麻烦,因为它的缺陷大于其优势。 由于Divake对个人的欺骗,原则的不稳定和证据的伪造具有如此重大的影响。 而不是仅仅影响人,而是导致了多次影响整个国家形象的事件。 在本文中,该模型旨在通过检测人们的照片和视频的改变来减轻深层效果并保持个人声誉的负面影响。 具有集成视觉变压器体系结构的模型深入量和交叉vit旨在处理FF ++数据集的预提取面。 该模型从两种不同的角度区分了真实面孔和虚假面孔,每种操作方法的子类检测以及所有类型的总体检测。 所提出的模型取得了出色的结果,并且在面部策略操纵方法中的准确性最高,为98%。 关键字:DeepFake分类,特征图,补丁提取和嵌入,注意力层,视觉变压器。大学,Fayoum,埃及sn1279@fayoum.edu.eg摘要:技术始终是一把双刃剑,随着技术的惊人进步,预计深层效果问题将变得更加普遍和严重。DeepFake最近造成了很多麻烦,因为它的缺陷大于其优势。由于Divake对个人的欺骗,原则的不稳定和证据的伪造具有如此重大的影响。而不是仅仅影响人,而是导致了多次影响整个国家形象的事件。在本文中,该模型旨在通过检测人们的照片和视频的改变来减轻深层效果并保持个人声誉的负面影响。具有集成视觉变压器体系结构的模型深入量和交叉vit旨在处理FF ++数据集的预提取面。该模型从两种不同的角度区分了真实面孔和虚假面孔,每种操作方法的子类检测以及所有类型的总体检测。所提出的模型取得了出色的结果,并且在面部策略操纵方法中的准确性最高,为98%。关键字:DeepFake分类,特征图,补丁提取和嵌入,注意力层,视觉变压器。
Vision Transformer(VIT),与卷积神经网络的根本不同的架构具有多种优势,包括设计简单,鲁棒性和在许多视觉任务上的表现。然而,与卷积的旋转网络相反,视觉变压器缺乏固有的感应偏见。因此,对此类模型的成功培训主要归因于在大规模数据集上的预训练,例如具有1.2m的Imagenet或具有300m图像的JFT。这阻碍了小规模数据集的Vi-Sion变压器的直接适应。在这项工作中,我们表明可以直接从小规模数据集中学习自我监督的偏见,并作为微调的有效权重初始化方案。这允许在没有大规模预训练的情况下训练这些模型,更改模型体系结构或损失功能。我们提出了在五个小型数据集上成功训练整体石器和非孔子视觉转换器的thor outh实验,包括CIFAR10/100,CINIC10,SVHN,SVHN,Tiny-ImageNet和两个细粒度的数据集:飞机和汽车。我们的方法始终如一地提高视觉变压器的性能,同时保持其特性,例如关注显着区域和更高的鲁棒性。我们的代码和预培训模型可在以下网址获得:https://github.com/hananshafi/vits-for-small-scale-datasets。
LIDAR UPSMPLING对于机器人和自动驾驶汽车的启示系统来说是一项艰巨的任务,这是由于大型场景的稀疏结构稀疏和不规则的结构。最近的作品建议通过将LIDAR数据从3D欧几里得空间传播到2D图像空间中的一个超级分辨率问题来解决此问题。尽管他们的方法可以生成具有细粒细节的高分辨率范围图像,但由此产生的3D点云是10个模糊细节并预测无效的点。在此pa-per中,我们提出了郁金香,这是一种从低分辨率激光雷达输入中重建高分辨率激光圈云的新方法。我们还遵循一种基于图像的方法,但特定地修改了基于Swin-Transformer网络的贴片和窗口几何形状,以更好地拟合范围图像的特性。我们在三个公共现实世界和模拟数据集上进行了几项实验。郁金香在所有相关指标中都优于最先进的方法,并且比以前的工作生成了强大,更现实的点云。该代码可在https://github.com/ethz-asl/tulip.git上找到。
摘要机器学习资源的可访问性最近提高导致许多人探索音乐生成中的机器学习方法。一个机器学习的子领域,人们的受欢迎程度特别显着,是深度学习。但是,该场中的许多模型应用组合仍然未开发。在本文中,研究了序列变压器模型为现有仪器轨道生成互补仪器轨道的序列。该模型已实施和分析,以评估它是否能够生成与原始作品一起制造连贯音乐的乐器轨道。尽管生成的实现模型的结果不足以适合任何现实生活中的应用,但如果使用了更多资源并进行了更多的研究,则发现该模型对此类应用的可行性的指示。
