DeepFake模型滥用构成了主要的安全性。现有的被动和主动的深层检测方法都缺乏义务和鲁棒性。在这项研究中,我们提出了一个可插入式有效的活性模型水印框架以进行深泡泡检测。这种方法促进了识别水印在各种深层生成模型中的嵌入,使当局能够轻松提取它们以进行检测。具体来说,我们的方法利用生成模型解码器中的通用卷积结构。它采用自适应水嵌入定位的结合内核稀疏性,并引入了汇总内核的归一化,以无缝地与固有模型的水印参数无缝。对于水印提取,我们基于深层检测模型共同训练水印提取器,并使用BCH编码有效地识别水印图像。最后,我们将方法应用于八种主要类型的深泡剂模型。实验表明,即使在沉重的损失通道中,我们的方法可成功地检测到平均准确性超过94%的深烟。这种方法独立于发电模型的培训,而不会影响原始模型的性能。此外,我们的模型需要培训数量非常有限的参数,并且对三种主要的自适应攻击具有弹性。可以在https://github.com/guaizao/pluggable-watermarking
现有的文本视频检索解决方案本质上是侧重于最大程度地提高条件可能性的模型,即P(候选人|查询)。虽然很简单,但这种事实上的范式却忽略了基本的数据分布p(查询),这使得识别出分布数据的挑战。为了解决这一限制,我们从生成观点创造性地解决了此任务,并将文本和视频之间的相关性建模为其关节概率P(候选人,查询)。这是通过基于扩散的文本视频检索框架(扩散-RET)来完成的,该框架将检索任务建模为从噪声中产生关节分布的过程。在训练过程中,从发电和犯罪的角度优化了Diffusionret,其发电机通过生成损失优化,并且具有对比度损失的训练的特征提取器。以这种方式,diffusionret巧妙地杠杆化了生成和歧视方法的优势。在五个常用的文本检索基准测试中进行了广泛的实验,包括MSRVTT,LSMDC,MSVD,ActivityNet字幕和DIDEMO,并具有出色的性能,证明了我们方法的效果。更加谨慎,没有任何修改,diffusionret甚至在外域检索设置中表现良好。我们认为这项工作带来了对相关领域的基本见解。代码可从https://github.com/jpthu17/diffusionret获得。
摘要 机器学习模型在准确性、计算/内存复杂度、训练时间和适应性等特性方面有所不同。例如,神经网络 (NN) 因其自动特征提取的质量而具有高精度而闻名,而受大脑启发的超维 (HD) 学习模型则以其快速训练、计算效率和适应性而闻名。这项工作提出了一种混合、协同机器学习模型,该模型在上述所有特性方面都表现出色,适用于芯片上的增量在线学习。所提出的模型包括一个 NN 和一个分类器。NN 充当特征提取器,经过专门训练,可以与采用 HD 计算框架的分类器配合良好。这项工作还提出了所述特征提取和分类组件的参数化硬件实现,同时引入了一个编译器,该编译器将任意 NN 和/或分类器映射到上述硬件。所提出的混合机器学习模型具有与 NN 相同的准确度(即 ± 1%),同时与 HD 学习模型相比,准确度至少提高了 10%。此外,与最先进的高性能 HD 学习实现相比,混合模型的端到端硬件实现可将功率效率提高 1.60 倍,同时将延迟时间缩短 2.13 倍。这些结果对于此类协同模型在具有挑战性的认知任务中的应用具有深远意义。
摘要 — 量子通信功能的集成通常需要专用的光电元件,而这与电信系统的技术路线图并不相符。我们研究了商用相干收发器子系统在经典数据传输之后支持量子随机数生成的能力,并展示了如何将基于真空涨落的量子熵源转换为真正的随机数生成器。我们讨论了两种可能的实现方式,分别基于接收器和发射器中心架构。在第一种方案中,利用相干内差接收器中的平衡同差宽带检测来测量 90 度混合输入端的真空状态。在我们的原理验证演示中,在超过 11 GHz 的宽带宽上获得了 >2 dB 的光噪声和电噪声之间的间隙。在第二种方案中,我们提出并评估了重复使用偏振复用同相/正交调制器的监测光电二极管来实现相同目的。演示了 10 Gbaud 偏振复用正交相移键控数据传输的时间交错随机数生成。详细模型的可用性将允许计算可提取的熵,因此我们展示了两个原理验证实验的随机性提取,采用了双通用强提取器。索引术语 — 数字安全、多用途光子学、光通信设备、光信号检测、随机数生成
内在语言的潜力和实用性对于开发实用的日常脑机接口 (BCI) 应用至关重要,因为它代表了一种独立于外部刺激运行的大脑信号,但由于在解读其信号方面面临挑战,它在很大程度上尚未得到充分开发。在本研究中,我们在公开可用的数据集上评估了各种机器学习 (ML) 和深度学习 (DL) 模型的行为,采用流行的预处理方法作为特征提取器来增强模型训练。我们面临着重大挑战,例如受试者相关的变异性、高噪声水平和过度拟合。为了特别解决过度拟合问题,我们建议使用“BruteExtraTree”:一种依赖于从其基础模型 ExtraTreeClassifier 继承的中等随机性的新分类器。该模型不仅在我们的实验中与最佳深度学习模型 ShallowFBCSPNet 相匹配,在主题无关场景中达到 32% 的准确率,而且在主题相关情况下达到 46.6% 的平均主题准确率,超越了最先进的模型。我们在主题相关情况下的结果显示,使用受 LLM 预训练启发的内部语音数据的新范式是可能的,但我们也强调,迫切需要彻底改变数据记录或噪声消除方法,以便在主题无关情况下实现更实际的准确率。
单一对象跟踪旨在根据不同模态引用指定的状态在视频序列中定位目标对象,包括初始边界框(Bbox),自然语言(NL)或两者(NL+Bbox)。由于不同方式之间的差距,大多数现有的轨道都是为这些参考设置的单个或部分设计而设计的,并在特定模态上过度专业化。不同,我们提出了一个称为UVLTRACK的统一跟踪器,该跟踪器可以通过相同的参数来多样地处理所有三个参考设置(Bbox,NL,NL+Bbox)。提议的UVL-Track具有多种优点。首先,我们为关节视觉和语言学习设计了一种模态统一的特征提取器,并提出了多模式的对比损失,以将视觉和语言特征对齐为统一的半偏见空间。第二,提出了一种模态自适应盒头,该盒子头完全使用目标引用,以动态地使用视频上下文,并以对比的方式区分目标,从而在不同的参考设置中实现了稳健的性能。广泛的实验结果表明,UVlTrack在七个视觉跟踪数据集,三个视觉跟踪数据集和三个视觉接地数据集上实现了承诺性能。代码和模型将在https://github.com/openspaceai/uvltrack上开源。
视觉语言(VL)模型最近取得了未经证实的成功,其中连接模块是弥合模式差距的关键。尽管如此,在大多数存在方法中,富裕的视觉线索尚未充分利用。在视觉侧,大多数现有方法仅使用视觉塔的最后一个功能,而无需使用低级功能。在语言方面,大多数现有的方法仅引入浅视力互动。在本文中,我们提出了一个视觉启发的视觉语言连接模块,称为VIVL,该模块有效利用了VL模型的视觉提示。为了利用视觉塔中的较低级别信息,引入了特征金字塔提取器(FPE),以结合不同中间层的特征,该特征将视觉提示与可忽略不计的参数和计算在头顶上。为了实现VL相互作用,我们提出了深视觉条件的提示(DVCP),可以有效地进行视觉和语言特征的深层互动。我们的VIVL超过了以前的最新方法,当时是18.1苹果酒在从头开始训练可可字幕任务,这极大地提高了数据效率。当用作插件模块时,VIVL始终提高各种骨干和VL框架的性能,在多个基准测试中提供新的最新结果,例如Nocaps和VQAV2。
人工智能 (AI) 的情绪识别是一项具有挑战性的任务。已经进行了各种各样的研究,证明了音频、图像和脑电图 (EEG) 数据在自动情绪识别中的实用性。本文提出了一种新的自动情绪识别框架,该框架利用脑电图 (EEG) 信号。所提出的方法是轻量级的,它由四个主要阶段组成,包括:再处理阶段、特征提取阶段、特征降维阶段和分类阶段。在预处理阶段使用基于离散小波变换 (DWT) 的降噪方法,在此称为多尺度主成分分析 (MSPCA),其中使用 Symlets-4 滤波器进行降噪。可调 Q 小波变换 (TQWT) 用作特征提取器。使用六种不同的统计方法进行降维。在分类步骤中,旋转森林集成 (RFE) 分类器与不同的分类算法一起使用,例如 k-最近邻 (k-NN)、支持向量机 (SVM)、人工神经网络 (ANN)、随机森林 (RF) 和四种不同类型的决策树 (DT) 算法。所提出的框架使用 RFE + SVM 实现了超过 93% 的分类准确率。结果清楚地表明,所提出的基于 TQWT 和 RFE 的情感识别框架是使用 EEG 信号进行情感识别的有效方法。
在本文中,我们提出了一种新颖的系统,该系统将实时神经反馈集成到生成 AI 的创作过程中,从而实现用户与 AI 系统之间的无缝交互。通过利用用户的认知变化,该系统可以实现持续流畅的共同创作,超越了生成 AI 工作流程中常见的传统提示式交互。我们使用脑电图 (EEG) 实现这一目标,以持续监测用户的大脑活动,然后将其作为视觉生成 AI 模型的控制信号。我们特别关注 Lempel-Ziv 复杂性,这是一种信号多样性的度量,以前与心理状态、任务参与度和现象丰富性有关。所提出的架构包括一个 EEG 特征提取器和一个生成 AI 管道,它们协同工作,根据用户的大脑活动动态改变预先存在的电影的视觉内容。这种方法为人类与 AI 之间的互动提供了一个新的复杂性和复杂性维度。未来的工作将探索更复杂的生物信号和多模式反馈的整合,旨在进一步增强具身创作体验的深度和丰富性。这项工作为将生物技术和生成式人工智能整合到新兴的自适应电影领域提供了原理证明。您可以在 youtube.com/playlist?list=PLMu36WzSQKiVeBnrUdwUAoUhqLqGX3_bw 找到包含系统运行视频插图的播放列表。
特性 天线端口的峰值功率输出 - AN/UPX-37 和 AN/UPX-41(C)、AN/UPX-45(C)、AN/UPX-50(C) 双输出 63 dBm 单组合输出 66 dBm,不包括 AN/UPX-50(C) 可调节 -9 dB,步长为 1 dB 天线端口的峰值功率输出 - AN/UPX-42(C) 双输出 65 dBm 可调节 -6 dB 占空比 最大 2.0% 接收器中心频率 1090 ±0.5 兆赫 接收器带宽 -3 dB,8 兆赫标称 灵敏度 -84 dBm 最小(Mark XII) -90 dBm 最小(Mark XIIA) 在天线端口测量到 90% 的解码 提取器仪表范围 >300 海里 电源输入配置 115 或 230 VAC,<1100 VA, 440 赫兹 尺寸 14.75 英寸宽、10.56 英寸高、18 英寸深 重量 最大 85 磅 环境高度 工作 高达 12,000 英尺 非工作 高达 50,000 英尺 温度 工作 -28 摄氏度至 +65 摄氏度 非工作 -40 摄氏度至 +75 摄氏度 冲击 MIL-S-901D 轻型设备 盐雾 48 小时暴露 湿度 90% 相对 EMC MIL-STD-461D 性能参数 容量 每次扫描 1,000 个目标 100 个光束内目标 可靠性(海军掩蔽) 基本系统 >4,000 小时 AN/UPX-41(C)、42(C)、45(C) 和 50(C) >5,000 小时 AN/UPX-37 可维护性 <20 分钟 MTTR