摘要 - 以各种内容,编辑样式和工件为特征的短形式视频的兴起,对基于学习的盲目视频质量评估(BVQA)模型构成了重大挑战。多模式大型语言模型(MLLM)以其出色的概括能力而闻名,提出了有希望的解决方案。本文的重点是有效利用预定的MLLM进行短形式视频质量评估,预处理和响应变异性的影响,以及将MLLM与BVQA模型相结合的见解。我们首先研究了框架预处理和采样技术如何影响MLLM的性能。然后,我们引入了一种基于轻量学习的集合方法,该方法可适应从MLLM和最先进的BVQA模型中进行预测。我们的结果表明,通过提出的集合方法表现出了优越的概括。此外,对内容感知的集合权重的分析强调,某些视频特征并未完全由现有的BVQA模型完全代表,从而揭示了潜在的方向以进一步改善BVQA模型。索引术语 - 视频质量评估,短形式视频,多模式大语模型,内容吸引合奏
摘要 - 自主驾驶的基于深度学习的轨迹预测模型通常会在概括到分布(OOD)方案的概括中遇到困难,有时表现比简单的基于规则的模型差。为了解决这一限制,我们提出了一个新颖的框架,自适应预测集合(APE),该集合整合了深度学习和基于规则的预测专家。学习的路由功能,与深度学习模型同时训练,根据输入方案动态选择最可靠的预测。我们在大规模数据集上进行的实验,包括Waymo Open Motion Datat(WOMD)和Argoverse,证明了整个数据集的零射击概括的改进。我们表明,我们的方法的表现优于单个预测模型和其他变体,尤其是在具有很高比例的OOD数据的长音预测和场景中。这项工作强调了混合方法在自主驾驶中进行鲁棒和可推广的运动预测的潜力。更多详细信息可以在项目页面上找到:https://sites.google.com/view/ ape-generalization。
1 Utrecht University, Institute for Marine and Atmospheric Research, Princetonplein 5, 3584 CC Utrecht, Netherlands 2 Mediterranean Institute of Advanced Studies (IMEDEA, UIB-CSIC), Esporles, Spain 3 Utrecht University, Debye Institute for Nanomaterials Science & Institute for Sustainable and Circular Chemistry, Inorganic Chemistry and Catalysis,荷兰荷兰UTRECHT USITEITITITSWEG 99,3584 CG UTRECHT,GRENOBLE ALPES,CNRS,INRAE,IRD,IRD,GRENOBLE INP,INP INP,INTITUT desgésosciencesde l'evournornement(Ige)
1970年代后期我在达尔豪西大学(Dalhousie University)的研究生时,我与研究生Rob Douglas和我们的博士学位一起工作。顾问格雷厄姆·戈达德(Graham Goddard)关于LTP的协会性能在通往齿状回的穿孔途径中。我们发现合作/协会的故事(McNaughton,Douglas和Goddard 1978)已经叙述(McNaughton 2003)。那时,唐纳德·赫布(Donald Hebb)是达尔豪西(Dalhousie)的名誉教授,在2003年的论文结束时,我描述了赫布(Hebb)对他对突触关联性的想法的回应表明,他对我的建议是正确的,如果我对他的互联阶段和阶段相互融合,那么他对我的建议是更重要的。研究记忆的神经基础。
现代科学和社会中大多数问题的极端复杂性对我们最好的理论和计算方法提出了非常巨大的挑战。作为一个例子,即使是最强大的超级计算机,也可以基于流动运动方程的直接模拟来预测行星尺度上天气的任务前面的Exascale操作(每秒10亿个流量点操作)。此外,这个和类似的问题通常受到影响解决方案的初始数据和其他参数引起的各种不确定性来源。因此,每个案例研究都需要几个实现,以积累足够的统计信息(集合模拟),从而进一步加强了对计算能力的追求。鉴于电子计算机面临着非常严格的能量限制,因此不断寻求替代模拟策略。在过去的十年中,巨大的效果已经专门用于量子计算机的开发,使用能够利用量子系统同时占据众多状态的硬件设备(量子纠缠)。直接优势是,量子系统原则上可以执行多种并行量子计算,而不是只能在二元状态下运行的经典计算机(位)。最近,没有一天没有
摘要 - 目的:基于脑电图(EEG)的脑部计算机界面(BCI)可以在人脑和计算机之间进行直接通信。由于脑电图信号的个体差异和非平稳性,此类BCI通常需要在每次使用之前进行特定于特定的校准会话,这是耗时且用户不友好的。转移学习(TL)已提议缩短或消除此校准,但现有的TL方法主要考虑使用局部设置,在此设置中,所有未标记的EEG试验都来自新用户。方法:本文提出了测试时间信息最大化集合(T-Time),以适应最具挑战性的在线TL方案,其中未标记的新用户的脑电图数据列入流中,并立即执行分类。T时间从对齐的源数据中初始化多个分类器。当未标记的测试EEG试验到达时,首先使用集合学习预测其标签,然后通过条件性熵最小化和自适应边缘分布正则正规化来更新每个分类器。我们的代码已公开。结果:基于三个公共运动图像的BCI数据集进行的广泛实验表明,Time Over-Ever-Ever-Ever-Ever-Over大约20种经典和最先进的TL方法。明显:据我们所知,这是基于无校准的EEG BCIS的测试时间适应的第一项工作,使插件的BCIS成为可能。
类失衡。不平衡的数据集可以使机器学习模型偏向多数级别,从而影响了他们准确预测少数类别的能力[24]。数据不平衡的问题通常与错误分类的问题有关,在这些问题中,与多数类相比,少数类别往往会被错误分类[25]。可以通过减小或过度采样来减少问题,从而产生类平衡的数据。合成的少数群体过度采样技术(SMOTE)是一种非常流行的过采样方法,旨在改善随机的过度采样[26]。根据Batista等人[25],过度采样方法比未经少采样方法给出了更好的结果。当数据高度不平衡时,多数族裔和少数族裔之间的显着差异可以通过过度采样方法来处理。通过添加或删除数据集中的样本,可以解决不平衡的类分布问题[27]。
摘要 - 随着网络犯罪的发展越来越多,智能网络入侵检测系统(NIDS)的存在在网络基础架构中是必不可少的。此外,还有许多挑战面临基于人工智能的NID设计,例如网络流量中的无关功能,罕见的恶意流量示例以及机器学习模型选择和模型的Mypermeters finetuning的努力。这项研究提出了与这些挑战有关的有效NID,以准确检测恶意行为。首先,一种并行混合特征选择方法过滤了最重要的功能。第二,为了解决数据不平衡,我们集成了一项合并的随机下采样策略和合成少数民族过采样技术 - 编辑了最近的邻居技术,以确保对少数派攻击的平衡表示。最后,堆叠的集合分类器包括通过自动化机器学习方法选择的四种最佳基本模型。使用CICIDS2017数据集(用于入侵检测研究的综合基准),我们的方法达到了令人印象深刻的99.76%的令人印象深刻的检测率,从而有效地识别了多数族裔和少数类别。索引术语 - 开为单位,异常检测器,最佳特征选择,不平衡数据集,SMOTE,集合分类器。
粘土鸽子纯粹是出于偶然的 - 在我在Washu的最后一个学期中,这是一个冲动的决定,要参加“构图研讨会”课程,看看我是否可以写自己的音乐。我在560的地下室度过了许多晚上,试图从马林巴和颤音中汲取灵感,以及我在计算机前的更多夜晚试图将脱节的段拼凑在一起。每周,我将半熟的作品带到我的克里斯托弗·史塔克(Christopher Stark)教授那里,以获得一些急需的指导。随着音乐的形状,克里斯经常注意到我在想法之间切换得太快的倾向,而不给每个人都有足够的时间发展自己的时间。我不得不更多地扩展音乐短语,让他们呼吸,然后再进入下一个。克里斯终于将此建议最终导致一个隐喻,我永远不会忘记:“将音乐视为热气球。您必须让它缓慢而轻轻地着陆。您不能只是将其从天上射出。”
摘要 - 传统的推荐系统遭受概念漂移的困扰 - 一种假定用户偏好随着时间而言是静态的现象。为了解决此问题,需要使用推荐算法来考虑用户偏好的时间敏感变化并提供相关建议。这项研究工作提出了一个基于合奏的混合推荐系统,该系统结合了用户兴趣的时间变化。提出的系统结合了不同的算法,例如受欢迎程度,聚类,协作矩阵分解和奇异价值分解(SVD)。然后,使用人工神经网络(ANN)将从这些单个模型获得的电影建议合并并分类。用户对提出的建议的反馈,这有助于计算每批建议的相关因素。最后,向用户提供了相关的电影建议。在相关因素较低的情况下,建议将重新分类。提议的系统的目的是根据用户的时间敏感偏好为用户提供各种建议。提出的研究的新颖性是整合了普遍的建议策略以及用户反馈机制在提出的建议中的结合。所提出的系统是在标准电影数据集Movielens-25m上实现的,并使用RMSE和MAE等统计性能指标进行评估。这项工作说明了建议质量的提高以及对改变用户偏好的适应性。实验表明,将人工神经网络作为集合混合建议模型的分类器的整合在提供0.56和0.43作为RMSE和MAE值的相关建议方面表明了有希望的结果。