摘要 — 及时识别对域生成算法 (DGA) 域的 DNS 查询在减轻恶意软件传播及其潜在影响方面起着至关重要的作用,尤其是在阻止协调的僵尸网络活动方面。我们推出了 Dom2Vec,这是一种创新方法,通过利用仅从 DNS 查询中观察到的域名中派生的词典特征来快速检测 DGA 生成的域。Dom2Vec 利用词嵌入将从域名中提取的标记映射到高度富有表现力的表示中。然后将这些表示与基于声誉的域名评分系统相结合,该系统利用 n-gram 与白名单域列表相关的共现频率。域嵌入、声誉分数和从域名派生的其他有意义的词典特征的融合为 AI/ML 驱动的 DGA 检测提供了强大的域名表示。通过对包含 25 个不同 DGA 域系列的数据集进行实验评估,我们证明 Dom2Vec 明显优于当前最先进的 DGA 检测和分析方法,将我们之前基于信誉评分的检测系统提高了至少 30%,误报率低于 1%。索引术语 —DGA 检测、Word2Vec、TF-IDF、n-gram、词典分析、DNS、机器学习。
X 射线反射率 (XRR) 被广泛用于研究硬质和软质凝聚态材料的表面和界面,包括二维材料、纳米材料和生物系统。它能够以亚埃的精度推导出材料表面区域沿法线的横向平均电子密度分布。[4–6] 这有助于确定各种参数,包括表面粗糙度、单层或多层材料的结构以及毛细波对液体表面的影响。高亮度同步加速器 X 射线束能够在环境条件下实时在分子水平上分辨材料结构,而其他表面敏感实验技术几乎无法做到这一点。[7] 此类实验的例子是使用专用设备和样品池研究液体表面和界面。[8–11] 然而,存在与液体 XRR 相关的特殊问题。液体和支撑物之间的润湿角会导致样品液体弯曲,这通常会使数据分析复杂化。 [12] 这个问题可以通过利用能够处理大面积样品的样品环境来解决,例如朗缪尔槽 [13] 应用特殊的数据处理方法 [12,14] 或使用 X 射线纳米束。 [15] 然而,在某些情况下,可以充分利用样品曲率,例如 Festersen 等人 [15] 使用宽平行同步加速器光束“一次性”记录 XRR 曲线,但散射矢量 q 的范围有限。 专用于原位和/或原位 XRR 研究的样品环境 [16] 的最新发展开辟了新的机遇,例如,通过化学气相沉积 (CVD) 研究在液态金属催化剂 (LMCats) 上生长 2D 材料的过程。 [17] 这些系统有望生长高质量的材料 [18] 但同时,对实验的要求很高。 [19] 它们必须适应高操作温度、高材料蒸发以及在大气压下暴露于反应气体混合物。此外,它们还局限于有限尺寸的样本
Niklas F.C. Hummel,1,2,3,4 Kasey Markel,1,2,3 Jordan Stefani,5 Max V. Staller,5,6,7 *和Patrick M. Shih 1,2,2,2,3,3,8,9,9,9, * 1工厂和微生物系,加利福尼亚大学,伯克利大学,CA 94720,CA 94720,USAD CACTUTTE 94608,美国3美国3环境基因组学和系统生物学部,劳伦斯·伯克利国家实验室,伯克利,CA 94720,美国4美国4号生物学系,Technische Universit,Darmstadt,64287 Darmstadt,DARMSTADT,DARMSTADT,DEMANY DEMANY,DEMANY 5 MATILIA of CALICALIA of CALICATION of CALICATIA美国伯克利,加利福尼亚州94720,美国7 Chan Zuckerberg Biohub-San Francisco,旧金山,CA 9415,美国8 Innovative Genomics Institute,加利福尼亚大学,伯克利分校,CA 94720,美国94720,美国9铅联系 *通讯 ),pmshih@berkeley.edu(p.m.s.) https://doi.org/10.1016/j.cels.2024.05.007Niklas F.C.Hummel,1,2,3,4 Kasey Markel,1,2,3 Jordan Stefani,5 Max V. Staller,5,6,7 *和Patrick M. Shih 1,2,2,2,3,3,8,9,9,9, * 1工厂和微生物系,加利福尼亚大学,伯克利大学,CA 94720,CA 94720,USAD CACTUTTE 94608,美国3美国3环境基因组学和系统生物学部,劳伦斯·伯克利国家实验室,伯克利,CA 94720,美国4美国4号生物学系,Technische Universit,Darmstadt,64287 Darmstadt,DARMSTADT,DARMSTADT,DEMANY DEMANY,DEMANY 5 MATILIA of CALICALIA of CALICATION of CALICATIA美国伯克利,加利福尼亚州94720,美国7 Chan Zuckerberg Biohub-San Francisco,旧金山,CA 9415,美国8 Innovative Genomics Institute,加利福尼亚大学,伯克利分校,CA 94720,美国94720,美国9铅联系 *通讯),pmshih@berkeley.edu(p.m.s.)https://doi.org/10.1016/j.cels.2024.05.007
摘要:神经网络在关键任务中起着至关重要的作用,其中错误的产出可能会带来严重的后果。传统上,神经网络的验证重点是评估其在大量输入点上的性能,以确保所需的输出。但是,由于输入空间的几乎无限基数,详尽检查所有可能的输入变得不切实际。在广泛的输入样本上表现出强大性能的网络可能无法在新颖的情况下正确概括,并且仍然容易受到对抗性攻击的影响。本文介绍了神经网络鲁棒性的一般管道,并概述了不同的领域,这些领域共同努力,以实现鲁棒性保证。这些领域包括评估针对对抗性攻击的鲁棒性,正式评估鲁棒性并应用防御技术以增强模型时的鲁棒性。
视觉提问(VQA)是用户体验的关键,尤其是在改善视觉语言模型(VLMS)的概括能力之后。但在实际设置中使用标准化框架评估应用程序要求的VLM仍然具有挑战性。本文旨在使用端到端框架解决该问题。我们提出VQA360 - 一种源自估计的VQA基准测试的新型数据集,该数据集用任务类型,应用程序域和知识类型注释,以进行全面评估。我们还引入了Goeval,这是一种使用GPT-4O开发的多模式评估度量,与Human判断相关系数为56.71%。我们使用状态VLMS的实验表明,没有任何单个模型都普遍擅长,因此,将正确的选择成为关键的设计决策。专有模型(例如Gemini-1.5-Pro和GPT-4O-Mini)通常优于其他模型,但是诸如InternVL-2-8B和COGVLM-2-LALAMA-3-19B之类的开源模型也表现出竞争优势,同时提供了其他优势。我们的框架工作也可以扩展到其他任务1。
Niklas F.C. Hummel,1,2,3,4 Kasey Markel,1,2,3 Jordan Stefani,5 Max V. Staller,5,6,7 *和Patrick M. Shih 1,2,2,2,3,3,8,9,9,9, * 1工厂和微生物系,加利福尼亚大学,伯克利大学,CA 94720,CA 94720,USAD CACTUTTE 94608,美国3美国3环境基因组学和系统生物学部,劳伦斯·伯克利国家实验室,伯克利,CA 94720,美国4美国4号生物学系,Technische Universit,Darmstadt,64287 Darmstadt,DARMSTADT,DARMSTADT,DEMANY DEMANY,DEMANY 5 MATILIA of CALICALIA of CALICATION of CALICATIA美国伯克利,加利福尼亚州94720,美国7 Chan Zuckerberg Biohub-San Francisco,旧金山,CA 9415,美国8 Innovative Genomics Institute,加利福尼亚大学,伯克利分校,CA 94720,美国94720,美国9铅联系 *通讯 ),pmshih@berkeley.edu(p.m.s.) https://doi.org/10.1016/j.cels.2024.05.007Niklas F.C.Hummel,1,2,3,4 Kasey Markel,1,2,3 Jordan Stefani,5 Max V. Staller,5,6,7 *和Patrick M. Shih 1,2,2,2,3,3,8,9,9,9, * 1工厂和微生物系,加利福尼亚大学,伯克利大学,CA 94720,CA 94720,USAD CACTUTTE 94608,美国3美国3环境基因组学和系统生物学部,劳伦斯·伯克利国家实验室,伯克利,CA 94720,美国4美国4号生物学系,Technische Universit,Darmstadt,64287 Darmstadt,DARMSTADT,DARMSTADT,DEMANY DEMANY,DEMANY 5 MATILIA of CALICALIA of CALICATION of CALICATIA美国伯克利,加利福尼亚州94720,美国7 Chan Zuckerberg Biohub-San Francisco,旧金山,CA 9415,美国8 Innovative Genomics Institute,加利福尼亚大学,伯克利分校,CA 94720,美国94720,美国9铅联系 *通讯),pmshih@berkeley.edu(p.m.s.)https://doi.org/10.1016/j.cels.2024.05.007
抽象最近的工作与剪接体组件U2AF35的两个锌指(ZnF)的点突变与恶性转化有关。然而,令人惊讶的是,对U2AF35 ZNF域的功能知之甚少。在这里,我们分析了哺乳动物U2AF35的ZNF域及其旁系同源物U2AF26的关键功能。两个ZNF都是剪接调节所必需的,而仅ZNF2控制蛋白质稳定性,并有助于与U2AF65的相互作用。这些特征在缺乏ZnF2的U2AF26的自然存在的剪接变体中得到了证实,该变体在激活原代小鼠T细胞时强烈诱导并局部位于细胞质中。在模型T细胞系中使用Ribo-Seq我们为U2AF26在激活基因表达中的细胞质步骤中的作用提供了证据,尤其是翻译。一致地,MS2绑定测定法表明,当定位于模型mRNA的5 rtr时,细胞质U2AF26/35增加了翻译。该法规部分取决于Znf1,因此在核心剪接因子,ZNF域和翻译调节之间提供了联系。总的来说,我们的工作揭示了U2AF26/35及其ZNF领域的意外功能,从而有助于更好地理解其在哺乳动物细胞中的作用和调节。
X射线反射率(XRR)被广泛用于研究硬和软凝结物质材料的表面和界面,包括2D材料,纳米材料和生物系统。它允许沿其正常的横向平均电子密度曲线沿其正态分子延伸,并具有子角度的精度。[4-6]这有助于确定各种参数,包括表面粗糙度,单层或多层材料的结构以及毛细血管对液体表面的影响。高毛利率同步X射线束可以在环境条件下实时解决分子水平的材料结构,而其他表面敏感的实验技术几乎无法访问。[7]此类实验的示例是使用专用设备和样品单元的液体表面和界面进行研究。[8–11]但是,与液体的XRR相关的特定问题。液体和支撑之间的润湿角会引起样品液体的曲率,这通常使数据分析复杂化。[12]可以通过利用能够使用大面积样品(例如Langmuir槽,[13])使用特殊数据处理方法的样本环境来解决此问题。[15]但是,在某些情况下,可以有利地利用样品曲率,例如Festersen等。[15]使用宽平行的合成光束将XRR曲线记录在“一击”中,但在散射矢量q的范围内有限。[17]这些系统正在促进高质量材料的生长[18],但同时在实验上可能非常苛刻。最新的样本环境的发展[16]发表于原位和/或操作XRR研究开放了新的机会,例如,通过化学蒸气沉积(CVD)对2D材料在液态金属催化剂(LMCAT)上的生长过程中对2D材料进行了研究。[19]必须适应高运行温度,高材料蒸发以及在大气压下暴露于反应性气体的混合物中。此外,它们仅限于有限尺寸的样本
摘要:学者和从业者最近开始在探索不同领域的新兴研究趋势时重点关注人工智能 (AI) 和大数据分析 (BDA)。文献计量综述技术已广泛应用于 AI 和 BDA 文献,以绘制现有的学术成果。我们总结了 711 篇关于 AI 及其子集和 BDA 的文献计量文章,这些文章发表在多个领域,以确定具有重大研究贡献的学科。我们从 Scopus Q1 和 Q2 期刊数据库中提取了 2012 年至 2022 年期间发表的文献计量综述论文。Scopus 数据库返回了来自 59 个国家/地区不同学科期刊上发表的 711 篇文献,平均每年被引用 17.9 次。我们使用多种软件和数据库分析器来调查数据,并展示最活跃的科学文献计量指标,例如作者和合著者、引文、共同引用、国家、机构、期刊来源和学科领域。美国是最具影响力的国家(101 篇文献;5405 次引用),而中国是产量最高的国家(204 篇文献;2371 次引用)。产量最高的机构是印度共生国际大学(32 篇文献;4.5%)。结果显示,五个学科集群的文献计量评论大幅增加:(a)商业与管理、(b)工程与建筑、(c)医疗保健、(d)可持续运营与 I4.0 和(e)旅游与酒店研究,其中大多数研究 AI 和 BDA 的应用和用例,以解决该领域的实际问题。过去文献计量分析中的关键词共现表明,BDA、AI、机器学习、深度学习、NLP、模糊逻辑和专家系统仍将是这五个不同领域集群中引人注目的研究领域。因此,本文总结了商业、工程、医疗保健、可持续运营和酒店旅游领域对 AI 和 BDA 的文献计量评论,并为对这些主题感兴趣的新手和经验丰富的研究人员提供了一个起点。
近年来,人工智能 (AI) 系统的参与式设计 (PD) 在私营和公共部门的多个应用领域越来越受欢迎。参与式设计方法广泛地使不同背景的利益相关者能够为人工智能的新用例和直接影响人们生活的基于人工智能的技术的设计提供信息。这种参与对于减轻人工智能对社会日益明显的不利影响以及追求更积极的影响(尤其是对弱势群体)至关重要。该小组汇集了在不同学科领域进行过或正在进行人工智能系统参与式设计的研究人员。小组的目标是阐明参与式设计方法如何以实用和有意义的方式应用于人工智能系统的异同、成功和挑战。该小组为人机交互研究界提供了一个机会,让他们共同反思人工智能参与式设计促进利益相关者之间合作的机会,以及参与式人工智能设计的持续挑战。