Kaleido Diffusion: Improving Conditional Diffusion Models with Autoregressive Latent Modeling
扩散模型已成为从文本描述生成高质量图像的强大工具。尽管这些模型取得了成功,但它们在采样图像中通常表现出有限的多样性,尤其是在使用高无分类器指导权重进行采样时。为了解决这个问题,我们提出了 Kaleido,这是一种通过结合自回归潜在先验来增强样本多样性的新方法。Kaleido 集成了一个自回归语言模型,该模型对原始标题进行编码并生成潜在变量,作为抽象和中间表示……
Tickling makes us laugh differently
我们被挠痒痒时笑的方式是独一无二的,机器和人类通常都能分辨出其中的差异。研究人员从近 900 个与挠痒痒、看有趣的东西、看到别人的不幸或听到笑话有关的笑声片段中提取了声音成分,并利用这些成分来训练和测试机器学习分类器。分类器最擅长识别挠痒笑,人类听众也是如此。超过 200 名参与者听了 30 个剪辑,正确识别出挠痒笑的几率超过 60%,而第二组听众认为这种笑声听起来不太受控制。
Random Forest, Explained: A Visual Guide with Code Examples
集成学习使用随机树进行复杂的预测决策树分类器说明:带有代码示例的可视化指南,适合初学者决策树是机器学习的一个很好的起点 — — 它们清晰且有意义。但有一个问题:它们在处理新数据时往往效果不佳。预测可能不一致且不可靠,这在您尝试构建有用的东西时是一个真正的问题。这就是随机森林的用武之地。它吸收了决策树的优点,并通过将多棵树组合在一起使它们更好地工作。它已成为许多数据科学家最喜欢的工具,因为它既有效又实用。让我们看看随机森林是如何工作的,以及为什么它可能正是您下一个项目所需要的。现在是时候停止迷失在树木中,看看森林的真面目了 — — 这是您在机器学习中的下一个可靠工具。所有视觉效果:作者使用 Ca
Zero-Shot Localization with CLIP-Style Encoders
我们如何才能看到视觉编码器所看到的内容?Stephan Widua 在 Unsplash 上的照片想想您最喜欢的预训练视觉编码器。我假设您选择了 CNN(卷积神经网络)或 ViT(视觉变换器)的某种变体。编码器是将图像映射到 d 维向量空间的函数。在此过程中,图像被转换为特征图序列:作者提供的图片。特征图 (w × h × k) 可以被认为是收集的 k 维补丁嵌入的 2D 数组,或者等效地,具有 k 个通道 f₁, … fₖ 的粗略图像 (w × h)。CNN 和 ViT 都以各自的方式将输入图像转换为特征图序列。当图像穿过其层时,我们如何才能看到视觉编码器所看到的内容?零样本定位方法旨在
Gaussian Naive Bayes, Explained: A Visual Guide with Code Examples for Beginners
分类算法钟形假设以获得更好的预测⛳️ 更多分类算法,解释:· 虚拟分类器 · K 最近邻分类器 · 伯努利朴素贝叶斯 ▶ 高斯朴素贝叶斯 · 决策树分类器 · 逻辑回归 · 支持向量分类器 · 多层感知器(即将推出!)基于我们之前关于处理二进制数据的伯努利朴素贝叶斯的文章,我们现在探索用于连续数据的高斯朴素贝叶斯。与二元方法不同,该算法假设每个特征都服从正态(高斯)分布。在这里,我们将看到高斯朴素贝叶斯如何处理连续的钟形数据(产生准确的预测),而无需深入研究贝叶斯定理的复杂数学。所有视觉效果:作者使用 Canva Pro 创建。针对移动设备进行了优化;在桌面上可能显得过大。定义与其他朴素贝叶斯
摘要:自动对建成基础设施进行分类是全球规划的需要。然而,单个指标存在弱点,包括与裸地光谱混淆,并且深度学习的计算要求很高。我们提出了一种计算量轻量的方法来对建成基础设施进行分类。我们使用一组光谱指标和一个新颖的红波段纹理层,其全局阈值由 12 个不同站点(每个站点两个季节性变化的图像)确定。使用 Sentinel-2 影像评估了多个光谱指标。我们的纹理指标使用红波段将建成基础设施与光谱相似的裸地分开。我们的评估通过评估 24 张图像中一系列特定于站点的最佳指标阈值的地面真实点来产生全局阈值。这些用于对集合进行分类,然后使用光谱指标、纹理和分层随机抽样指导训练数据选择。训练数据适合随机森林分类器
摘要:目前尚不存在使用浅层机器学习和低密度时间序列图像进行自动训练数据生成和土地覆盖分类的近全球框架。本研究提出了一种使用 Sentinel-2 颗粒的两个日期在七个国际站点绘制九类、六类和五类土地覆盖的方法。该方法使用一系列光谱、纹理和距离决策函数与修改后的辅助层相结合来创建二进制掩码,从中生成一组平衡的训练数据应用于随机森林分类器。对于土地覆盖掩码,对反射率、光谱指数值和欧几里得距离层应用了逐步阈值调整,评估了 62 种组合。计算了全球和区域自适应阈值。使用年度 95 和 5 百分位 NDVI 合成为决策函数提供时间校正,并将这些校正与原始模型进行比较。精度评估发现,两日期土地覆盖和时间校
Complex & Intelligent Systems, Volume 10, Issue 4, August 2024
1) 一种用于动作识别的人体骨骼关键帧选择优化方法作者:陈浩,潘悦凯,王晨武页数:4659 - 46732) 城市轨道交通网络短期起讫点流量预测:基于多源大数据的深度学习方法作者:崔红萌,司冰峰……潘伟婷页数:4675 - 46963) 用于社区检测的多约束非负矩阵分解:正交正则稀疏约束非负矩阵分解作者:陈子刚,肖奇……李晓勇页数:4697 - 47124) 使用多层时间图神经网络预测社交媒体网络中的流行趋势作者:金瑞东,刘欣,村田刚页数:4713 - 47295) 受全变分和深度去噪先验启发的混合正则化用于图像恢复作者:Hu Liang, Jiahao Zhang...Jinbo Zhu页数
Revisiting Non-separable Binary Classification and its Applications in Anomaly Detection
无法线性分类 XOR 激发了深度学习的大部分动力。我们重新审视这个古老的问题,并表明 XOR 的线性分类确实是可能的。我们提出了一个略有不同的范例,即等式分离,而不是在半空间之间分离数据,该范例可调整 SVM 目标以区分边际内或边际外的数据。然后,我们的分类器可以以平滑的近似值集成到神经网络管道中。从其属性来看,我们直觉地认为等式分离适用于异常检测。为了形式化这个概念,我们引入了闭包……
Репортаж с PHDays Fest 2: эксперт УЦСБ рассказал о возможностях использования ИИ в ИБ
5月23日,在莫斯科国际网络节Positive Hack Days上,加州大学圣巴巴拉分校科学技术工作副主任尼古拉·多穆霍夫斯基(Nikolai Domukhovsky)作了题为《为何人工智能在信息安全以外的所有领域都取得胜利》的报告。事实证明,这个话题与网络安全专家息息相关,大厅里几乎没有空座位。演讲一开始,尼古拉谈到了过去10年人工智能的主要成功。人工智能成果已经从基础研究的范畴转变为急需的应用解决方案的地位,没有它我们将无法想象我们的生活。现在正处于进步的顶峰,大型语言模型也正在变得多模态——神经网络可以根据你的描述构建图像、纠正它、编写文本等。许多人利用这些机会,不幸的是,这些技术已经
MuTox: Meta's New Tool to Moderate Voice Calls Across 100+ Languages
本文重点介绍了一项开创性的研究,介绍了由 FAIR、Meta 的研究人员开发的通用多语言音频毒性数据集和检测分类器 MuTox。这种创新工具超越了语言界限,改变了……
Do Processed Foods Lead to Depression?
医疗保健分类器对解剖加工食品的研究并不陌生,但是最近我们被警告要进行一项将它们与抑郁症联系起来的研究,而且由于我们尚未解剖,这是本周的医疗保健分类的话题。 该帖子加工食品会导致抑郁症吗?首次出现在偶然的经济学家中。
Ghostbuster: Detecting Text Ghostwritten by Large Language Models
Ghostbuster 的结构,这是我们用于检测 AI 生成文本的全新先进方法。大型语言模型(如 ChatGPT)的写作能力令人印象深刻,甚至因此成为问题。学生已经开始使用这些模型来代写作业,导致一些学校禁止使用 ChatGPT。此外,这些模型还容易生成存在事实错误的文本,因此谨慎的读者在信任生成 AI 工具之前,可能希望了解这些工具是否曾被用于代写新闻文章或其他来源。教师和消费者可以做什么?现有的用于检测 AI 生成文本的工具有时在处理与训练数据不同的数据时表现不佳。此外,如果这些模型错误地将真实的人类写作归类为 AI 生成,则可能会危及那些真实作品受到质疑的学生。我们最近的论文介绍了 Gh
Asymmetric Certified Robustness via Feature-Convex Neural Networks
通过特征凸神经网络实现非对称认证稳健性 TLDR:我们提出了非对称认证稳健性问题,它只需要对一个类进行认证稳健性,并反映了现实世界的对抗场景。这种集中设置使我们能够引入特征凸分类器,该分类器可在毫秒级产生闭式和确定性的认证半径。图 1. 特征凸分类器及其对敏感类输入的认证的说明。该架构由 Lipschitz 连续特征图 $\varphi$ 和学习到的凸函数 $g$ 组成。由于 $g$ 是凸的,因此它在 $\varphi(x)$ 处的切平面全局欠近似,从而在特征空间中产生认证范数球。然后,$\varphi$ 的 Lipschitz 性会在原始输入空间中产生适当缩放的证书。尽管深度学习分类器被广泛
IEEE Transactions on Evolutionary Computation, Volume 28, Issue 3, June 2024
1) 特邀编辑进化神经架构搜索作者:Yanan Sun、Bing Xue、Mengjie Zhang、Gary G. Yen页数:566 - 5692) 多目标进化神经架构搜索的帕累托排序分类器作者:Lianbo Ma、Nan Li、Guo Yu、Xiaoyu Geng、Shi Cheng、Xingwei Wang、Min Huang、Yaochu Jin页数:570 - 5813) EGANS:用于零样本学习的进化生成对抗网络搜索作者:Shiming Chen、Shuhuang Chen、Wenjin Hou、Weiping Ding、Xinge You页数:582 - 5964) 用于医学
Averaged One-Dependence (AODE) Algorithm and its Use in Machine Learning
为什么重要:平均一依赖估计器是朴素贝叶斯分类器的扩展,它放宽了“朴素性”并允许复杂的特征关系。在本文中,我们探讨了算法的概念、背后的数学以及 Python 中的自定义实现。
Sequence Feature Extraction for Malware Family Analysis via Graph Neural Network
恶意软件对我们的设备和生活造成了很大的危害。我们迫切希望了解恶意软件的行为及其造成的威胁。恶意软件的大多数记录文件都是可变长度的、带有时间戳的基于文本的文件,例如事件日志数据和动态分析配置文件。利用时间戳,我们可以将这些数据分类为基于序列的数据,以便进行后续分析。然而,处理可变长度的基于文本的序列很困难。此外,与自然语言文本数据不同,信息安全中的大多数序列数据都具有特定的属性和结构,例如循环、重复调用、噪声等。为了深入分析 API 调用序列及其结构,我们使用图来表示序列,这可以进一步研究信息和结构,例如马尔可夫模型。因此,我们设计并实现了一个注意力感知图神经网络 (AWGCN) 来分析 API
How to build a working AI only using synthetic data in just 5 minutes
合成数据在人工智能中日益流行。它将使人工智能更便宜、更好、更少偏见。它也非常容易获得和使用。在很短的时间内,它已经从一项实验技术变成了某种东西,我会毫不犹豫地将其用于生产人工智能解决方案。为了说明这一点,我将构建一个可以区分苹果和香蕉之间差异的人工智能。我将只使用另一个人工智能生成的两个类别的图像——在本例中,使用 DALL-E Mini。苹果或香蕉识别器我将仅使用易于访问的免费 AutoAI 工具构建一个图像分类器。生成数据我们需要大约 30 张每个标签(香蕉和苹果)的图像。我们将使用 DALL-E Mini,这是 NVIDIA 文本到图像模型 DALL-E 2 的开源版本。要生成图像,您可