在过去十年中,人们在社交媒体平台上消费新闻的倾向大大增加。信息现在可以快速、廉价地传播,消费者可以轻松获取;这迅速促进了分散的新闻制作,通常没有编辑监督。对抗代理正在利用这种情况传播虚假信息。在过去十年中,人工智能 (AI)/机器学习 (ML) 领域在文本自动化应用程序的开发以及视觉和音频数据的识别和生成方面经历了前所未有的增长。这些蓬勃发展的人工智能能力是否会增强恶意行为者操纵人群的能力?人工智能现在在生成合成内容方面发挥着至关重要的作用,并使社交媒体平台上使用的有效微定位能够传播虚假信息,包括超现实的合成图像、视频、音频和文本。这篇技术性很强的文章旨在向北约的从业者、政策制定者和人工智能爱好者介绍如何使用人工智能/机器学习技术来塑造虚假信息。
摘要:二维材料有望在下一代电子和光电设备中发挥重要作用。最近,由于其独特的物理特性和潜在的应用,扭曲的双层石墨烯和过渡金属二核苷引起了极大的关注。在这项研究中,我们描述了光学显微镜的使用来收集二硫化钼(MOS 2)的化学蒸气沉积(CVD)的色彩空间,并应用了语义分割卷积神经网络(CNN)的应用,以准确且快速地识别MOS 2 Flakes的厚度。第二个CNN模型经过训练,以在CVD生长的双层薄片的扭曲角度提供精确的预测。该模型利用了一个数据集,该数据集包含10,000多个合成图像,其中包括从六角形到三角形形状的几何形状。通过第二次谐波产生和拉曼光谱执行了对扭曲角度深度学习预测的后续验证。我们的结果引入了一种可扩展的方法,用于自动检查扭曲的原子薄的CVD生长双层。关键字:扭曲角度,过渡金属二核苷(TMD),深度学习,OpenCV,拉曼
摘要。细胞显微镜数据丰富;但是,相应的分割注释仍然很少。此外,细胞类型,成像设备和染色技术的变化引入了数据集之间的重要差距。因此,在各种数据集(源数据集)上训练的大型,预处理的销售模型都难以推广到看不见的数据集(目标数据集)。为了克服这个通用的问题,我们提出了细胞风格,它提高了此类模型的分割质量,而无需为目标数据集提供标签,从而实现了零照片的适应性。CellStyle将未注释的目标数据集(例如纹理,颜色和噪声)的属性转移到注释的源数据集。在保留源图像的单元格形状时进行此转移,以确保在维护目标数据集的视觉特征的同时仍然可以使用现有的源注释。带有现有注释的样式合成图像使通才分割模型的填充能够应用于未经通知的目标数据。我们证明,通过对样式转移数据的多个分割模型进行验证,CellStyle可以显着改善各种数据集的零光单元分割性能。该代码将公开可用。
摘要 - 医学成像应用在人体解剖学,病理学和成像领域方面高度专业。因此,用于培训医学成像中深度学习应用的注释培训数据集不仅需要高度准确,而且还需要多样化,并且足够大,以涵盖与这些规格有关的大多数合理示例。我们认为,实现此目标可以通过带有注释的合成图像的受控生成框架来促进,需要多个条件规格作为输入才能提供控制。我们采用denoising扩散概率模型(DDPM)来训练肺CT域中的大规模生成模型,并根据无分类器采样策略进行扩展,以展示一个这样的生成框架。我们表明,我们的方法可以产生带注释的肺CT图像,这些图像可以忠实地代表解剖学,令人信服地愚弄专家将其视为真实。我们的实验表明,这种性质的受控生成框架几乎可以超过几乎所有最新的图像生成模型,而在接受类似的大型医疗数据集接受培训时,在生成的医学图像中实现了解剖学一致性。
本项目使用深度学习技术介绍了用于图像着色和文本对图像生成的Web应用程序。应用程序包括两个主要模块:图像着色,将黑白图像转换为颜色,以及文本到图像生成,该图像基于文本描述创建图像。用于图像着色,预先训练的深度神经网络模型可用于预测灰度图像的色彩信息。该模型是使用OpenCV的DNN模块实现的,并且能够准确恢复颜色为灰度图像。在文本到图像生成模块中,采用稳定的扩散管道来生成文本提示中的图像。本管道利用深度学习技术根据用户提供的文本描述来合成图像。Web应用程序提供了一个用户友好的接口,供用户上传图像以进行着色和输入文本提示以生成图像。处理后,应用程序将有色的图像或生成的图像返回给用户。总体而言,该项目展示了深度学习模型在增强视觉内容创建方面的潜力,并为用户提供了一种实用的应用程序,可以交互探索图像着色和文本驱动的图像生成。
摘要。合成的多光谱卫星图像的产生尚未达到其他领域中可达到的质量水平,例如面部图像的产生和操纵。难度的一部分源于需要在此类图像覆盖的整个电磁频谱上生成一致的数据,该图像的辐射分辨率高于多媒体应用中通常使用的图像。与不同波长相对应的图像带的不同空间分辨率提出了其他问题,其主要效果是相对于原始图像,在合成图像中缺乏空间细节。我们建议通过将样式传输应用于13波段Sentinel-2 Level1-C图像,明确认为基于生成的对抗网络的建筑可以生成合成卫星图像。为避免丢失更细的空间细节并改善生成的图像的清晰度,我们引入了一种类似Pansharpening的方法,从而将输入图像的空间结构转移到了样式转移的图像的情况下,而无需引入可见的文物。我们通过应用所提出的架构将贫瘠的图像转化为植被图像,反之亦然,从而得到的结果(res。冬季)图像进入冬季(res。夏季图像,确认了提出的解决方案的有效性。
深度学习技术越来越多地用来以高准确性对医学成像数据进行分类。尽管如此,由于训练数据通常有限,这些模型可能缺乏足够的可推广性来预测不同领域中产生的未见测试数据,并具有可观的性能。本研究的重点是甲状腺组织病理学图像分类,并研究了只有156个患者样品训练的生成对抗网络[GAN]是否可以产生高质量的合成图像以充分增强训练数据并改善整体模型的可推广性。利用stylegan2方法,生成网络生成的图像产生了频率创造距离(FID)分数为5.05的图像,匹配的最新gan会导致具有可比数据集尺寸的非医疗域。当对从三个单独的域中采购的外部数据进行测试时,使用这些GAN生成的图像对训练数据进行培训数据增加了模型,将总体精度和AUC分别提高了7.45%和7.20%,而基线模型则分别提高了7.45%和7.20%。最重要的是,在训练有素的病理学家进行分类时,在少数群体图像,肿瘤亚型上观察到了这种绩效改善。
摘要 - 仿真是机器人技术中广泛使用的工具,可减少硬件消耗并收集大规模数据。尽管为模拟光学触觉传感器做出了预先的努力,但仍在有效合成图像并在不同的接触载荷下复制标记运动方面仍然存在Challenges。在这项工作中,我们提出了一个名为FOTS的快速光学式模拟器,用于模拟光学触觉传感器。我们利用多层感知器映射和平面阴影生成来模拟光学响应,同时采用标记分布近似来模拟由弹性体变形引起的表面标记的运动。实验结果表明,FOT在图像产生质量和渲染速度方面优于其他方法,用于光学仿真的28.6 fps和326.1 fps的单个CPU上的标记运动模拟326.1 fps,而无需GPU加速。此外,我们将FOTS仿真模型与Mujoco等物理引擎集成在一起,而PEG-In-inole任务则证明了我们方法在实现零拍摄的SIM2REAL学习触觉机器人机器人操纵技能方面的有效性。我们的代码可在https://github.com/rancho-zhao/fots上找到。
最近,扭曲或构成生成模型的事实的图像已成为社会知识。要应对一般人工智能(AI)模型的连续演变,模型归因(MA)是必需的,而不仅仅是鉴定合成图像。但是,必须从头开始培训当前基于深度学习的MA方法,以识别既耗时又耗时的模型。这项工作提出了一种新的策略,以处理持久新兴的生成模型。我们适应了少数拍摄的类侵入学习(FSCIL)机械性,以发现新的生成AI模型。与现有的FSCIL方法使用高级插入式对象分类的方法不同,MA需要分析综合图像中的颜色和纹理等低级细节。因此,我们利用夹子vit特征的不同利益来利用可学习的表示形式。为了学习有效的代表,我们提出了自适应集成模式(AIM),以计算每个图像的夹子vit块特征的加权总和,从而增强了对识别生成模型的ABIL。广泛的实验表明,我们的方法有效地从先前的生成模型扩展到最近的生成模型。
摘要:建筑环境约占全球温室气体排放的 40%,是气候变化和可持续发展的关键因素。与此同时,其他行业(如制造业)采用人工智能 (AI) 来解决复杂的非线性问题,以减少浪费、效率低下和污染。因此,建筑、工程和建筑界的许多研究工作最近都尝试将 AI 引入建筑资产管理 (AM) 流程。由于 AM 涵盖了广泛的学科,因此需要概述几种 AI 应用、当前的研究差距和趋势。在此背景下,本研究首次对建筑资产管理的 AI 进行了最先进的研究。使用文献计量工具分析了总共 578 篇论文,以确定知名机构、主题和期刊。定量分析有助于确定 AM 研究最多的领域以及应用了哪些 AI 技术。通过深入阅读文献计量分析中筛选出的文章摘要后选出的 83 篇最相关研究,进一步研究了这些领域。结果揭示了能源管理、状况评估、风险管理和项目管理领域的许多应用。最后,文献综述确定了三个主要趋势,可以作为从业者或研究人员未来研究的参考点:数字孪生、用于数据增强的生成对抗网络(带有合成图像)和深度强化学习。