随着 2D 传播模型的成功,2D AIGC 内容已经改变了我们的生活。最近,这一成功已扩展到 3D AIGC,其中最先进的方法可以从单个图像或文本生成带纹理的 3D 模型。但是,我们认为当前的 3D AIGC 方法仍然没有完全释放人类的创造力。我们经常想象由多模态输入制成的 3D 内容,例如如果我的宠物兔子在桌子上吃甜甜圈会是什么样子。在本文中,我们探索一种新颖的 3D AIGC 方法:从 IDEA 生成 3D 内容。IDEA 是由文本、图像和 3D 模型组成的多模态输入。据我们所知,这种具有挑战性和令人兴奋的 3D AIGC 设置以前尚未被研究过。我们提出了新的框架 Idea23D,它结合了基于大型多模态模型 (LMM) 和现有算法工具的三个代理。这三个基于 LMM 的代理负责提示生成、模型选择和反馈反射。它们在完全自动化的循环中相互协作和批评,无需人工干预。然后,该框架生成一个文本提示,以创建与输入 IDEA 紧密一致的 3D 模型。我们展示了令人印象深刻的 3D AIGC 结果,超越了以前的方法。为了全面评估 Idea23D 的 3D AIGC 功能,我们引入了 Eval3DAIGC-198 数据集,其中包含 198 个用于 3D 生成任务的多模态输入。该数据集评估生成的 3D 内容与输入 IDEA 之间的一致性。我们的用户研究和定量结果表明,Idea23D 显著提高了 3D 生成的成功率和准确性,并且在各种 LMM、文本转图像和图像转 3D 模型中具有出色的兼容性。代码和数据集可在 https://idea23d.github.io/ 获得。
生成式人工智能的兴起正在改变数字图像的格局,并对在线创意社区产生重大影响。这导致了人工智能生成内容 (AIGC) 社交平台的出现,例如 Civitai。这些独特的社交平台允许用户构建和分享自己的生成式人工智能模型,从而增强了更多样化艺术表达的潜力。它们以社交网络的风格设计,还为艺术家提供了展示其作品(从模型生成)、参与讨论和获得反馈的手段,从而培养了社区意识。然而,这种开放性也引发了人们对此类平台滥用的担忧,例如使用模型传播欺骗性的深度伪造或侵犯版权。为了探索这一点,我们对 AIGC 社交平台进行了首次全面的实证研究,重点关注其用于生成滥用内容的情况。作为示例,我们构建了一个涵盖最大的 AIGC 社交平台 Civitai 的综合数据集。基于这个包含 87K 个模型和 2M 张图像的数据集,我们探索内容的特征并讨论审核策略以更好地管理这些平台。
摘要。生成人工智能(AIGC)是人工智能的关键子集,它在多个领域(例如图像,音频和文本)中表现出非凡的数据生成和创建功能。本文旨在探讨AIGC在电影制作领域的应用,并特别强调了深卷积生成的对抗网络(DCGANS)的作用,并引入了直观的教学方法。通过实施DCGAN技术,这项研究实现了各种功能,包括生成虚拟角色,场景,样式转换,动态图像恢复和增强功能,从而增强了电影生产过程。视觉教学系统通过直观的界面和交互式操作来促进这些尖端技术的快速掌握。我们的研究表明,DCGAN在制作电影品质图像时表现出非凡的准确性和效率。此外,用户反馈确认了我们的视觉学习平台的卓越和优势。这项调查强调了AIGC在膜视觉生产中的巨大潜力,同时还通过基于视觉的学习来促进相关技术的传播和增强。技术和教育的这种开创性融合将培养新一代创新的电影制片人。
作为用于创建内容的下一代范式,AI生成的内容(AIGC),即,基于用户提示,通过生成AI(GAI)自动构成内容,最近引起了极大的关注和成功。With the ever- increasing power of GAI, especially the emer- gence of Pretrained Foundation Models (PFMs) that contain billions of parameters and prompt engineering methods (i.e., finding the best prompts for the given task), the application range of AIGC is rapidly expanding, covering various forms of information for human, systems, and networks, such as network designs, channel cod- ing, and optimization solutions.在本文中,我们介绍了移动边缘AI生成的所有内容的概念(AIGX)。具体来说,我们首先回顾了AIGX的构建块,从AIGC到AIGX的演变以及实用的AIGX应用。然后,我们提出了一个统一的移动边缘AIGX框架,该框架采用边缘设备提供PFM授权的AIGX服务,并通过及时的工程优化此类服务。更重要的是,我们证明了次序提示导致发电质量差,这会对用户满意度,边缘网络性能和资源利用产生不利影响。因此,我们进行了一个案例研究,展示了如何使用Chatgpt培训有效的及时优化器,并研究了及时工程在用户体验,发电质量和净工作绩效方面进行的改进。
可互操作的数字:Bommasani,R.,Hudson,D.A.,Adeli,E.,Altman,R.,Arora,S.,Von Arx,S.,...&Liang,P。(2021)。基础模型的机遇和风险。ARXIV预印本。Xu,M.,Du,H.,Niyato,D.,Kang,J.,Xiong,Z.,Mao,S. 在移动网络中释放边缘云生成AI的功能:AIGC服务的调查。 IEEE通信调查和教程。Xu,M.,Du,H.,Niyato,D.,Kang,J.,Xiong,Z.,Mao,S.在移动网络中释放边缘云生成AI的功能:AIGC服务的调查。IEEE通信调查和教程。
摘要。元宇宙是数字经济发展的新兴产业,亟待技术创新突破,推动新一轮发展。以ChatGPT为代表的AIGC技术具有渗透性、扩散性和颠覆性,以符合人类逻辑思维和习惯的人机交互方式,为元宇宙发展提供了新的内容供给范式。元宇宙将在基础层、关键技术层、应用层等获得新一轮发展动力,带动新型业务快速发展;同时,沉浸式的人机交互将放大AIGC这把双刃剑的负面影响,带来更复杂、更棘手的行业监管、技术伦理等治理问题。总之,发展并非一朝一夕,需要长期研究核心技术,围绕大算力快速构建新型基础设施,协同发展支撑安全可控治理体系。
摘要。近年来,人工intel-ligence生成的内容(AIGC)的迅速增长,随着文本对图像技术的发展,基于AI的图像生成已应用于各种领域。但是,与自然图像相比,AI生成的图像(AIGI)可能具有一些独特的扭曲,因此许多生成的图像对于现实世界应用没有资格。因此,研究AIGIS的主观和客观图像质量评估(IQA)方法很重要且重要。在本文中,为了更好地了解AIGI的人类视觉偏好,建立了AIGC的大规模IQA数据库,该数据库被称为AIGCIQA2023。我们首先使用100个提示,基于6个最先进的文本对图像生成模型生成2000多个图像。基于这些图像,进行了良好的主观实验,以从三个角度评估每个图像的人类视觉偏好,包括质量,真实性和对应关系。最后,基于这个大型数据库,我们进行了一个基准实验,以评估构造的数据库中几个最先进的IQA指标的表现。AIGCIQA2023数据库和基准将发布,以促进未来的研究https://github.com/wangjiarui153/aigciqa2023
摘要 自从 ChatGPT 成为主要的 AIGC 模型并在广泛的应用(包括软件开发和维护)中提供高质量响应以来,它引起了许多人的极大兴趣。ChatGPT 前景广阔,但滥用可能会引发严重问题,尤其是在教育和公共安全领域。目前有几种 AIGC 检测器可用,并且都已在真实文本上进行了测试。但是,还需要进行更多研究才能了解它们对多域 ChatGPT 材料的有效性。本研究旨在通过创建一个多域数据集来测试大学和其他研究机构使用的用于检测人工生成信息的最先进的 API 和工具,从而满足这一需求。本研究创建了一个由文章、摘要、故事、新闻和产品评论组成的大型数据集。第二步是使用新创建的数据集对六种工具进行测试。包括“GPTkit”、“GPTZero”、“Originality”、“Sapling”、“Writer”和“Zylalab”在内的六种不同的人工智能文本识别系统准确率在55.29%至97.0%之间。虽然所有工具在评估中都表现良好,但Originality在各方面都表现得尤为出色。
摘要:由于 ChatGPT 已成为一种主要的 AIGC 模型,可在广泛的应用(包括软件开发和维护)中提供高质量的响应,因此它吸引了许多人的兴趣。ChatGPT 前景广阔,但滥用可能会引发严重问题,尤其是在教育和公共安全领域。目前有几种 AIGC 检测器可用,并且都已在真实文本上进行了测试。但是,还需要进行更多研究才能了解它们对多域 ChatGPT 材料的有效性。本研究旨在通过创建一个多域数据集来测试大学和其他研究机构使用的用于检测人工生成信息的最先进的 API 和工具,从而满足这一需求。本研究创建了一个由文章、摘要、故事、新闻和产品评论组成的大型数据集。第二步是使用新创建的数据集对六种工具进行测试。包括“GPTkit”、“GPTZero”、“Originality”、“Sapling”、“Writer”和“Zylalab”在内的六种不同的人工智能文本识别系统准确率在55.29%至97.0%之间。虽然所有工具在评估中都表现良好,但Originality在各方面都表现得尤为出色。