•意大利巴里理工大学Yashar Deldjoo(deldjooy@acm.org)•Shuai Zhang,美国亚马逊网络服务AI(shuaizs@amazon.com)•伯恩德·路德维格,德国德国雷格斯堡大学(bernd.ludwig@ur.line.de) lina.yao@csiro.au)•新加坡南南技术大学的Aixin Sun(axsun@ntu.edu.sg)生成的推荐系统(Gen-recsys),由大语言模型(LLMS)和其他最新的生成性体系结构(例如,effifusion型模型)(例如,扩散模型),介绍了个性化的新方法。与返回物品标识符静态列表的传统管道不同,Gen-Recsys可以发明库存外的建议(例如,提出了新想象中的衣服),产生针对用户反馈的丰富文本解释(例如,多转化的多转化理性(例如,解决特定的critiques)的多转化理性),并从事构成对话的折叠对话。这些扩展的功能为增强用户体验提供了新的机会。除了这些机会之外,Gen-Recsys还提出了新的挑战和风险。在不受管制的Web数据中训练的模型可能会继承和扩大与性别,语言,宗教和其他敏感属性有关的偏见。这些系统可能会无意间提出不存在的项目(所谓的“项目幻觉”),产生私人或有偏见的信息,并通过说服力的文本改变用户的看法。经典的离线评估主要衡量固定库存上的预测精度,不适合量化生成产量的更广泛含义。本期有关推荐系统(TOR)的ACM交易特刊(TORS)邀请了原始研究,审查文章,方法论论文以及研究生成推荐系统(Gen-Recsys)的技术和社会维度的透视文章。提交可能关注算法发展,道德准则,用户研究或全面评估策略。我们鼓励手稿阐明现实世界的应用程序,新颖的数据集和跨学科合作。主题:我们欢迎对(但不限于)与Gen-Recsys相关的以下领域提交:●生成架构:gans,vaes,vaes,扩散模型,LLMS或多模式基础模型的集成到建议管道中;用于混合,特定于上下文的建议的检索授权生成(RAG)。●个性化内容和解释生成:生产以用户为中心的说明,文本评论,叙述或合成项目(例如,服装建议,合成媒体)的新方法。●数据稀疏和冷启动解决方案:诸如合成数据生成,传输学习或跨领域的方法,以减轻稀疏或新用户方案。●对话和交互式推荐人:多转对话,实时更新和基于LLM的代理,以完善查询并预测未来的交互。●可伸缩性和效率:减少推理潜伏期和资源需求(例如蒸馏,修剪)的方法,同时保留个性化。
该项目深入研究基于深度学习的图像动画,采用有条件的生成模型,例如生成对抗网络(GAN)和变异自动编码器(VAE)。在包含图像序列对的数据集上训练,这些模型将单个输入图像转换为连贯和新颖的动画,从而模拟自然运动和转换。使用TensorFlow在Jupyter Notebook环境中引入了交互式图像动画系统,以实现深度学习能力。利用OPENCV,FFMPEG,IMAGEIO,PIL和SCIKIT-IMAGE用于图像和视频处理,该系统将IPYTHON小部件结合在一起,用于增强用户交互。该技术在实时视频流中也起着至关重要的作用,提供动态的视觉内容而无需手动逐帧动画。该项目利用了深度学习的力量,以消除手动努力,为在不同领域的有效和现实的内容创建开辟了新的可能性。
抽象的许多深层生成模型被定义为持续生成器的高斯度量的推动,例如生成的对抗网络(GAN)或变化自动编码器(VAE)。这项工作探讨了这种深层生成模型的潜在空间。这些模型的关键问题是他们在学习断开分布时在目标分布支持之外输出样本的趋势。我们研究了这些模型的性能与它们潜在空间的几何形状之间的关系。基于几何度量理论的最新发展,在潜在空间的尺寸大于模式数量的情况下,我们证明了最佳条件的最佳条件。通过对gan的实验,我们证明了我们的理论结果的有效性,并获得了对这些模型潜在空间几何形状的新见解。此外,我们提出了一种截断方法,该方法在潜在空间中强制执行简单的聚类结构并改善gan的性能。
摘要该项目提出了三种用于为EEG Net数据集创建神经网络模型的方法 - 使用CNN,CNN+LSTM和变异自动编码器(VAE)。研究评估并比较了两种方法在分类运动图像中的性能。结果表明,CNN+LSTM方法在准确性方面优于VAE方法。但是,VAE方法具有保留脑电图信号的关键特征的优势,同时降低其尺寸。两种方法都有其各自的优势和局限性,可以根据应用程序的特定要求使用。除了上述两种方法外,我们还为该数据集实施了随机森林,以对ML和DL模型的准确性成就进行比较分析。索引术语:机器学习(ML),深度学习(DL),VAE(变异自动编码器),长期短期存储网络(LSTM),脑电图(EEG)(EEG)
从描述中创建图像的能力长期以来一直是智力的目标。文本对图像综合,也称为文本对图像生成,旨在创建与描述相匹配的逼真的图像。该技术在许多领域都有许多应用程序,包括数据处理,艺术设计,机器人技术和虚拟现实。生成的对抗网络(GAN)和变异自动编码器(VAE)广泛用于图像处理项目中。但是,创建传达叙事的好图像显然仍然是一个挑战。图像合成模型。这些数据提供了一个独特的机会,可以以这种方式探索基于变压器的架构和生成模型的潜力。我们的模型利用基于变压器的体系结构和生成对抗网络来生成具有交互式描述的高质量图像。本文的其余部分组织如下:第2节评论有关文本对图像匹配的相关作品,第3节描述了我们的模型,第4节介绍了实验结果,第5节总结了本文。
生成的AI是指基于从培训数据中学到的模式和关系创建新内容的人工智能系统类别,例如图像,文本,音频或视频。这些模型可以生成类似于培训数据的新颖的原始内容,从而在艺术,娱乐和设计等各种行业中实现了广泛的应用。生成的AI模型可以在大型数据集上进行培训,并且可以在数据[1]中学习复杂的模式和结构。一旦受过训练,他们就可以通过从学习概率分布中取样或使用条件生成等技术来生成新的内容,该技术基于特定的输入条件生成内容。生成AI模型的示例包括基于深度学习的图像生成器,例如gan(生成对抗网络)和变异自动编码器(VAE),基于文本的模型,例如GPT-4,以及基于深度学习算法的音频和视频生成模型[2]。
汽车共享是向灵活和可持续移动性转变的组成部分。新的汽车共享计划正在进入市场,通过提供创新服务来挑战大型运营商。本研究调查了使用生成机器学习模型来创建合成数据以支持Carsharing Deaking的使用 - 在数据访问受到限制时做出。为此,它探讨了前沿方法的评估,选择和实现,例如生成的对抗网络(GAN)和变异自动编码器(VAE),以生成汽车共享旅行的合成表格交易数据。该研究分析了一个新兴汽车共享计划的使用数据,该计划正在扩大其服务,包括自由浮动电动汽车(EV)。结果表明,使用合成样本增强实际训练数据可将即将到来的旅行的预测建模提高到4.63%。这些结果支持汽车共享研究人员和从业人员生成和利用合成流动性数据,以开发解决世界决策支持问题的解决方案。
(3)深层生成模型求解随机过程:研究求解随机模型(例如扩散模型)(例如扩散模型)(例如,扩散模型)中随机过程的随机微分方程(SDE)或部分微分方程(PDE)(PDE)(PDES)。模型)在培训期间(5)生成模型中的隐式偏见和正则化:探索生成模型中存在的隐式偏见及其对概括的影响。研究显式和隐式正则化技术的有效性(6)生成模型的鲁棒性和泛化边界:分析生成模型的鲁棒性界限及其在分布分布的场景下(7)潜在的空间几何形状(7)潜在的空间几何学和流形学习:分析与生成模型的潜在空间和与生成数据分配的分析及其关系分配的相关性。探索如何平衡潜在空间中的多样性和发电质量,并研究复杂数据情景中不同流形学习技术的有效性和局限性
变化自动编码器(VAE)和其他生成模型被广泛用于人工智能中,以合成新数据。但是,当前的方法依赖于无法捕获数据生成的结构化和新兴本质的欧几里得几何假设和统计近似。本文介绍了收敛融合范式(CFP)理论,这是一个新型的几何框架,通过整合尺寸扩展并伴随定性转换来重新定义数据生成。通过修改潜在的空间几何形状以与新兴高维结构相互作用,CFP理论解决了关键挑战,例如可识别性问题和意想不到的伪影,例如大语言模型(LLMS)中的幻觉。CFP理论基于两个关键的概念假设,这些假设重新定义了生成模型如何在数据和算法之间结构关系。通过CFP理论的角度,我们批判性地检查了现有的度量学习方法。cfp理论通过引入时间转换的度量嵌入和结构收敛机制来提高这一观点
本文评估了先进的变分自动编码器(VAE)模型在克服潜在空间纠缠和分解不足的有效性,传统VAE中的常见问题。传统的VAE经常在区分潜在空间内的不同特征时面临挑战,从而导致纠缠的表示,从而阻碍了可解释性和压缩效率。本研究中检查的高级VAE模型通过增强解剖来解决这些问题,从而使潜在因素更清晰地分离和更容易解释的表示。但是,这种分解的改善可能会导致重建质量的权衡。文章表明,尽管这些复杂的模型改善了分离,但它们的重建质量也可能比经典VAE差。调查结果突出了成功导航这种权衡的超参数优化的必要性。未来的研究应研究新颖的模型架构和超参数优化策略,以优化分离和重建质量的平衡。总体而言,该研究强调了先进的VAE模型产生更容易解释的表示的能力以及仔细调整以解决固有的权衡的重要性。