资源受限的图像生成和视觉理解：Aniket Roy 访谈 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

资源受限的图像生成和视觉理解：Aniket Roy 访谈

2026年3月26日 10:49 33 Comments

在我们与 AAAI/SIGAI 博士联盟参与者进行的系列采访中，我们采访了 Aniket Roy，了解他对计算机视觉任务生成模型的研究的更多信息。告诉我们一些关于您的博士学位的信息——您在哪里学习，您的研究主题是什么？我[...]

来源:ΑΙhub

在我们与 AAAI/SIGAI 博士联盟参与者进行的系列采访中，我们采访了 Aniket Roy，了解他对计算机视觉任务生成模型的研究的更多信息。

告诉我们一些关于您的博士学位的信息 - 您在哪里学习，您的研究主题是什么？

我最近在约翰·霍普金斯大学完成了计算机科学博士学位，在彭博社杰出教授 Rama Chellappa 的指导下工作。我的研究主要集中在开发资源受限的图像生成和视觉理解的方法。我特别探索了如何调整现代生成模型以使其高效运行，同时保持强劲的性能。

在攻读博士学位期间，我在生成式人工智能、多模态学习和小样本学习的交叉领域进行了广泛的研究。我的大部分工作涉及设计技术，使模型能够学习新概念或使用有限的数据或计算资源执行复杂的视觉任务。这包括扩散模型、个性化图像生成和多模态表示学习的研究。总的来说，我的工作旨在使先进的视觉和生成人工智能系统对于现实世界的应用更具适应性、高效性和实用性。

您能给我们介绍一下您在博士期间进行的研究吗？

在攻读博士学位期间，我的研究主要集中在提高计算机视觉任务的现代生成模型的适应性、效率和质量。生成式人工智能（尤其是扩散模型和视觉语言模型）的快速进展为解决数据稀缺、可控生成和个性化图像合成等长期存在的挑战创造了新的机会。我的工作旨在开发方法，使这些大型模型能够有效地适应有限的数据和计算资源，同时保持高视觉保真度。

Cap2Aug 概述。

DuoLoRA 概述。

DiffNat 概述。

关于 Aniket Roy

标签：

图像合成实用性复杂的世界的计算机 Aniket 人工智能先进的提高质量模型概述大部分保真度适应性设计技术数据任务研究视觉生成有限的学习的参与者模型的开发方法研究的广泛的进行扩散模型生成式计算资源图像生成博士学位新概念工作