2024 6th International Workshop on Gaze Estimation and Prediction in the Wild (GAZE 2024) at CVPR 2023 OCELOT 2023: Cell Detection from Cell-Tissue Interaction Challenge at MICCAI 5th International Workshop on Gaze Estimation and Prediction in the Wild (GAZE 2023) at CVPR 2021 3rd International Workshop on Gaze Estimation and Prediction in the Wild (GAZE 2021) at CVPR 2020年AR,VR和野外(OpenEyes 2020)的国际眼睛凝视国际研讨会在ECCV 2019上的第一届国际凝视估算和预测(Gaze 2019)的ICCV
CVPR 2023 共收到 9155 份投稿,比 CVPR 2022 的 8161 份投稿增加了 12%。审查过程由 400 多名领域主席和今年新加入的 30 名高级领域主席管理。高级领域主席在许多方面提供了帮助,最重要的是通过裁决棘手的案例、处理紧急情况、选择重点论文和选择奖项候选人。在审查阶段,每篇论文都会从 6625 名审稿人中收到至少 3 份审稿意见。与往年一样,在收到这些初步审稿意见后,该过程继续进行,包括作者反驳阶段、审稿人和 AC 之间的讨论、最终确定审稿意见,以及 AC 以三人一组的方式对每篇论文做出最终的接受/拒绝决定。在此过程结束时,2359 篇论文被接受(接受率为 25.8%)。按照 CVPR 的传统,PC 没有预设任何接受上限。最终的接受率反映了社区的共识,并且与过去的 CVPR 一致。
我正在使用传统的内部学习范式和使用超网络的范围来研究视频的隐式神经表示方法(INR)方法。我曾在论文(在BMVC和CVPR上均为该论文)进行了合作,该论文提出了视频的混合表示形式,并具有良好的数据压缩性能和其他有希望的新兴属性。我还正在研究隐式表示的新兴属性,包括分类和分割。我指导了其他博士生,我们提出了一个分析各种不同类型的INR网络的框架。手稿于CVPR 2024。我是INRV的主要组织者,是CVPR 2024的研讨会。
个性化残差,用于概念驱动的文本对图像生成。Cusuh Ham,Matthew Fisher,James Hays,Nicholas Kolkin,Yuchen Liu,Richard Zhang,Tobias Hinz。 CVPR 2024Cusuh Ham,Matthew Fisher,James Hays,Nicholas Kolkin,Yuchen Liu,Richard Zhang,Tobias Hinz。CVPR 2024
[1] Tingwei Zhang *,Rishi Jha *,Eugene Bagdasaryan和Vitaly Shmatikov。“多模式嵌入中的对抗性幻觉”。在:第33 USENIX安全研讨会(USENIX)。获得了杰出的纸张奖(占接受论文的5%)。2024年8月。[2] Rishi Jha *,Jonathan Hayase *和Sewoong Oh。“标签中毒就是您所需要的”。:第37届神经信息处理系统(神经)会议。2023年12月。[3] Dimitrios C. Gklezakos,Rishi Jha和Rajesh P.N.Rao。 “超宇宙策略近似:学习使用超核从单个图像生成动作”。 in:Neurovision 2022:CVPR研讨会(Neurovision @ cvpr)。 2022年6月。 [4] Rishi Jha和Kai Mihata。 “关于文本分类的大地距离和上下文嵌入压缩”。 在:关于自然语言处理方法的第十五个研讨会论文集(TextGraphs -15 @ NaAcl)。 2021年6月。Rao。“超宇宙策略近似:学习使用超核从单个图像生成动作”。in:Neurovision 2022:CVPR研讨会(Neurovision @ cvpr)。2022年6月。[4] Rishi Jha和Kai Mihata。“关于文本分类的大地距离和上下文嵌入压缩”。在:关于自然语言处理方法的第十五个研讨会论文集(TextGraphs -15 @ NaAcl)。2021年6月。
AIML 在 2020 年计算机视觉与模式识别会议 (CVPR) 上发表了 23 篇论文,比往年增长了 50% 以上。这些数字与规模大几个数量级的机构的数字相当,考虑到 AIML 的相对历史,这是一个令人难以置信的结果。由于苹果、谷歌和亚马逊等赞助商的存在,该年度会议被誉为计算机视觉研究领域最受尊敬的盛会。据说在这里被接受一篇论文就是职业生涯的亮点,提交和接受统计数据支持了这一说法。有 23 篇论文被 CVPR 接受是一个令人难以置信的结果,这再次使 AIML 成为这个竞争激烈领域的全球最佳研究团体之一。CVPR 是计算机视觉领域排名最高的会议,也是整个工程和计算机科学领域排名第二的会议。AIML 成员吴奇博士是阿德莱德大学计算机科学学院的 ARC DECRA 研究员,今年有六篇论文被接受。
CVPR的Earthvision Workshop(自2021年以来); ECML/PKDD的地球会议计划委员会/审查观察(MACLEAN)研讨会(自2019年以来); ICLR(2023-2025)的遥感研讨会的机器学习; ISPRS地理空间周(2025); ESA-NASA国际地球观察基础模型(2025)CVPR的Earthvision Workshop(自2021年以来); ECML/PKDD的地球会议计划委员会/审查观察(MACLEAN)研讨会(自2019年以来); ICLR(2023-2025)的遥感研讨会的机器学习; ISPRS地理空间周(2025); ESA-NASA国际地球观察基础模型(2025)
新方法首先应用于计算机视觉领域——该团队成功提高了 3D 物体检测和识别的准确性。 AIRI 研究所和国立高等经济学院的科学家展示并通过实验证实了使用在高质量数据集上训练的小型生成模型进一步训练大型 AI 模型和解决 3D 检测问题的优势。该方法将适用于无人驾驶飞行器的开发,并将在未来更准确地确定物体的运动速度和方向、表面特性以及飞行器在空间中的定位。该文章已被最大的国际计算机视觉会议CVPR 2024接受。3D物体识别是预测和规划无人驾驶汽车路径的关键任务之一。为了解决这个问题,系统使用一组不同的读数来确定物体所在的区域(平行六面体)。然而,激光雷达等传感器并不总是提供有关深度的完整信息,因此也不能提供有关物体的 3D 位置的完整信息。在道路上,一个元素可能会被其他结构复杂的物体(例如一棵树或一辆行驶的汽车)完全或部分遮挡,这将对激光雷达的效率产生负面影响。俄罗斯科学家提出的方法证明,尽管激光雷达数据存在噪声且物体相互重叠,但可以更准确地确定物体的三维位置。在为期一年的研究过程中,该团队利用汽车行驶在城市街道上时获取的点云记录训练了一个小型生成模型。数据点是在三种情况下收集的:当物体完全在视野中时、当只有部分可见时、以及当物体被遗忘时。然后,使用点云配准 (PCR) 方法,即使基于一个小的可见片段,点云也可以与特定汽车和其他物体相关联。然后使用这个小而准确的模型(教师模型)来训练在具有许多复杂参数的噪声点云上运行的更大的神经网络(学生模型)。结果,神经网络显著提高了识别真实物体的准确性——该技术开始正确预测未来才能看到的周围物体的形状。 “我们开始与 OpenAI 的研究人员并行开展该项目,他们决定采用类似的方法处理文本,而我们的团队则专注于计算机视觉。有趣的是,这个想法本身和得到的结果对两个团队来说都证明了其价值,他们并没有直接互动就得出了类似的结论。我们看到了扩展计算机视觉方法的机会:例如,通过增加任务数量和每个模型的复杂性。是的,你可以教