问题的重要性和新颖性。现有的UQ方法主要是针对犯罪模型的,这些方法用于分类或回归任务。这些方法虽然对图像分类或二进制决策等任务有效,但并不能很好地转化为基于LLM的自回旋模型(Brown等人。,2020年; Thoppilan等。,2022; Touvron等。,2023)。自回旋模型顺序生成令牌,其中每个输出取决于上一个。此结构引入了不确定性量化的独特挑战。首先,在自回旋模型中,产生了不确定性化合物,因此很难捕获模型对序列的置信度的幅度。llms动态适应了前面的上下文,随着模型通过文本或多模式序列的形式导致不确定性的变化。对于llms处理文本和图像模式(例如GPT-4),由于输入和输出空间的多模式性质,不确定性量化变得更加复杂。传统的UQ方法难以考虑交叉模式的相互作用,在这种互动中,一种模式中的不确定性(例如,图像理解)会影响另一种方式(例如,文本生成)。llms的另一个明显挑战是人类反馈的有限精度。现有用于校准模型的技术取决于对地面真相标签的访问。相比之下,使用LLMS没有真正的标签,一个只能访问少数几代人的相对偏好。此外,对理论框架的需求越来越大,可以有效地分析和预测分布(OOD)场景中的模型行为,在这种情况下,不确定性对于确定模型何时可能不可靠的不确定性至关重要。要应对这些挑战,UQ方法必须从量身定制的传统方法转变为判别模型,并采用新技术,这些技术可以解释自动回归模型的复杂依赖性和动态性质。
参考文献和链接 [1] J. Aloimonos,“回复,我所学到的”,图像理解,第60,号1,页74-85(1994 年)。[2] C.-E. Liedtke,“图像分析中的智能方法”,Proc.SPIE,第3478,页2-10(1998 年)。[3] W. Osten,“主动光学计量学 - 通过示例定义”,Proc.SPIE,第3478,页。11-25(1998)。[4] W. Osten,M. Kujawinska,“主动相位测量计量学。”在:P.K.Rastogi 和 D. Inaudi(编辑。):光学无损检测和检测趋势,Elsevier Science B.V. 2000,页。45-69。[5] W. Osten,W. Jüptner,“用于主动光学 3D 检测的新光源和传感器”,Proc.SPIE Vol.3897,页。314-327(1999)。[6] Vialux GmbH,ALP 产品表,Chemnitz 2003,www.vialux.de。[7] C. Pruss,H. Tiziani,“使用膜镜进行非球面测试的动态零透镜”,Opt。Comm。233,15-19(2004)。[8] W. Li,Th。Bothe,W. Osten,M. Kalms,“物体自适应图案投影 - 第一部分:逆图案的生成”,Opt。& Las Eng。41 ,页。31-50 (2004)。[9] B. E. A. Saleh、M. C. Teich,《光子学基础》,John Wiley & Sons Inc. 纽约 (1991)。[10] W. Osten、W.、Jüptner,“用于 3D 形状和变形测量的现代光学传感器”,LaserOpto Oktober Vol。32,页。51-57 (2000) [11] Th。Bothe、W. Osten、A. Gesierich、W. Jüptner,“紧凑型 3D 相机”,Proc.SPIE Vol。4778,页。48-59(2002 年)。[12] B. Carlson,“光阀技术的新突破”,《高级成像》,第 62-63 页(1998 年)[13] S. Krüger、G. Wernicke、W. Osten、D. Kayser、N. Demoli、H. Gruber,“通过在卷积处理器中使用小波滤波器进行干涉条纹图案中的故障检测和特征分析”,《电子成像杂志》第 10 卷,第228-233(2001 年)。
1。x li,j ding,m elhoseiny。vrsbench:一种多功能视觉语言基准数据集,用于遥感图像理解。神经信息处理系统(NERUIPS)的第三十八大会,2024年。pdf 2。m艾哈迈德,X li,M Elhoseiny。3DCOMPAT200:用于组成识别的语言扎根大规模3D视觉数据集。第三十八届神经信息处理系统会议(Neruips),2024年。3。x li†,Jian ding†,Z Chen,M Elhoseiny。uni3dl:3D和语言理解的统一模型。欧洲计算机视觉会议(ECCV)2024。PDF 4。J Chen,D Zhu,X Shen,X Li,Z Liu,P Zhang,R Krishnamoorthi,V Chandra,Y Xiong,M Elhoseiny。迷你v2:大型语言模型作为视觉多任务学习的统一接口。arxiv。PDF 5。D Zhu,J Chen,X Shen,X Li,M Elhoseiny。Monigpt-4:使用先进的大语言模型来增强视力语言理解。国际学习表征会议(ICLR)2024(> 24K在GitHub开始)。PDF 6。J Chen,D Zhu,K Haydarov,X Li,M Elhoseiny。 视频chatcaptioner:迈向丰富的时空描述,arxiv 2023。 PDF 7。 f khan†,X li†,一座寺庙,M elhoseiny。 渔网:用于鱼类补充,检测和功能性状预测的大规模数据集和基准。 国际计算机视觉会议(ICCV),2023年。 PDF 8。 pdfJ Chen,D Zhu,K Haydarov,X Li,M Elhoseiny。视频chatcaptioner:迈向丰富的时空描述,arxiv 2023。PDF 7。f khan†,X li†,一座寺庙,M elhoseiny。渔网:用于鱼类补充,检测和功能性状预测的大规模数据集和基准。国际计算机视觉会议(ICCV),2023年。PDF 8。pdfX Shen,X Li,M Elhoseiny。MASTGAN:具有时间运动风格的视频,IEEE计算机视觉和模式识别会议(CVPR),2023年。
II。 文献调查1。 具有Kinect传感器的强大手识别:在拟议的系统中,使用Kinect传感器的深度和颜色信息来检测手的形状。 用于手势识别,使用Kinect传感器是一个困难的问题。 这种Kinect传感器的分辨率仅为640×480。 它可以很好地跟踪大物体,例如人体。 ,但是像手指一样小的东西很复杂。 [5] 2。 LED拟合的手指运动:它提出了一种将LED安装在用户手指上的方法,并使用网络摄像头跟踪手指。 将绘制的字符与数据库中存在的字符进行比较。 它返回与绘制模式匹配的所有字母。 它需要一个尖的红色LED灯源,该灯光源连接到手指上。 另外,假设网络摄像头的焦点中没有LED灯以外没有其他红色对象。 [3] 3。 增强的桌面接口:在增强的分段桌面接口方法中,提出了用于交互的方法。 此系统使用投影仪和带电的设备(CCD)摄像头供您使用指尖;用户可以使用桌面应用程序。 在此系统中,每个部分执行每个独特的任务。 左手用于选择径向菜单,而右手则用于选择进行操作的对象。 他通过使用红外相机来实现这一目标。 确定指尖在计算上是昂贵的,因此该系统定义了指尖的搜索窗口。 [4] 4。 5。 [1] 6。II。文献调查1。具有Kinect传感器的强大手识别:在拟议的系统中,使用Kinect传感器的深度和颜色信息来检测手的形状。用于手势识别,使用Kinect传感器是一个困难的问题。这种Kinect传感器的分辨率仅为640×480。它可以很好地跟踪大物体,例如人体。,但是像手指一样小的东西很复杂。[5] 2。LED拟合的手指运动:它提出了一种将LED安装在用户手指上的方法,并使用网络摄像头跟踪手指。将绘制的字符与数据库中存在的字符进行比较。它返回与绘制模式匹配的所有字母。它需要一个尖的红色LED灯源,该灯光源连接到手指上。另外,假设网络摄像头的焦点中没有LED灯以外没有其他红色对象。[3] 3。增强的桌面接口:在增强的分段桌面接口方法中,提出了用于交互的方法。此系统使用投影仪和带电的设备(CCD)摄像头供您使用指尖;用户可以使用桌面应用程序。在此系统中,每个部分执行每个独特的任务。左手用于选择径向菜单,而右手则用于选择进行操作的对象。他通过使用红外相机来实现这一目标。确定指尖在计算上是昂贵的,因此该系统定义了指尖的搜索窗口。[4] 4。5。[1] 6。带有空气鼠标的系统:带有一些传感器的设备,可以用手指磨损为空气鼠标。空气鼠标确实可以用作鼠标,以便为系统提供各种输入,而在屏幕前的空气中,空气鼠标的工作只有差异。它包含有助于为系统提供所需输入的传感器。某些手动作,例如抓取,保持手垂直的动作用于执行与真实鼠标相同的选择,拖动或滚动等动作。计算机视觉和图像理解:在本文中,Yang等人讨论了将图像序列与模型匹配的问题的替代解决方案,并且此问题通常发生在手势识别中。他们提出的方法不依赖肤色模型,并且也可以处理不良的分割。他们使用中间分组过程将两个分割过程与识别结合在一起。ACM Siggraph关于计算机动画的研讨会:在本文中,Wang等人讨论了室内和室外环境的基于颜色的运动捕获系统。在他们建议的方法中,他们使用了网络摄像头和彩色衬衫来跟踪对象。他们提出的方法结果表明,所提出的方法可用于虚拟现实应用程序。[2]
雅典这座标志性城市历史悠久、文化底蕴深厚、创新意识强,是激发创造力、促进合作和建立持久联系的理想场所。雅典是民主、西方文明、奥运会、戏剧和主要数学原理的发源地,拥有丰富的文化遗产和知识遗产,不断激励和吸引着世界。正如英国诗人约翰·弥尔顿所说,雅典是“希腊之眼,艺术和雄辩之母”。这一遗产可以追溯到历史上,自古以来,希腊一直是科学研究和技术创新的中心。毕达哥拉斯、阿基米德、柏拉图和亚里士多德等思想巨匠共同塑造了西方思想的基础。哲学家、科学家、数学家、医士甚至牧师汇聚一堂,将他们的见解结合起来,形成了一个统一的知识体系。从希波克拉底强调观察、诊断和伦理,到盖伦开创性的解剖学研究,不同领域的知识汇聚为医学和科学的重要发展铺平了道路。我们很高兴能在一个对科学、医学和技术的贡献如此多方面和持久的地方举办今年的研讨会。我们很高兴看到今年提交的四页论文和一页摘要的多样性和跨学科性,创下了历史新高,来自全球 49 个国家。我们编制了一个全面的技术计划,其中包括世界一流的口头和海报会议、主题演讲和全体会议、特别会议、教程、挑战、展览和演示、行业会议和创业演讲,为期四天的会议体验将通过我们的特别社交活动得到丰富。ISBI 2024 将涵盖与医学图像计算相关的所有领域,同时将重点扩展到生物医学成像领域的新兴人工智能 (AI) 前沿。今年的激动人心的计划包括 241 个口头报告和 717 个海报报告,主题涵盖前沿研究、创新工程解决方案和现实世界的临床应用。选定的 ISBI 2024 论文的扩展版本将被邀请提交给顶级期刊的特刊,包括 IEEE 医学成像学报:医学成像基础模型进展特刊;计算与结构生物技术杂志:智能医院 - 临床环境中医学成像 AI 的采用和信任特刊;医学图像分析杂志:组织病理学/生物成像特刊。其他特刊将刊登在计算机视觉与图像理解 (CVIU) 和生物医学成像机器学习 (MELBA) 杂志上。四位世界知名的 AI、生物医学成像和机器学习专家将发表四场发人深省的全体会议演讲。Anant Madabhushi 将以关于医疗保健领域人工智能的演讲开启全体会议,讨论其回顾性和前瞻性验证;Joseph Sifakis 博士将讨论人工智能的现状和未来发展轨迹,强调人工智能引起的风险、评估和监管;Katherine Ferrara 博士将分享她在个性化成像和治疗诊断方面的专业知识;Francis Bach 博士将介绍关于去噪扩散模型的另一种观点。第一天的活动以小组讨论结束,小组讨论深入探讨将人工智能研究转化为临床实践的复杂过程,特别是在生物医学成像领域。我们尊敬的跨学科小组成员(N. Paragios、C. Daskalakis、A. Kelekis、M. Mallet、G. Spigelman、L. Zöllei)将探讨关键主题,从解决数据管理和算法开发中的挑战到确保技术转让和扩大规模以及临床部署的资金,从而成功将 AI 技术整合到医疗保健中。今年,我们对会议形式进行了重大改变,从传统的并行临床日形式转变为两个临床焦点会议,这两个会议位于技术计划的核心,没有任何其他会议同时进行。这一选择符合我们对更广泛的互动、全面报道和观众参与的承诺。第一场会议将重点讨论肿瘤学综合精准诊断中的成像和 AI 机会。 MacLean Nasrallah 博士、Vassilis Gorgoulis 博士和 Jacob Visser 博士将就肿瘤学中临床和生物学相关问题的选择提供观点,这些问题的解决方案可通过成像和人工智能来解决,目标是通过整合来自多个生物标志物的数据来改善诊断和预后。第二场会议将讨论人工智能在神经退行性疾病(如阿尔茨海默病和神经精神疾病)中的应用。利用这些例子,Magdalini Kosta-Tsolaki 博士、Ilya Nasrallah 博士和 Paris Lalousis 博士将强调将基于成像的人工智能转化为精准诊断的挑战和机遇。六个特别会议专门为医疗需求而定制,旨在介绍开创性的工程解决方案:生物医学图像的简单复杂数据;使用 3D 电子显微镜对细胞内的分子进行成像;超越常规的 MRI:开创性的进展特别是在生物医学成像领域。我们尊贵的跨学科小组成员(N. Paragios、C. Daskalakis、A. Kelekis、M. Mallet、G. Spigelman、L. Zöllei)将探讨关键主题,从解决数据管理和算法开发中的挑战到确保技术转让和扩大规模以及临床部署的资金,从而成功将 AI 技术整合到医疗保健中。今年,我们对会议形式进行了重大改变,从传统的并行临床日形式转变为两个临床焦点会议,这两个会议位于技术计划的核心,没有任何其他会议同时进行。这一选择符合我们对更广泛互动、全面报道和观众参与的承诺。第一场会议将重点讨论肿瘤学综合精准诊断中的成像和 AI 机会。 MacLean Nasrallah 博士、Vassilis Gorgoulis 博士和 Jacob Visser 博士将就肿瘤学中临床和生物学相关问题的选择提供观点,这些问题的解决方案可通过成像和人工智能来解决,目标是通过整合来自多个生物标志物的数据来改善诊断和预后。第二场会议将讨论人工智能在神经退行性疾病(如阿尔茨海默病和神经精神疾病)中的应用。利用这些例子,Magdalini Kosta-Tsolaki 博士、Ilya Nasrallah 博士和 Paris Lalousis 博士将强调将基于成像的人工智能转化为精准诊断的挑战和机遇。六个特别会议专门为医疗需求而定制,旨在介绍开创性的工程解决方案:生物医学图像的简单复杂数据;使用 3D 电子显微镜对细胞内的分子进行成像;超越常规的 MRI:开创性的进展特别是在生物医学成像领域。我们尊贵的跨学科小组成员(N. Paragios、C. Daskalakis、A. Kelekis、M. Mallet、G. Spigelman、L. Zöllei)将探讨关键主题,从解决数据管理和算法开发中的挑战到确保技术转让和扩大规模以及临床部署的资金,从而成功将 AI 技术整合到医疗保健中。今年,我们对会议形式进行了重大改变,从传统的并行临床日形式转变为两个临床焦点会议,这两个会议位于技术计划的核心,没有任何其他会议同时进行。这一选择符合我们对更广泛互动、全面报道和观众参与的承诺。第一场会议将重点讨论肿瘤学综合精准诊断中的成像和 AI 机会。 MacLean Nasrallah 博士、Vassilis Gorgoulis 博士和 Jacob Visser 博士将就肿瘤学中临床和生物学相关问题的选择提供观点,这些问题的解决方案可通过成像和人工智能来解决,目标是通过整合来自多个生物标志物的数据来改善诊断和预后。第二场会议将讨论人工智能在神经退行性疾病(如阿尔茨海默病和神经精神疾病)中的应用。利用这些例子,Magdalini Kosta-Tsolaki 博士、Ilya Nasrallah 博士和 Paris Lalousis 博士将强调将基于成像的人工智能转化为精准诊断的挑战和机遇。六个特别会议专门为医疗需求而定制,旨在介绍开创性的工程解决方案:生物医学图像的简单复杂数据;使用 3D 电子显微镜对细胞内的分子进行成像;超越常规的 MRI:开创性的进展第二场会议将讨论人工智能在神经退行性疾病(如阿尔茨海默病和神经精神疾病)中的应用。利用这些例子,Magdalini Kosta-Tsolaki 博士、Ilya Nasrallah 博士和 Paris Lalousis 博士将强调基于成像的人工智能在精准诊断中的应用所面临的挑战和机遇。会议还特别安排了六场会议,旨在展示满足医疗需求的开创性工程解决方案:生物医学图像的简单复杂数据;使用 3D 电子显微镜对细胞内的分子进行成像;超越常规的 MRI:开创性的进展第二场会议将讨论人工智能在神经退行性疾病(如阿尔茨海默病和神经精神疾病)中的应用。利用这些例子,Magdalini Kosta-Tsolaki 博士、Ilya Nasrallah 博士和 Paris Lalousis 博士将强调基于成像的人工智能在精准诊断中的应用所面临的挑战和机遇。会议还特别安排了六场会议,旨在展示满足医疗需求的开创性工程解决方案:生物医学图像的简单复杂数据;使用 3D 电子显微镜对细胞内的分子进行成像;超越常规的 MRI:开创性的进展