想象一下,观察某人挠自己的手臂;要了解为什么,需要其他上下文。但是,在附近发现蚊子会立即为该人的不适感提供一个可能的解释,从而减轻了需要进一步信息的需求。此示例说明了微妙的视觉提示如何挑战我们的认知能力,并证明了解释视觉场景的复杂性。为了研究这些技能,我们提供了视觉谜语,这是一种基准测试,旨在测试需要常识和世界知识的视觉谜语的视觉和语言模型。基准包括400个视觉谜语,每个谜语都具有由各种文本到图像模型,问题,地面真相答案,文本提示和归因创建的独特图像。人类评估表明,现有模型显着落后于人类绩效,即精度为82%,Gemini-Pro-1.5以40%的精度领先。我们的基准包括自动评估任务,以使评估可扩展。这些发现强调了视觉谜语作为增强视觉和语言模型解释复杂视觉场景功能的宝贵资源的潜力。
• 名称:SBBS 学生奖学金 • 资助者:伦敦玛丽女王大学生物与行为科学学院 (SBBS) • 申请截止日期:2025 年 4 月 30 日 23:59 • 预计开始日期:2025 年 9 月 15 日(2025 年 9 月入学)项目概述伦敦玛丽女王大学生物与行为科学学院 (SBBS) 现接受为期 3 年的博士生资助申请。感知视觉世界是由外侧皮层中的一组区域(称为腹侧视觉流)实现的。根据一个完善的模型 [1],这些区域形成一个分层处理流,其中早期区域编码基本刺激特征,而后期区域则对更复杂的刺激(如物体和面部)作出反应。该模型提高了我们解码神经活动的能力,但未能解释神经激活如何转化为视觉感知——具体来说,信息如何在神经回路中“编码”。本博士生奖学金旨在通过因果方法来解决这个问题,以识别神经动力学的时空光遗传学扰动,从而实现对自然视觉刺激的感知。该项目将使用小鼠作为模型生物,并采用基于全息术的双光子光遗传学 [2] 来激活腹流皮层区域的神经元集合。该项目将采取以下步骤:1. 训练小鼠进行视觉纹理辨别任务,任务难度通过参数调整
摘要 - 本文描述了SeamlessVr,这是一种从身临其境可视化的方法,在虚拟现实(VR)耳机中,在屏幕上,在虚拟现实(VR)耳机中,在非弱化的可视化中。SeamlessVR将3D可视化的连续变形实现为2D可视化,与用户删除耳机后在屏幕上看到的内容相匹配。这种可视化连续性降低了将沉浸式连接到非脱落性可视化的认知工作,从而帮助用户继续屏幕上的可视化任务在耳机中开始。我们将SeamlessVR与传统方法进行了比较,即在IRB批准的用户研究中直接删除耳机,n = 30个参与者。SeamlessVr在复杂的抽象和现实场景中以及参与者对从沉浸式转变为非弱势可视化以及可用性方面的转换方面以及参与者对参与者的转变的看法而言,目标跟踪的时间和准确性具有显着优势。SeamlessVr并未引起网络智能的关注。
摘要 — 随着商用量子计算机种类的不断增加,对能够表征、验证和确认这些计算机的工具的需求也在不断增加。这项工作探索了使用量子态断层扫描来表征单个量子比特的性能,并开发了矢量场可视化来呈现结果。所提出的协议在模拟和 IBM 开发的量子计算硬件上进行了演示。结果确定了此硬件标准模型中未反映的量子比特性能特征,表明有机会提高这些模型的准确性。所提出的量子比特评估协议作为免费开源软件提供,以简化在其他量子计算设备上复制该过程的任务。索引术语 — 量子计算、量子态断层扫描、量子比特基准
摘要 深部脑刺激 (DBS) 是治疗特发性震颤 (ET) 等运动障碍的成熟方法。患者脑内 DBS 导线的定位对于有效治疗至关重要。术中需要对不同电流幅度下不同位置的刺激的改善和不良影响进行广泛评估。然而,要选择最佳导线位置,必须在脑海中将信息可视化并进行分析。本文介绍了一种称为“刺激图”的新技术,该技术总结并可视化大量相关数据,旨在帮助确定最佳 DBS 导线位置。它结合了三种方法:相关解剖结构的轮廓、定量症状评估和患者特定的电场模拟。通过这种组合,刺激区域中的每个体素都被分配一个症状改善值,从而将刺激区域划分为具有不同改善水平的区域。该技术被回顾性地应用于法国克莱蒙费朗大学医院的五名 ET 患者。除了确定最佳植入位置外,由此得到的九张图还显示,改善程度最高的区域通常位于丘脑后部底区。结果证明了刺激图在确定最佳植入位置方面的实用性。
数据包包。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。3 AS_PRECRET。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。3 AutoPlots.Benchmarkresult。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。4 autoplots.insensusresult。。。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>6 autoplot.filter。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>8 autoplot.lear-classif。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>9 autoplot.lear-classifvgggggmnnet。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。。。。。。。。。。。。。。。。。。。。10 autoplot.learnerclassifrpart。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。12 autoplot.learnerclusthererarchical。。。。。。。。。。。。。。。。。。。。。。。。。。。。。14 autoplot.learnerregr。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。15 autoplot.learnersurvcoxph。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。16 autoplot.optiminstancebatchsinglecrit。。。。。。。。。。。。。。。。。。。。。。。。。。17 AutoPlot.PredictionClassif。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。19 autoplot.predictionclust。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。21 autoplot.predictionregr。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。22 autoplot.resampleresult。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。23 autoplot.taskClassif。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。25 AutoPlots.TaskClust。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 27 AutoPlots.TaskReg。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 28尸检。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 29 29预测 。 。 。25 AutoPlots.TaskClust。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。27 AutoPlots.TaskReg。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。28尸检。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 29 29预测 。 。 。28尸检。。。。。。。。。。。。。。。。。。。。。。。。。。29 29预测。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。31 predition_grid。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。32
参数良好的转移学习(PETL)方法在将预训练的模型适应各种下游任务时显示出希望,而仅训练了少数几个参数。在计算机视觉(CV)域中,已经提出了许多PETL算法,但它们的直接就业或比较仍然不便。为了应对这一挑战,我们通过从图像识别,视频操作识别和密集的预测任务中选择30种不同,挑战性和综合数据集来为CV域构建一个统一的视觉PETL基准(V-PETL基准)。在这些数据集上,我们系统地评估了25种主要的PETL算法,并开源一个模块化和可扩展的代码库,以公平地评估这些算法。V-PETL台式在NVIDIA A800 GPU上运行,大约需要310 GPU天。我们释放所有基准,使其对研究人员更加有效和友好。此外,V-PETL台将不断更新新的PETL算法和CV任务。
我们的书探讨了生成AI如何改变我们对美学,创造力,设计和艺术欣赏的理解。它使用六个字段的方法。Emanuele带来了美学,艺术哲学和艺术心理学的观点。LEV从媒体理论,数字文化研究和计算机科学以及他作为艺术家创造数字媒体的四十年经验中贡献了观点,包括最近与生成AI的工作。这是所有这些不同观点首次结合起来分析文化AI。我们从2019年夏天开始从事这本书,交换了许多消息,评论彼此的想法并共享部分草稿。每章都是由单个作者撰写的,但它结合了我们正在进行的讨论。鉴于生成AI的快速发展及其对艺术和文化的广泛影响,我们决定在完成后立即在网上释放它。第一章于2021年12月发布,最后一章于2024年9月发布。所有章节完成后,我们进行了一些进一步的编辑。此PDF结合了这些编辑的章节版本。您可以从此网页上下载(以及可能的未来更新和添加):https://manovich.net/index.php/projects/artaver-aptrojects/artaver-aprojects/artavery-aestshetics the Aloter
本文探讨了视觉语言模型 (VLM) 作为操作代理在太空领域的应用,重点关注软件和硬件操作范例。基于大型语言模型 (LLM) 及其多模态扩展的进步,我们研究了 VLM 如何增强太空任务中的自主控制和决策。在软件环境中,我们在 Kerbal 太空计划差分博弈 (KSPDG) 模拟环境中使用 VLM,使代理能够解释图形用户界面的视觉屏幕截图以执行复杂的轨道机动。在硬件环境中,我们将 VLM 与配备摄像头的机器人系统集成在一起,以检查和诊断物理空间物体,例如卫星。我们的结果表明,VLM 可以有效地处理视觉和文本数据以生成适合上下文的操作,在模拟任务中与传统方法和非多模态 LLM 竞争,并在实际应用中显示出良好的前景。
摘要 - LARGE语言模型(LLM)由于能够使用简单的自然语言提示执行临时自然语言处理(NLP)任务,因此获得了广泛的普及。呼吁LLM的一部分是他们对公众的可接近性,包括NLP技术专长的人。但是,提示在语言结构,上下文和其他语义方面可能会有很大的不同,并且修改其中一个或多个方面可能会导致任务绩效的显着差异。非专家用户可能会发现确定提高提示所需的更改是一项挑战,尤其是当他们缺乏特定领域的知识和适当的反馈时。为了应对这一挑战,我们提出了p rompt iD,一个视觉分析系统,旨在通过探索,扰动,测试和迭代进行交互,完善和测试提示。p rompt a ID使用协调的可视化效果,使用户可以通过三种策略改进提示:关键字扰动,释义扰动以及获得最佳的context中文字中的最佳示例。p rompt a ID是通过涉及NLP专家的预先研究设计的,并通过强大的混合方法用户研究进行了评估。我们的调查结果表明,P ROMPT I ID可以帮助用户在认知开销较少的情况下迭代提示,并在建议的帮助下产生多样的提示,并分析生成的提示的性能,同时超过现有的最新提示提示性能的互动。