摘要 - 现代自动化驾驶解决方案利用少量的计划和控制组件,其中需要对不同的驾驶情况和车辆类型进行调整,以实现最佳性能。本文提出了一种自动调整此类参数的方法,以重新进行专家演示。我们利用一个成本函数,该成本函数捕获了控制器与记录所需驾驶行为的闭环操作的偏差。参数调整。在一个案例研究中比较了三种优化替代方案,在案例研究中,在现实世界驾驶的情况下,轨迹规划师为车道调整了轨道。结果表明,即使在嘈杂的演示数据方面,提出的方法也可以显着改善手动调整的初始参数。
大型多模型模型(LMM)在单图像视觉语言任务中显示出了很好的结果。但是,他们解决多图像视觉语言任务的能力尚待改进。OpenFlamingo,EMU2和IDEFICS等现有的LMM通过对数亿个既没有有效又不有效的嘈杂的交织图像文本数据进行预训练,从而获得了多图像的能力。在本文中,我们旨在通过使用学术级别的资源进行指导调整来构建强大的多图像LMM。因此,我们精心构建包含721k多图像指导数据的螳螂教学,以培训螳螂模型家族。教学调整使螳螂具有不同的多图像技能,例如共同参考,比较,推理和时间理解。我们评估了8个多图像基准和6个单图像基准的螳螂。Mantis -IDEFICS2可以在所有多图像基准上实现SOTA结果,并击败最强的多图像基线,即IDEFICS2-8B平均13个绝对点。值得注意的是,IDEFICS2-8B已在140m的交织多图像数据上进行了预训练,该数据比Mantis-Instruct大200倍。我们观察到螳螂在持有的基准和持有的基准上表现出色,这表明其概括能力。我们进一步评估了单图像基准上的Mantis,并证明Mantis在与COGVLM和EMU2相当的情况下还保持了强劲的单像性能。我们的结果表明,多图像能力不一定是通过大规模的预训练获得的,而是通过低成本的指导调整可以获得它们。螳螂的培训和评估为未来的工作铺平了道路,以提高LMMS的多图像能力。
洛斯阿拉莫斯国家实验室是一家采取平权行动/提供平等机会的雇主,由 Triad National Security, LLC 为美国能源部国家核安全局运营,合同编号为 89233218CNA000001。通过批准本文,出版商承认美国政府保留非独占的、免版税许可,可以为了美国政府的目的出版或复制本文的已发表形式,或允许他人这样做。洛斯阿拉莫斯国家实验室要求出版商将本文注明为在美国能源部的支持下完成的工作。洛斯阿拉莫斯国家实验室坚决支持学术自由和研究人员的发表权利;但是,作为一个机构,实验室并不认可出版物的观点,也不保证其技术上的正确性。
1 苏黎世联邦理工学院理论物理学系,苏黎世 8093,瑞士 2 悉尼大学物理学院 ARC 工程量子系统卓越中心,悉尼,新南威尔士州 2006,澳大利亚 3 太平洋西北国家实验室,美国华盛顿州里奇兰 99354 4 华盛顿大学物理系,美国华盛顿州西雅图 98195 5 悉尼大学微软量子中心,悉尼,新南威尔士州 2006,澳大利亚 6 普渡大学 Birck 纳米技术中心,印第安纳州西拉斐特 47907,美国 7 普渡大学微软量子中心,印第安纳州西拉斐特 47907,美国 8 普渡大学物理与天文系,印第安纳州西拉斐特 47907,美国 9 普渡大学材料工程学院和电气与计算机工程学院,印第安纳州西拉斐特47907,美国 10 Microsoft Quantum,雷德蒙德,华盛顿州 98052,美国
变分量子算法 (VQA) 已被证明是 QML 最有前途的方法,因为它们使用经典计算机来最大限度地减少当今量子计算机的局限性。 VQA 使用经典计算机来优化参数化量子电路 (PQC),该电路在量子计算机上计算解决方案。然而,这些 VQA 的性能高度依赖于所选的超参数,这些超参数必须在执行之前确定,并且高度依赖于问题。由于已经有大量超参数可供选择,因此手动测试它们非常耗时且耗资源。因此,在经典的 ML 应用中,人们会使用自动化解决方案,但它们对 QML 的适用性几乎尚未得到研究。因此,在本研究中,我们研究了各种自动超参数调整算法对于 QML 分类问题的适用性和性能。
使用扫描电子显微镜(SEM,JSM-6700 F,JEOL,日本)对微结构进行表征。取向关系是用电子背部散射衍射(EBSD,Nordlysno,英国牛津郡)确定的。配备了能量分散X射线光谱(EDS)分析单元的300 kV传输电子显微镜(TEM,FEI TALOS F300C,U)用于高分辨率传输电子显微镜(HRTEM)观察和EDS元素分析。2.3机械性能测试
在这两种情况下,游戏代理都依赖于人类可用的相同游戏界面。算法的输入使用渲染缓冲区,可能通过对象 ID、深度信息和其他元数据进行增强,但在视觉上与玩家看到的相同或相似。游戏的输入可能是操纵杆移动、按钮点击和屏幕点击的直接模拟,通常依赖于 UI 元素的实际位置和行为。此类低级界面使学习更加困难,因为需要先从图像中提取所需信息,然后才能将其输入到策略(状态动作映射)中。相比之下,当我们将代理直接引入游戏开发流程时,它们允许我们公开代理与
克氏锥虫的基因操作仍然是一个挑战,主要是因为缺乏可用且有效的分子工具。CRE-lox 重组系统是一种位点特异性重组酶技术,是一种广泛用于实现染色体或游离 DNA 中的条件性靶向缺失、倒位、插入、基因激活、易位和其他修饰的方法。在本研究中,CRE-lox 系统经过改进,以扩展当前用于这种难以操作的寄生虫的基因工具箱。为此,我们评估了通过电穿孔直接蛋白质递送 CRE 重组酶是否可以改善克氏锥虫中 CRE 介导的重组。CRE 重组酶与克氏锥虫组蛋白 H2B 的 C 端融合,H2B 携带核定位信号并在原核系统中表达。融合蛋白经过亲和纯化后直接引入上鞭毛体和组织培养衍生的锥虫中。这可以控制基因表达,如通过打开先前转染到寄生虫中的串联二聚体荧光蛋白报告基因所证实的,在高达 85% 的寄生虫中实现了 CRE 介导的重组。进一步测试了该系统关闭基因表达、去除整合到基因组中的可选择标记以及有条件地敲除与耐药性有关的硝基还原酶基因的能力。此外,CREditing 还可以控制组织培养锥虫中的基因表达,而锥虫比上鞭毛体更难转染。本研究中显示的克氏锥虫基因组操作的重大进展可供其他人使用,以帮助通过获得或丧失功能的方法更好地了解这种寄生虫。 2020 澳大利亚寄生虫学会。由 Elsevier Ltd. 出版。保留所有权利。
尽管视觉模型(VLMS)具有多功能视觉效果(VLMS)的功能,但在现有的VLM框架内仍存在两个实质性挑战:(1)缺乏预读和视觉指导调谐方面的任务多样性,以及(2)注释错误和偏见GPT-4综合教学指导性的指导性数据。这两种挑战都导致了诸如不良的普遍性,幻觉和灾难性遗忘之类的问题。为了应对这些挑战,我们构建了v Ision -f LAN,这是迄今为止最多样化的视觉指导调整数据集,包括187个不同的任务和1,664,261个实例,来自学术数据集,每个任务都伴随着专家写作的指导。此外,我们提出了一个两阶段的指令调整框架,其中首先在V Ision -F LAN上对VLM进行了填充,并在GPT-4合成数据上进一步调整。我们发现这个两阶段的调谐框架显着超过了传统的单阶段视觉教学调音框架,并在广泛的多模式评估基准中实现了最新的效果。最后,我们进行了深入的分析以了解视觉指导的调整,我们的发现表明:(1)GPT-4合成数据并不能基本上增强VLMS的功能,而是模型对模型对人类偏爱格式的响应; (2)最小数量(例如1,000)GPT-4合成数据可以有效地使VLM响应与人类偏爱相一致; (3)视觉指导调整主要帮助大语言模型(LLMS)了解视觉特征。我们的数据集和模型可在https://github.com/vt-nlp/ vision-flan上公开获取。