摘要。从单个图像中,视觉提示可以帮助推断出固有和外在的摄像头参数,例如焦距和重力方向。此单图像校准可以使各种下游应用程序受益,例如图像编辑和3D映射。当前解决此问题的方法是基于带有线条和消失点的经典几何形状,或者是基于训练有素的端到端的深神经网络。学习的方法更强大,但很难概括到新的环境中,并且不如其经典同行准确。我们假设它们缺乏3D几何形状所提供的约束。在这项工作中,我们介绍了Geocalib,这是一个深层神经网络,通过优化过程利用3D几何的通用规则。GeoCalib是端对端训练的,以估算摄像机参数并学会从数据中找到有用的视觉提示。在各种基准测试中的实验表明,与现有的经典和学识渊博的方法相比,Geocalib更健壮,更准确。其内部优化估计不确定性,有助于标记故障案例并受益于下游应用程序,例如视觉定位。代码和训练有素的模型可在https://github.com/cvg/geocalib上公开获得。
大语言模型(LLMS)创造了令人兴奋的可能性,以加速材料科学中的科学发现和知识传播。虽然LLM已成功地用于选择科学问题和基本挑战,但他们目前不属于实用的材料科学工具。从这个角度来看,我们在材料科学中显示了LLM的相关故障案例,这些案例揭示了与理解和推理有关复杂,相互联系的材料科学知识的当前局限性的局限性。鉴于这些缺点,我们概述了建立基于域知识的材料科学LLM(Matsci-llms)的框架,该框架可以实现假设产生,然后进行假设检验。在很大程度上,获得表现型Matscilms的途径在于构建源自科学文献中采购的高质量的多模式数据集,其中各种信息提取挑战持续存在。因此,我们描述了关键材料科学信息提取挑战,这些挑战需要克服,以构建大规模的多模式数据集,以捕获有价值的材料科学知识。旨在实现解决这些挑战的连贯努力,我们概述了通过六个互动步骤将Matsci-llms应用于现实世界材料发现的路线图:1。材料查询; 2。数据检索; 3。材料设计; 4。Insilico评估; 5。实验计划; 6。实验执行。最后,我们在可持续性,包容性和政策制定方面讨论了Matscillms对社会的一些广泛含义。