本报告介绍了一项研究结果,该研究旨在探讨人工智能 (AI) 算法是否能通过使用安装在 Svegros 的一个罗勒农场上空的普通监控摄像头拍摄的图像来估算植物的高度,以及效果如何。该项目具有重要的经济意义,因为太高的罗勒植株不适合商店的货架,而太小的植株又会让顾客失望。这是 Svegro 一项更大运动的一部分,该运动旨在实现植物生长自动化监测和护理,降低能耗并减少浪费。为了测量高度,在摄像头下方的传送带上移动的植物后面放置了标尺(Robel 杆),这样就可以根据 Robel 杆上未被植物覆盖的可见线的数量手动确定植物的高度。研究问题是设计一种基于人工智能的解决方案来预测植物上方可见的线数。经过两个月的图像收集和手动注释后,使用来自罗勒田的单个 Robel 杆的图像训练了三个不同复杂度的卷积神经网络 (CNN) 模型。使用 Grad-CAM 获得的结果表明,网络不会学习数线,而是将叶子的大小和形状与高度关联起来。最佳得分是平均绝对误差 0.74 和均方误差 0.83,其中 MAE 为 2.53 和 MSE 为 11.11,这对应于仅预测数据集中值。这是使用 EfficientNet0B 实现的。将结果与人类的表现进行了比较,结果显示人类的表现仍然更好,但由于数据嘈杂,结果令人印象深刻,分数超出了 Svegro 团队的预期,因此最终模型现在在那里使用。实验还表明,即使训练图像中没有 Robel 杆,也可以获得相当好的结果,这意味着 Svegro 团队可以停止布置 Robel 杆,但精度会略有下降。提出了一些改进建议,例如改变 Robel 杆的设计,以帮助未来的研究以更高的精度完全自动化该过程。
一、目的:照片证据可通过提供现场、证据或受伤受害者的视觉图像大大增强刑事调查,并可为检察官提供成功起诉案件所需的证据。在某些情况下,犯罪现场摄影师或专家可能无法到场或被要求前往现场拍照,例如家庭暴力事件、交通事故或轻微事故。虽然摄影可能不是第一响应人员的主要职责,但在适当条件下,响应人员可能会使用照片以图形方式记录案件,从而增强调查能力。
一、目的:照片证据可通过提供现场、证据或受伤受害者的视觉图像大大增强刑事调查,并可为检察官提供成功起诉案件所需的证据。在某些情况下,犯罪现场摄影师或专家可能无法到场或被要求前往现场拍照,例如家庭暴力事件、交通事故或轻微事故。虽然摄影可能不是第一响应人员的主要职责,但在适当条件下,响应人员可能会使用照片以图形方式记录案件,从而增强调查能力。
一、目的:照片证据可通过提供现场、证据或受伤受害者的视觉图像大大增强刑事调查,并可为检察官提供成功起诉案件所需的证据。在某些情况下,犯罪现场摄影师或专家可能无法到场或被要求前往现场拍照,例如家庭暴力事件、交通事故或轻微事故。虽然摄影可能不是第一响应人员的主要职责,但在适当条件下,响应人员可能会使用照片以图形方式记录案件,从而增强调查能力。
摘要在这项研究中,我们从安装在车辆上的3D激光雷达和外部交通监视摄像头的图像中融合数据,以创建经常洪水泛滥的道路部分的3D表示。这项研究中的LIDAR的点云数据是从ODU校园附近Norfolk的W 49街的一条路段收集的。交通监视摄像头安装在同一地区的公共停车大楼上。LIDAR在车辆穿越该部分时会收集连续的点云框架。使用ICP注册方法将与外部摄像头监控的多个与各个道路相关的LIDAR框架首先合并为单位点云,代表路段的局部高分辨率数字高程模型(DEM)。然后,将结果的DEM投射到监视摄像头捕获的被淹没的道路的图像上。到此目的,采用了摄像机校准技术来估计转换参数。相机校准方法依赖于一个包含点及其相应像素的数据集中的目标图像。生成了点的虚拟网格和相应的像素以运行相机校准函数。提到的数据集是借助激光雷达的内部相机上的投射点云而生成的,从而使我们能够识别对象和Curbsides。还采用了观点几何原则来创建DEM。投影结果显示了用于摄像机校准的技术技术的成功性能。深度估计是在外部相机记录的洪水图像上使用投影的DEM模型进行的。
摘要 - 使用面部视频的基于视频的心脏和呼吸率测量比传统的基于接触的传感器更有用和用户友好。但是,当前的大多数深度学习方法都需要地面真相脉冲和呼吸道波来进行模型训练,这很昂贵。在本文中,我们提出了校准Phys,这是一种基于视频的心脏和呼吸率测量方法,可以在多个相机之间校准。Calibibrationphys通过使用由多个相机同时捕获的面部视频来训练无监督标签的深度学习模型。对比度学习,以使使用多个摄像机通过同步视频预测的脉搏和呼吸波为正,而来自不同视频的脉冲和呼吸波为阴性。校准还通过数据增强技术提高了模型的鲁棒性,并成功利用了特定相机的预训练模型。利用两个数据集的实验结果表明,校准范围的表现优于先进的心脏和呼吸速率测量方法。由于我们仅使用来自多个相机的视频来优化摄像头模型,因此我们的方法使使用任意摄像机进行心脏和呼吸率测量很容易。
对计算机视觉中以自我为中心任务的研究主要集中在标题相机上,例如鱼眼摄像机或沉浸式耳机内的嵌入式相机。我们认为,越来越多的光学传感器的微型化将导致相机在各个位置的多产摄像机中的多产。这将为计算机视觉中的确定任务带来新的观点,并使关键领域(例如人类运动跟踪,身体姿势估计或行动识别)尤其是针对下半身,通常会被遮挡。在本文中,我们介绍了Egosim,这是一种新颖的人体镜头相机的模拟器,该相机从佩戴者的身体上从多个角度产生了逼真的自我中心效果图。Egosim的关键特征是它使用真实的运动捕获数据来渲染运动伪像,这在手臂或腿部的摄像机中尤其明显。此外,我们还介绍了多款镜头的数据集,该数据集来自六个身体上的相机和地面真实真实的全身3D姿势:119小时的数据是从四个高效率的虚拟环境中的积极运动序列得出的,我们使用13个Gopro的5小时的运动范围和3 g的运动来增强,这些数据来自5小时,并从13个小时内增强。 套装。我们通过训练仅端到端视频3D姿势估计网络来证明Egosim的有效性。分析其域间隙,我们表明我们的数据集和模拟器大大帮助推断现实世界数据。EgoSim代码和MultieGoview数据集:https://siplab.org/projects/egosim
语义细分是执行场景理解的有效方法。最近,3D鸟视图(BEV)空间中的细分已被驱动策略直接使用。但是,在商用车中使用的环绕式鱼眼摄像机的BEV细分工作有限。由于此任务没有现实世界的公共数据集,并且现有的合成数据集由于遮挡而无法处理Amodal区域,因此我们使用Cognata Simulator创建一个合成数据集,其中包括各种道路类型,天气和照明条件。我们将BEV细分概括为使用任何凸轮模型;这对于混合不同的相机很有用。我们通过在Fisheye图像上应用圆柱整流并使用基于标准LSS的BEV分割模型来实现基线。我们证明,我们可以在没有不明显的情况下实现更好的性能,这具有增加的运行时效应,这是由于预处理,视野和重新采样的伪像而导致的。此外,我们引入了一种可学习的bev池层策略,对鱼眼摄像机更有效。我们以遮挡推理模块来探讨该模型,这对于估计BEV空间至关重要。fisheyebevseg的定性 - 在视频中展示了https://youtu.be/hftpwmabgs0。
可穿戴摄像机提供了一种创新的方式,可以发现对患有心血管疾病的人的生活经历的新见解。可穿戴摄像机可以单独使用或补充更传统的研究方法,例如访谈和参与者观察。本文概述了使用可穿戴摄像机进行数据收集的好处,并概述了对这种方法感兴趣的研究人员和临床医生的一些关键注意事项。我们提供了一个案例研究,描述了使用可穿戴摄像机以及如何使用数据的研究设计。- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -----------------------------------------------------------------------------------------------------》•民族际摄像机•研究方法•定性•机器学习•图像
摘要 近几年来,高分辨率固态传感器矩阵相机引起了摄影测量学家的极大兴趣。由于此类相机的分辨率有限,迄今为止,其实际应用仅限于数字近景摄影测量。尽管如此,直接获取和处理数字图像数据的优势,加上固态传感器的精确度潜力和不断提高的分辨率,已开始使数码相机在航空摄影测量的许多应用中引起人们的兴趣。本文介绍了两项实用研究,即利用直升机使用高分辨率数码静态摄像机进行数字空中三角测量以及自动生成数字高程模型和正射影像。试验区域是瑞士的一个高山村庄和一个山体滑坡区。本文介绍了固态矩阵传感器的当前性能和未来发展,并讨论了数码相机在航空应用中的优缺点。利用自校准技术,在使用 1:20,000 比例尺影像进行数字航空三角测量时,平面坐标外部验证精度为 2 厘米,高程坐标外部验证精度为 5 至 6 厘米,数字高程模型的飞行高度精度可达地面以上 0.03%。