摘要 - 近年来,由于诸如提高生产力和劳动力降低等福利,对农业机器人技术的兴趣已大大增加。但是,与非结构化环境相关的当前问题使机器人收割机的发展具有挑战性。大多数农业机器人技术的研究都集中在单臂操纵上。在这里,我们提出了一种双臂方法。我们提出了配备了RGB-D相机,切割和收集工具的双臂果实收集机器人。我们利用合作任务描述来最大化双臂机器人的功能。我们设计了一个基于分层的二次编程控制策略,以实现与机器人和环境相关的一系列硬约束:机器人联合限制,机器人自我收集,机器人 - 水果和机器人树的碰撞。我们结合了深度学习和标准图像处理算法,以检测和跟踪现场的树干。我们验证了对现实世界RGB-D图像的感知方法以及对模拟实验的控制方法。
该讲座系列概述了计算机视觉技术的最新进展,因为它们适用于民用基础设施条件评估问题。特别是在计算机视觉,机器学习和结构工程领域的相关研究合成,以提供新课程。所涵盖的主题分为三个主要类别:监视应用程序,空间测量应用程序和检查应用程序。讨论的监视应用程序包括应变和位移的静态测量,以及模态分析的位移的动态测量。空间测量应用包括3D重建资产重建的运动和摄影测量的结构。所涵盖的检查应用程序包括计算机视觉和深度学习方法,用于识别诸如结构组件,表征本地和全球可见损害以及检测参考图像的变化的上下文。
印度信息技术研究所Kottayam(IIIT Kottayam)于2015年成立为在印度政府行政控制下建立的IIIT之一,后来宣布为2017年颁布的议会法案。印度信息技术研究所Kottayam(IIIT Kottayam)于2015年成立为在印度政府行政控制下建立的IIIT之一,后来宣布为2017年颁布的议会法案。IIIT Kottayam在本科,研究生和博士水平上授予了一流的技术教育。 在计算机科学和工程学,电子和通信工程,AI&DS和网络安全的研究生和研究生课程下,可以在研究所获得研究所。 iiitk设有一个带有现代设施的尖端校园。 访问我们的计算工程和数据建模研究所(CEDM)是一个研究小组,重点是现实生活数据问题的计算建模。 该小组探讨了来自生物学,语言学,社会学,文化,计算机视觉和模式识别等不同领域的问题的编译建模和工程解决方案。 计算建模将有助于模拟许多复杂的过程并帮助更好地理解它们。 该小组对机器学习的数学建模和理论观点也有浓厚的兴趣。IIIT Kottayam在本科,研究生和博士水平上授予了一流的技术教育。在计算机科学和工程学,电子和通信工程,AI&DS和网络安全的研究生和研究生课程下,可以在研究所获得研究所。iiitk设有一个带有现代设施的尖端校园。访问我们的计算工程和数据建模研究所(CEDM)是一个研究小组,重点是现实生活数据问题的计算建模。该小组探讨了来自生物学,语言学,社会学,文化,计算机视觉和模式识别等不同领域的问题的编译建模和工程解决方案。计算建模将有助于模拟许多复杂的过程并帮助更好地理解它们。该小组对机器学习的数学建模和理论观点也有浓厚的兴趣。
位置估计的准确性受能够提供相对目标测量值的传感器/信标数量的影响。虽然单个传感器/信标是最容易实现的系统,但必须进行多次测量才能确保位置信息的准确性。多个传感器/信标可以实现更及时的位置验证,但会增加系统复杂性。例如,传感器/信标的属性及其相对于目标物体的几何形状会影响系统的准确性。如果相同的传感器/信标太近,它们将提供几乎相同的信息,对知识库的补充很少。如果传感器/信标相距太远,可能会遗漏一些重要信息。因此,最佳传感器/信标间距介于这两个极端之间。本文将进一步探讨一种控制传感器/信标阵列几何形状的方法,以在实验期间保持最佳跟踪性能配置。
摘要: - 该项目概述了基于视觉的语音控制机器人系统,该系统涉及牙科工具,旨在提高牙科服务的质量和卫生。使用带有网络摄像头的 Raspberry Pi 上的 OpenCV 和带有麦克风的 Google Speech API 进行语音识别,实现实时计算机视觉。机器人知道需要哪种牙科器械,并在牙医要求时自行拾取牙科器械,从而最大限度地减少接触。该应用程序还通过提供工具的实时视觉反馈来改善与工具相关的工作条件,包括准确定位和握持工具。这种方法增强了仪器的可达性,提高了清洁度,并使牙科手术能够持续进行而不会频繁中断。
摘要:在自然灾害,事故,医疗紧急情况和其他事件等紧急情况下的救援工作充满了挑战和危险。考虑到救援人员的安全和救援任务的紧迫性,有必要使用救援机器人执行环境检测和救援任务。该项目旨在通过整合双眼视觉技术来增强搜索和救援机器人的功能。通过为这些机器人提供复杂的双目系统,我们旨在改善其深度感知,对象识别和整体情境意识。该项目将涉及与现有机器人平台集成的专业视觉系统的开发。最终目标是使救援机器人能够进行更有效的导航和反应能力,从而提高其在批判性搜索和救援任务中的效率和成功。
PDPM IIITDM JABALPUR电子和信息技术部(MEITY),印度政府已于2015年建立了电子和ICT学院。在第二阶段,PDPM IIITDM Jabalpur的学院旨在在电子和ICT的利基领域进行可扩展的培训计划,以开发所需的知识库,技能和工具,以释放印度人口的才华。除了有关电子,信息和通信技术基本和高级主题的教师发展计划(FDP)外,该学院还针对新兴地区的学生,公司部门和研究促进研讨会进行定制的培训计划。学院被元素确定为培训,实习,研究和咨询计划的活动中心。
大脑计算机界面(BCIS)是传统上用于医学的系统,旨在与大脑相互作用以记录或刺激神经元。尽管有好处,但文献表明,专注于神经刺激的侵入性BCI当前的脆弱性使攻击者能够控制。在这种情况下,神经网络攻击成为能够通过进行神经过度刺激或抑制来破坏自发神经活动的威胁。先前的工作在小型模拟中验证了这些攻击,其神经元数量减少,缺乏现实世界中的复杂性。Thus, this work tackles this limitation by analyzing the impact of two existing neural attacks, Neuronal Flooding (FLO) and Neuronal Jamming (JAM), on a complex neuronal topology of the primary visual cortex of mice consisting of approximately 230,000 neurons, tested on three realistic visual stimuli: flash e ff ect, movie, and drifting gratings.在每个刺激的三个相关事件中评估了每次攻击,还测试了攻击25%和50%神经元的影响。根据尖峰和偏移百分比的数量,结果表明,攻击对电影产生了最大的影响,而黑暗和固定事件是最强大的。尽管两种攻击都可以显着发作神经活动,但果酱通常更具破坏性,产生更长的时间延迟,并且患病率更高。最后,果酱不需要改变许多神经元以显着发神经活动,而FLO的影响随着攻击的神经元数量而增加。
交通管制是城市规划,安全性和效率的重要组成部分。在这项研究中,我们研究了如何使用计算机愿景实现基于AI的流量控制,并将其与较旧的方法进行比较。我们研究了人工智能系统在优化交通流,改善安全性和减少拥塞的潜在好处。该研究比较了基于计算机的AI流量控制器与传统交通管理方法的性能。交通拥堵是城市中普遍存在的问题,导致时间浪费,更高的燃料使用和增加的污染。为了解决这些问题,人们对使用人工智能(AI)和计算机视觉技术进行交通管理一直引起人们的兴趣。我们研究了基于AI的交通控制系统的创建和评估,以及与现有技术相比的创建和评估。应用了一种使用对象计数概念的新方法。我们提出了一个可以使用计算机视觉和人工智能的实时项目计数数据来智能控制流量的系统。我们根据几个关键的性能指标评估了两种交通控制方法,包括行人检测和单个车道中车辆计数的准确性。与常规方法相比,AI驱动的交通控制系统表现出了值得注意的优势。它的旅行时间减少了15%,燃油消耗降低了10%,交通流量效率提高了25%。值得注意的是,AI系统还降低了30%的交通事故,强调了其显着提高道路安全性的潜力。
要使用Pytorch中的数据增强,您将需要定义一组可以应用于培训数据的转换功能。您还需要确保将转换功能始终应用于输入图像和相应的注释。然后,您可以使用Torchvision.datasets.ObjectDetectionDataSet类使用批次的方式,将这些转换应用于培训数据。