摘要这项研究是由社会在通过手语与言语障碍的人交流的挑战所激发的。尽管手语是对语音社区的重要交流手段,但公众中的许多人不了解手语,使个人之间的互动困难。本研究旨在通过实施计算机视觉技术来克服这些障碍,以通过Android应用将SIBI手语转化为文本。该研究方法涉及通过采访,文献研究和系统开发的数据收集。机器学习培训作为应用程序的后端使用CNN算法,该算法将以张紧型模型存储在tflite格式中。使用SIBI字母数据训练模型的结果的准确性约为81.48%。应用程序测试表明,在明亮的房间条件下,申请准确性达到81.48%,但在昏暗条件下降至76.92%,在户外80.77%的光线充足。该应用程序很难在弱光条件下识别手姿势。本研究的结论提供了建议,通过将数据首先处理成负面或为应用程序添加照明功能,以提高昏暗条件的准确性。希望该应用程序可以为那些难以通过SIBI手语与聋人交流的人们提供解决方案。Metode Penelitian Melibatkan Pengumpulan Data Melalui Wawancara Dan Studi文学,Serta Pengembangan Sistem Menggunakan Pendekatan敏捷。关键字:CNN算法,手语,SIBI,计算机视觉,Android摘要这项研究是由社区在与具有标志的个人交流的挑战所激发的。尽管手语是一种对说话社区社区很重要的交流手段,但公众中的许多人不了解手语,因此很难在个人之间进行互动。本研究旨在通过实施计算机视觉技术来克服这些障碍,以通过Android应用将SIBI手语转化为文本。使用CNN算法作为后端应用程序的机器倾斜训练将以.tflite格式存储为TensorFlow模型。使用SIBI字母数据数据的模型培训结果的准确性约为81.48%。应用程序测试表明,在明亮的房间条件下,申请准确性达到81.48%,但在昏暗条件下降至76.92%,在户外80.77%的光线充足。应用程序难以在弱光条件下识别手姿势。结论本研究通过将数据处理为负面或在应用程序中添加照明功能来提高昏暗条件的准确性。希望该应用程序可以为与SIBI手语沟通困难的人们提供解决方案。关键字:CNN算法,手语,SIBI,计算机视觉,Android
光子平台是量子技术的绝佳环境,因为弱光子环境耦合可确保长时间的连贯时间。Quantu-Photonics的第二个关键成分是光子之间的相互作用,可以通过光学非线性以跨相调节(XPM)形式提供。这种方法为量子光学1 - 12中的许多提议的应用和信息处理13,14提供了基础,但是实现其潜力需要强大的单光子级非线性相移以及可扩展的非线性元件。在这项工作中,我们表明,具有嵌入式量子孔的微柱中的激子 - 孔子可以提供所需的非线性。这些结合了激子15、16的强相互作用与微米大小的发射器的可伸缩性。17 - 19。,我们使用衰减至单个光子平均强度的激光梁观察到每个粒子的XPM高达3±1 mrad。我们的工作是第一个垫脚石,我们放下了一条途径,以在极化晶格中进行量子信息处理。XPM的量子应用包括传送1,光子数检测2,计量学6、7,密码8和量子信息处理(QIP)(QIP),在其中提议将其作为通往电路9的途径-10
摘要:由于成本效益和易于操作,室温长波红外(LWIR)检测器比低温溶液优先。当前未冷却的LWIR探测器(例如微量体计)的性能受到降低的灵敏度,缓慢的响应时间和缺乏动态光谱可调性的限制。在这里,我们提出了一个基于石墨烯的有效室温LWIR检测器,利用其可调的光学和电子特性,具有高检测性和快速响应时间。固有的弱光吸收可以通过与光腔耦合的图案化石墨烯上的狄拉克等等离子增强。通过不对称载体生成环境,通过Seebeck效应将吸收的能量转化为光伏。此外,通过静电门控实现8-12μmLWIR带中的动态光谱可调性。拟议的检测平台铺平了新一代未冷却的基于石墨烯的LWIR光电探测器,用于诸如分子传感,医学诊断,军事,安全和空间之类的广泛应用。关键字:红外探测器,石墨烯,二维材料,狄拉克等离子,光热效应
“为人类运动和监视的17 DOF类人生物机器人的设计和实施”项目引入了一个多功能的类人动物机器人,该机器人将娱乐和安全功能结合在一起。该创新的机器人配备了17度的自由度(DOF),为其提供了复制各种人类运动并用作监视工具的灵活性。机器人的硬件组件包括伺服电机,自定义机器人框架,Arduino微控制器,Nodemcu和ESP32CAM模块,用于监视功能。ESP32CAM允许实时视频流和监视。它旨在提高安全性,可以远程控制以帮助通过实时视频提要提供视觉反馈。机器人的附加功能是通过激活手电筒来照亮其周围环境,在弱光情况下提供帮助。在类似人类运动的领域,机器人能够复制各种行动,例如步行,挥舞等等。此功能提供了有趣的元素,并突出了机器人在交互式设置中的潜力。此外,包含一个被动红外(PIR)传感器允许机器人有效地检测人类的存在和运动。它可以通过传输警报,适合于家庭或办公室的监视或协助各种安全相关申请来响应人类活动。“ 17 DOF类人生物机器人的设计和实施
关键词:雷达 海岸 光学接收系统 双频 三通道 摘要:海岸带多潮间带、岛礁,传统的船载声学测量方法效率极其低下,因此海岸带三维综合测量一直是遥感领域的一个难点。由于海水蓝绿光窗透明度好,激光点云数据能快速准确区分浅海水体地形特点。目前国际上对海岸带最有效的探测方式是机载双频激光雷达探测技术,该技术测量速率高,覆盖范围广。激光器同时输出1064nm和532nm双波长激光,1064nm激光形成海面回波,532nm激光穿透海水形成浅海和深海回波。但在海水传播过程中,随着水深的增加,光子散射数增多,会造成回波信号的衰减。因此对大动态范围内的弱光探测精度不高,一直是近岸航空测深的难点。针对这一问题,设计了分场三通道光学接收系统。ZEMAX仿真结果表明,双通道激光雷达三通道接收光学系统有效降低了光学元件与通道间的光串扰,实现了不同水深通道的能量收集。该结构对光电信号进行了动态压缩,提高了信噪比。
已经做出了许多努力,以实现H 2 O掩盖的振动指纹。例如,由于其IR吸收带从H 2 O的吸收带转移,因此在FTIR测量中使用了替代溶剂(例如D 2 O,CCL 4和CS 2)。[4]另一种潜在的途径是缩短水溶液中的有效IR光学路径,以抑制H 2 O的干扰,例如吸收的总反射率(ATR)。[6]然而,由于弱光 - 材料的相互作用,溶剂替换和ATR都无法增强对纳米级的FTIR敏感性。因此,开发了表面增强的红外吸收(SEIRA)技术,用于原位探测纳米级样品,通过增强的表面等离子体的近场。[7]尽管基于金属的seira已经达到了高度的敏感性,但检测极限最终通过中IR中金属的光限制相对较差,最终限于单层分子。石墨烯等等离子体的极高光限制使其对Seira应用具有吸引力。[8]石墨烯 - 普拉烯增强FTIR的敏感性可以达到亚纳米尺度,这在识别固相和气相中的分子方面已被证明。[8a,9],在内部反射过程中,石墨烯可以增加水溶液中分子的IR吸收,但是缺乏可调性以及对笨重的ATR仪器的利用可防止其实际使用。[11]
状态估计是成功实施机器人系统的关键组成部分,依赖于相机,LIDAR和IMU等传感器。然而,在现实情况下,这些传感器的性能是通过具有挑战性的环境来划分的,例如不利的天气条件和弱光场景。新兴的4D成像雷达技术能够在不利条件下提供强大的感知。尽管有潜力,但对于嘈杂的雷达数据没有明确的几何特征而言,室内环境仍然存在挑战。此外,雷达数据分解和视野(FOV)的差异可能导致不准确的测量结果。虽然先前的研究探索了基于多普勒速度信息的雷达惯性探测仪,但由于FOV和雷达传感器的分辨率差异,估计3D运动的挑战仍然存在。在本文中,我们解决了多普勒速度测量不确定性。我们提出了一种在管理多普勒速度不确定性的同时优化车身速度的方法。基于我们的观察结果,我们提出了双成像雷达配置,以减轻雷达数据中差异的挑战。为了获得高精度3D状态估计,我们引入了一种策略,该策略将雷达数据与消费级IMU传感器无缝整合,并使用固定lag平滑光滑优化。最后,我们使用现实世界3D运动数据评估了我们的方法,并演示了本地化和映射的流任务。
展示人工智能 (AI) 能力的挑战之一是找到有效的方式来以切实的方式展示其能力。在本文中,我们使用 Unitree A1 四足机器人展示了一个基于视觉的 AI 演示器。该演示器旨在供苏黎世应用科技大学人工智能中心 (CAI) 使用,以在现实环境中展示 AI 的能力,例如展览。为了实现这一点,我们开发了一个应用程序,允许机器人响应四种特定的手势。该软件从机器人的集成摄像头接收实时图像,并利用 MediaPipe 框架进行手部跟踪和界标点生成,这些界标点实时显示在远程 PC 上。我们根据 3768 个手势记录训练的逻辑回归模型随后会检测站在机器人前面的用户做出的手势。该模型与机器人的系统进行通信,允许通过用户界面控制其检测和姿势。在我们的实验室测试中,机器人展示了每个手势的平均准确率为 91%。然而,我们发现在强光或弱光环境中,机器人的性能不太可靠,准确率仅为 70%。为了提高机器人在这些条件下的性能,我们建议实施额外的算法或微调 MediaPipe 管道。总的来说,我们的演示器为 CAI 部门提供了一个展示 AI 的宝贵工具,因为它允许观众使用直观的手势与机器人互动,并通过观察机器人的即时反应来亲身体验 AI。
夜间摄影经常在低光和模糊之类的挑战中挣扎,源于黑暗的环境和长时间的暴露。当前方法要么无视Pri-ors,直接拟合端到端网络,导致不稳定的照明,要么依靠不可靠的手工制作的先验来限制网络,从而为最终结果带来了更大的错误。我们相信,数据驱动的高质量先验的力量,并努力在事先提供可靠和同意的情况下,规避了手动先验的限制。在本文中,我们提出了使用矢量量化的代码书(VQCNIR)更清晰的夜间图像修复,以实现对现实世界和合成基准测试的重新恢复结果。为了确保忠实地恢复细节和照明,我们提出了两个基本模块的合并:自适应照明增强仪(AIEM)和可变形的双向交叉注意(DBCA)模块。AIEM利用了功能与动态照明功能和高质量代码簿功能之间的一致性的通道间相关性。同时,DBCA模拟通过双向交叉注意和可变形的会议有效地整合了纹理和结构信息,从而增强了平行解码器之间的细粒细节和结构性保真度。广泛的实验验证了VQCNIR在弱光条件下增强图像质量的显着好处,展示了其在合成和实际数据集中的最新性能。该代码可在https://github.com/alexzou14/vqcnir上找到。
瀑布是一个严重的公共卫生问题,65岁以上的人是跌倒最严重的病变之一。也有一个事实,即瀑布会对老人的心态产生负面影响,从而导致自尊心低下,因为它变得依赖一个不断监视他的人,除了不断去医院旅行之外。一种自然而实用的方法,用于脆弱的E-SASO运动人员,并需要立即跌倒。因此,这项工作提出并评估计算视觉模型,以改善有跌倒风险的个人的监测和安全性,例如老年人或流动性降低的人。该模型包括一个生成神经网络,时空卷积块,光流计算,跟踪感兴趣区域的技术以及用于计算异常分数的饲料强制神经网络。分析模型与红外记录一起工作也很重要,因为在弱光环境中也可能发生跌倒。分析包括以不同组合应用各种图像处理过滤器和技术,以寻求找到满足高灵敏度和高F1分数的模型。使用RGB摄像机的最终神经网络模型达到99.21%的延迟性和0.98 F1得分,而使用红外摄像机的模型达到100%灵敏度和0.98的F1得分,超过了其他文献建议。异源评分技术已被证明具有一种很好的适应能力,即使在新视频场景中曝光,也能够识别跌倒,也是在实际情况下使用系统的理想选择。