远程视觉辅助 (RSA) 已成为一种针对视障人士 (VI) 的对话辅助技术,其中远程视觉代理通过类似视频聊天的通信为视障用户提供实时导航帮助。在本文中,我们进行了文献综述并采访了 12 位 RSA 用户,以全面了解代理和用户在 RSA 中面临的技术和导航挑战。技术挑战分为四类:代理在定位和定位用户方面的困难;获取用户周围环境和检测障碍物;传递信息和了解用户特定情况;应对网络连接不佳。在 15 个真实场景(8 个室外,7 个室内)中为用户呈现导航挑战。先前的研究表明,计算机视觉 (CV) 技术,尤其是交互式 3D 地图和实时定位,可以解决这些挑战的一部分。然而,我们认为,解决这些挑战的方方面面需要人机协作的新发展,我们将其形式化为五个新兴问题:使物体识别和避障算法具有盲目感知能力;在较差的网络下定位用户;识别 LCD 屏幕上的数字内容;识别不规则表面上的文本;预测画外行人或物体的轨迹。解决这些问题可以推动计算机视觉研究并迎来下一代 RSA 服务。