街景关键词检索结果

SceneScout:朝着AI代理驱动访问盲人用户的街道视图图像

SceneScout: Towards AI Agent-driven Access to Street View Imagery for Blind Users

盲目或视力低下的人(BLV)可能会因为对物理景观的不确定性而在陌生的环境中独立旅行。虽然大多数工具专注于原位导航,但探索前旅行援助的人通常仅提供地标和转弯指令,缺乏详细的视觉上下文。街景图像包含丰富的视觉信息,并有可能揭示大量环境细节,但对于BLV人来说仍然无法访问。在这项工作中,我们介绍了Spacecout,这是一种多模式的大语言模型(MLLM)驱动的AI代理,该代理…