机器人经常面临需要多个动作的复杂任务,而顺序决策(SDM)的能力是必要的。这项工作的关键贡献是一个机器人SDM框架,称为LCORPP,它支持同时进行监督学习的能力,以实现Passive国家估计,自动推理具有声明性的人类知识,并在不确定性下计划实现长期目标。尤其是我们使用混合范式来重新确定国家估计量,并为概率计划者提供信息的先验。在经验中,移动机器人的任务是使用其运动轨迹,声明性的续文知识和人类机器人互动(基于对话和基于运动)来估算人类的影响。的结果表明,在效率和敏捷性中,我们的框架的表现要比其在办公室环境中的无学习和不合理的框架要好。
(*)我们非常感谢一位评估本文工作文件版本的匿名审稿人的评论。我们感谢AndrésAlonso-Rabisco,MartaSuárez-Varela,CristinaPeñasco,Laura Hospid和Alejandro Labanda(与)AndrésAlonso-Rabisco,MartaSuárez-Varela和Alejandro Labanda的续文。我们还感谢BancodeEspaña研究研讨会的参与者的建议,巴黎Nanterre大学的留置权研讨会和法律与经济学讲座(汉堡大学)。所表达的观点是作者的观点,不应吸引法国Banque deEspaña或欧洲系统的观点。(**)Juan S. Mora-Sanguinetti。Banque de France -Eurosystème(方向généraledesstatistiques,desétudes等人。39 rue croix -des -decits -decits -champs -75001巴黎 - 法国)和BancodeEspaña-欧洲系统(Dirección-declección-decome cancementic y esconya yestodística。c/alcalá,48-28014马德里 - 西班牙)。电子邮件:胡安。morasanguinetti.exterioal@banque-france.fr。电话:( +34)913385197。(***)AndrésAtienza-Maeso:Carlos III De Madrid大学和Banco deEspaña-欧洲系统。c/alcalá,48-28014马德里(西班牙)。电子邮件:a.itienzamaeso@gmail.com。 电话:(+34)649334906。电子邮件:a.itienzamaeso@gmail.com。电话:(+34)649334906。