从演示中学习是用户教机器人的常见方法,但它很容易出现虚假的特征相关性。最近的工作构建了状态抽象,即具有与任务相关特征的视觉表示,从语言作为执行更具概括性学习的方式。但是,这些抽象还取决于用户对任务中重要的内容的偏好,而单独使用语言可能很难描述或不可证明。我们如何构建抽象来捕获这些潜在偏好?我们观察到人类的行为如何揭示了他们如何看待世界。我们的关键见解是,人类行为的变化告诉我们,人类如何看待世界的偏好存在差异,即他们的状态抽象。在这项工作中,我们建议使用语言模型(LMS)查询直接知道行为发生变化的偏好。在我们的框架中,我们以两种方式使用LM:首先,给定对任务的文字描述和状态之间行为变化的知识,我们向LM查询可能的隐藏偏好;其次,考虑到最可能的偏好,我们询问LM以构建状态抽象。在这个框架中,LM还可以直接询问人类自己的估计。我们证明了我们的框架在模拟实验,用户研究以及执行移动操纵任务的真实斑点机器人中构建有效的偏好条件抽象的能力。
在使用更新的用户界面重新访问功能或从新的,复杂或使用较少的应用程序中的错误重新介绍时,很少会寻求正式支持[29,34]。相反,老年人可以使用试用方法,咨询YouTube视频,或者寻求朋友和家人的社会支持[29,33,34]。在最近的一项研究中,23名老年人中有16名(他们既不是移动技术使用的绝对初学者也不是专家),报告说从未在其移动设备上使用帮助菜单[34]。这种趋势反映了使用说明手册[2,11,25,29,40]的范式转变。相反,老年人在持续移动使用期间广泛使用两种类型的技术支持,自我探索[34],反复试验[23,29]或“播放” [41] [41])和社会支持[33,34]。为了满足老年人不断变化的技术支持偏好,新的支持工具正在出现[8,17,38,45]。同样重要但探索较少的是老年人个性,生活经验和一般学习偏好的异质性如何影响他们的技术支持选择。有些人可能更喜欢自我探索,而有些人则在继续移动使用期间寻求社会支持[29,34,35]。即使人们喜欢一种技术支持,他们也可能不会认为它是有效的或高质量的[34]。技术支持可以在确保老年人积极地体验技术方面发挥重要作用[1]。积极的经验可以在老年人中提高技术使用的信心[1,3]。充满信心,老年人更加开放探索和使用新的应用程序,功能和服务。在继续使用期间,积极的情绪反应不仅是由技术的有用性和易用性触发的,而且还可以易于学习使用它及其技术支持的质量[26,33,34]。例如,已显示结构化计算机课程可以增加自我报告的信心,并减少计算机使用过程中的焦虑,例如在网上查找健康信息时[6]。计算机焦虑症可以预测老年人的计算机使用广度[9,10],这可能是由于年龄刻板印象所引起的,即老年人的技术能力少于年轻人的技术能力[24]。由于这种刻板印象的威胁,使用移动应用程序后,老年人可能会感到年龄较大,尤其是当这些应用程序不熟悉时[5]。焦虑和信心构成了与一般学习相关的各种感觉的末端[20]。我们还知道,这些感觉会影响老年人的技术吸收和使用[9,24,34,42]。但是,他们在老年人的技术支持选择中的作用仍然未知。基于过去的工作,我们假设:
年轻消费者并非天生忠诚度较低,但他们对自己所忠诚的品牌更加挑剔。年轻消费者更换计划时,往往出于几个关键原因。最常见的因素包括更有吸引力或更有价值的获得财务奖励的方式、获得非财务利益的途径更多以及计划结构更简单。这些方面再次表明忠诚度计划基础仍然很重要,因为价值和简单性是所有年龄段最重要的属性,也是消费者转向竞争对手计划的主要原因。为了吸引、吸引和留住所有年龄段的忠诚会员,零售商应继续提供财务价值和简单性,同时探索增加数字驱动、面向社区的功能的机会。
药物:(n = 1209)(n = 1434)•ACE抑制剂443(37%)531(37%)•β受体阻滞剂612(51%)731(51%)•钙通道阻滞剂343(28%)447(31%)447(31%)•Diuretics 477(39%)457(39%)457(32%)(32%)(32%)(32%)(32%457(32%)(32%(32%)(32%)(32%(32%)(32%(32%)(32%)(32%(32%)(32%(32%) (54%) 884 (62%)* • ARB 202 (17%) 257 (18%) • Anticoagulants 483 (40%) 353 (25%)* • Anti Arrhythmia Class 3 115 (10%) 177 (12%)* • Anti Arrhythmia Class 1 34 (3%) 50 (3%) • Nitrates 139 (11%) 164 (11%) • Cardiac糖苷99(8%)92(6%)•醛固酮抑制剂36(30%)19(13%)*•肾素抑制剂1(0%)0(0%)0(0%)•阳性官方7(1%)1(0%)1(0%)*初级指示:(n = 1282)(n = 1530)(n = 1530)(n = 1530)•AV Block 384(30%)(30%)(30%)(30%)(30%)(30%)(16%)(30%)(30%) 1(0.06%)•起搏器升级143(11%)105(6.9%) *•PAVE 25(2%)0 *•预防/终止速度性心律失常1(0.08%)6(0.4%)6(0.4%)•Sinus节点功能障碍663(52%)1037(52%)1037%(68%) *(8%) *(5%) *(5%) *(5%)(5%)(5%)(5%)
设计奖励功能的复杂性一直是深入强化学习(RL)技术的广泛应用的主要障碍。描述代理商的所需行为和属性也可能很困难。一种新的范式,称为从人类优先(或基于偏好的RL)学习的强化学习已成为有前途的解决方案,其中从BE-HAVIOR轨迹之间从人类偏好标签中学到了奖励功能。但是,现有的基于首选项的RL的方法受到准确的Oracle首选项标签的限制。本文通过开发一种从各种人类偏好中学习的方法来限制这种局限性。关键思想是通过在潜在空间中的规范和纠正来稳定奖励学习。为了确保时间一致性,对奖励模型施加了强大的限制,该模型迫使其范围的空间接近非参数分配。此外,基于置信的奖励模型结合方法旨在产生更稳定和可靠的预测。对DMCON-trol和Meta-World中的各种任务进行了测试,并在从不同的反馈中学习时,对现有基于首选项的RL算法显示出一致且显着的改进,为RL方法的现实世界应用铺平了道路。
随着AI生成的Content(AIGC)的开发,文本与ADIO模型正在引起广泛关注。然而,由于自然语言的固有信息密度和有限的模型不明显的能力,这些模型要生成与人类偏好保持一致的音频。为了减轻此问题,我们删除了指挥棒,这是第一个框架,旨在增强使用人类偏爱的反馈来增强生成的音频和文本提示之间的对齐。我们的接力棒包括三个关键阶段:首先,我们策划了一个包含提示和相应生成的音频的数据集,然后根据人类的馈本进行注释。其次,我们使用构造的数据集引入了奖励模型,该数据集可以通过分配奖励输入文本审计对来模仿人类的喜好。最后,我们采用了奖励模型来微调现成的文本对原模型。实验结果表明,我们的指挥棒可以显着提高原始文本对原模型的发电质量,音频完整性,时间关系以及与人类偏爱的一致性。项目页面可从https://baton2024.github.io获得。
鉴于环境的不断增长以及减少碳排放的迫切需求,采用电动汽车(EV)在将汽车行业转变为可持续性方面起着关键作用。 在中国,促进电动汽车的历史可以追溯到2009年,而电动汽车的消费者接受程度低于传统燃料汽车。 经常被用来鼓励电动汽车扩散的大型财务补贴并不长期可行。 因此,必须重新聚焦对电动汽车本身的固有品质和特征的研究。 这项研究研究了中国山东的选择实验(CE)方法,研究了消费者的偏好和愿意(WTP)为电动汽车的属性(WTP)。 评估的属性是驾驶范围,座椅,电池保修期,充电时间和价格。 最后,使用条件logit(CL)和混合logit模型(MXL)检查了330个有效响应的数据。 结果表明,最优选的属性是电池保修持续时间的扩展,这导致WTP的范围从CNY626,352到CNY1,141,580(98,485美元至170,385美元)。 此外,结果表明了基于性别,年龄,教育和收入的不同消费者偏好。 这些发现对政策制定者在发展电动汽车行业方面具有重要意义。鉴于环境的不断增长以及减少碳排放的迫切需求,采用电动汽车(EV)在将汽车行业转变为可持续性方面起着关键作用。在中国,促进电动汽车的历史可以追溯到2009年,而电动汽车的消费者接受程度低于传统燃料汽车。经常被用来鼓励电动汽车扩散的大型财务补贴并不长期可行。因此,必须重新聚焦对电动汽车本身的固有品质和特征的研究。这项研究研究了中国山东的选择实验(CE)方法,研究了消费者的偏好和愿意(WTP)为电动汽车的属性(WTP)。评估的属性是驾驶范围,座椅,电池保修期,充电时间和价格。最后,使用条件logit(CL)和混合logit模型(MXL)检查了330个有效响应的数据。结果表明,最优选的属性是电池保修持续时间的扩展,这导致WTP的范围从CNY626,352到CNY1,141,580(98,485美元至170,385美元)。此外,结果表明了基于性别,年龄,教育和收入的不同消费者偏好。这些发现对政策制定者在发展电动汽车行业方面具有重要意义。
1. 目的和治理 1.1 风险偏好声明(“本声明”)全面概述了指导欧洲复兴开发银行(“银行”)运营的风险偏好参数。其主要目的是便于简明扼要地介绍和定期审查银行在其主要活动中愿意承担的风险水平。它反映了市场惯例,提高了内部决策的质量,并有助于建立全行风险意识文化。它协助银行与利益相关者(包括投资者、捐助者和评级机构)进行沟通,支持持续获得资金和实现银行目标的能力。 1.2 该文件综合概述了银行如何管理各种类型的风险。以下第 2 节和第 3 节描述了风险偏好表达和总体风险治理结构的主要原则。第 4 节介绍了财务损失容忍阈值(FLTT),该阈值根据年度全行压力测试的结果进行评估。FLTT 是表达对多种金融风险的风险偏好的一部分。第 5 至 11 节详细列出了银行对每种风险类型的风险偏好的关键方面。用于衡量和限制风险的详细风险类型定义和指标可在附件 2 中找到。 1.3 本声明中描述的大部分参数已由管理层和董事会通过专门的政策工具采用。这些参数在整篇文件中都有引用。本声明将每年更新,以反映这些基本政策的变化。 1.4 该文件由副总裁兼首席风险官 (CRO) 经与银行其他执行经理磋商后定期编制和更新。 2. 关键原则 2.1 银行通过承担风险来实现其战略目标。如果没有适当的限制,这些风险可能会威胁到其关键资源,包括净利润、资本、流动性和声誉。反过来,这些风险可能会破坏我们的利益相关者(包括股东政府、客户、捐助者、民间社会组织和其他相关机构)对银行、其管理层及其战略的信任和信心。在极端情况下,这些风险可能需要要求补充资本,甚至威胁到银行的生存。
人工智能技术的发展为教育的传授和接受开辟了新的机会。因此,深入了解学生对学习过程中使用人工智能的看法、期望和担忧成为一个关键方面。本研究探讨了印度尼西亚大学生对人工智能在教育中使用的看法。对明古鲁大学师范学院 200 名学生进行了一项定量描述性调查。所用工具是改编自 Buabbas 等人 (2023) 的学生对人工智能的看法量表。数据分析使用了描述性分析和卡方检验。研究结果表明,大多数学生对人工智能在学习中的使用持积极态度,认为它是一种可以丰富他们的学习体验和增加教育资源获取机会的工具。然而,也有人担心人工智能会取代教师的角色,学习互动中人为因素的丧失以及数据隐私问题。研究结论是,尽管人工智能具有改变教育的巨大潜力,但需要采取谨慎、以人为本的方法,让教师发挥积极作用,并保障学生的隐私和数据安全。建议开展进一步研究,以提供有关人工智能在教育领域出现的影响和好处的更全面信息。