多样性包容和社区伙伴关系DICP任务办公室多样性包容和社区部分伙伴关系办公室(DICP)的使命是将多样性纳入健康,生物医学,行为和STEM领域,以建立个人和机构能力,以实现卓越,促进卓越,促进创新,并确保在健康中的健康状况,并在国家,全球和全球范围内和全球范围内。About DICP The Office for Diversity Inclusion and Community Partnership (DICP) at Harvard Medical School (HMS) was established to promote the increased recruitment, retention and advancement of diverse faculty, particularly individuals from groups underrepresented in medicine (URM), at HMS and to oversee all diversity and inclusion activities involving HMS facul- ty, trainees, students and staff.DICP的少数族裔教师发展计划(MFDP)成立于1990年,赞助了HMS教职员工的发展计划,重点是指导和领导力,以及签署的计划,这些计划将签署,以与前大学和大学人口联系,以便将杰出的学生,尤其是URM学生带入管道。在MFDP的宙斯盾下,有几个计划旨在培养和鼓励对医学和/或生物医学科学职业感兴趣的才华横溢的学生。有关DICP的更多信息,请访问:https://dicp.hms.harvard.edu
最近的研究表明,变压器可以通过模仿现有的RL算法来执行内在的增强学习(RL),从而使样本有效的适应能够适应无参数更新而无需看到的任务。但是,这些模型还继承了它们模仿的RL算法的次优行为。由于这些算法采用的逐渐更新规则,因此出现了此问题。基于模型的计划通过允许模拟在采取行动之前模拟潜在结果,提供了一种额外的机制来偏离次优行为,从而为这种限制提供了有希望的解决方案。我们没有学习Sepa-Rate Dynamics模型,而是提出了基于信用的RL框架(DICP)的蒸馏(DICP),在其中,变压器同时学习环境动力学并改善策略,并在内部进行改善。我们评估了跨多种离散和连续环境(包括暗室变体和元世界)的DICP。我们的结果表明,与基准相比,DICP可以达到最先进的性能,同时需要的环境相互作用要少得多,基本线包括无模型的对应物和现有的Meta-RL方法。该代码可在https://github.com/jaehyhyeon-son/dicp上获得。