学习推迟(L2D)框架的学习允许自主系统通过将艰难的决策分配给人类的前提来安全和强大。L2D上的所有现有工作都假定每个专家都已识别,如果要更改任何一个专家,则应重新训练该系统。在这项工作中,我们减轻了这一约束,制定了一个可以在测试时间内与未见面的专家应对的L2D系统。我们通过使用元学习来实现这一目标,即同时考虑基于优化和基于模型的变体。给定一个小上下文设置以表征当前可用的外观,我们的框架可以快速调整其范围的政策。对于基于模型的方法,我们采用了一种注意机制,该机制能够在上下文集中寻找与给定测试点相似的点,从而对专家的能力进行了更精确的评估。在实验中,我们验证了有关图像识别,交通符号和皮肤病变诊断基准的方法。