累托关键词检索结果

支持自由贸易论点的有缺陷的福利基础

The Flawed Welfare Foundations of Pro-Free Trade Arguments

Mark Glick 和 Gabriel A. Lozada 在这篇 INET 论文中质疑自由贸易的经济学:长期以来,自由贸易一直被认为是经济学中无可争议的好处,但其福利基础存在严重缺陷。比较优势强调的效率增益取决于潜在帕累托原则,该原则假设消除了分配问题并对待[...]

RACTENTION:朝向局部全球注意模型的最小滑动窗口尺寸

RATTENTION: Towards the Minimal Sliding Window Size in Local-Global Attention Models

局部全球注意模型最近已成为标准变压器的引人注目的替代方案,有望提高训练和推理效率。但是,窗口尺寸的关键选择给出了帕累托的权衡:较大的窗户保持性能类似于全部关注,但在短上下文的情况下提供了最小的效率提高,而较小的窗户可以导致性能退化。当前的模型(例如Gemma2和Mistral)采用了保守的窗户尺寸(例如,在8192预算后的长度中4096)来保持性能。这项工作调查了……