计算效率关键词检索结果

关于计算效率高的多类校准

On Computationally Efficient Multi-Class Calibration

考虑一个多类标记问题,其中标签可以取 [k] 中的值,而预测器可以预测标签上的分布。在这项工作中,我们研究了以下基本问题:是否存在多类校准的概念,可以强有力地保证有意义的预测,并且可以在时间和样本复杂度为 k 的多项式内实现?先前的校准概念在计算效率和表达能力之间表现出权衡:它们要么受制于样本复杂度为 k 的指数,要么需要解决计算上难以解决的问题,要么给出……

超冷量子比特:无误差量子计算的关键

Supercold Qubits: The Key to Error-Free Quantum Computing

一个科学家团队开发出了一种提高量子计算效率的突破性技术。通过创新性地使用量子制冷机将量子比特冷却到接近绝对零度,他们有效地将初始误差降至最低,这对于量子计算的可靠性至关重要。该方法不仅提高了量子计算的精度,而且开辟了新的可能性[...]

评估预训练和即时适应语言模型之间的性别偏见转移

Evaluating Gender Bias Transfer between Pre-trained and Prompt-Adapted Language Models

*平等贡献者大型语言模型 (LLM) 越来越多地被调整以实现任务特异性,以便在现实世界的决策系统中部署。之前的几项研究通过研究微调适应策略对模型公平性的影响,调查了偏见转移假设 (BTH),发现在使用微调进行调整时,预训练的屏蔽语言模型中的公平性对模型公平性的影响有限。在这项工作中,我们将 BTH 的研究扩展到提示适应下的因果模型,因为提示是一种可访问且计算效率高的方式来部署……

联合学习奖励和策略:具有... 的迭代逆强化学习框架

Jointly learning rewards and policies: an iterative Inverse Reinforcement Learning framework with…

联合学习奖励和策略:具有排序合成轨迹的迭代逆强化学习框架一种新颖的可处理和可解释算法,用于从专家演示中学习照片由 Andrea De Santis 在 Unsplash 上拍摄简介模仿学习最近在机器学习社区中引起了越来越多的关注,因为它能够通过观察到的行为将专家知识转移到自主代理。第一类算法是行为克隆 (BC),旨在直接复制专家演示,将模仿过程视为监督学习任务,其中代理尝试匹配专家在给定状态下的行为。虽然 BC 简单且计算效率高,但它经常受到过度拟合和泛化能力差的影响。相比之下,逆强化学习 (IRL) 通过推断奖励函数来瞄准专家行为的潜在意图,该奖励函数可以解释专家的行为在考虑的环境中是最佳的

Flash Attention:彻底改变变压器效率

Flash Attention: Revolutionizing Transformer Efficiency

随着 Transformer 模型的规模和复杂性不断增长,它们在计算效率和内存使用方面面临着重大挑战,尤其是在处理长序列时。Flash Attention 是一种优化技术,有望彻底改变我们在 Transformer 模型中实现和扩展注意力机制的方式。在本综合指南中,我们将深入探讨 […]The post Flash Attention:革命性地改变 Transformer 效率首先出现在 Unite.AI 上。