Apple机器学习研究领域信息情报检索

Apple的机器学习团队致力于进行机器学习和人工智能的最新研究。了解最新的进展。我们的机器学习研究团队合作交流,为每天改善数百万人生活的惊人体验作出贡献。

为虚拟助手提供以口语实体为中心的知识查询的服务器端重新评分

Server-side Rescoring of Spoken Entity-centric Knowledge Queries for Virtual Assistants

由自动语音识别 (ASR) 提供支持的设备虚拟助手需要有效的知识整合才能完成具有挑战性的实体丰富的查询识别。在本文中,我们使用各种类别的语言模型(N-Gram 词语言模型、子词神经 LM)对服务器端重新评分口头信息域查询的建模策略进行了实证研究。我们研究了设备上和服务器端信号的组合,并通过集成各种服务器端信号,在各种以实体为中心的查询子群体中展示了 23%-35% 的显着 WER 改进……

基于 Transformer 的 ASR N-Best 重新评分和重写模型

Transformer-based Model for ASR N-Best Rescoring and Rewriting

语音助手越来越多地使用设备上的自动语音识别 (ASR) 来确保速度和隐私。然而,由于设备的资源限制,涉及复杂信息域的查询通常需要搜索引擎进一步处理。对于这样的应用,我们提出了一种基于 Transformer 的新型模型,该模型能够通过并行探索 N 个最佳假设的完整上下文来重新评分和重写。我们还提出了一种新的判别序列训练目标,它可以很好地用于重新评分和重写任务。我们表明我们的 Rescore+Rewrite 模型优于……

通过高效微调进行时间敏感知识编辑

Time Sensitive Knowledge Editing through Efficient Finetuning

大型语言模型 (LLM) 在不同任务中表现出令人印象深刻的能力,并为许多领域带来了变革性的变化。然而,在预训练完成后,保持 LLM 中的知识最新仍然是一个挑战。因此,设计有效的方法来更新过时的知识并将新知识引入 LLM 至关重要。现有的定位和编辑知识编辑 (KE) 方法存在两个局限性。首先,通过此类方法编辑后的 ​​LLM 通常无法很好地回答需要多跳推理的复杂查询。其次,…

用于将 ASR 个性化为非典型语音的超网络

Hypernetworks for Personalizing ASR to Atypical Speech

*平等贡献者用于个性化自动语音识别 (ASR) 的参数高效微调 (PEFT) 最近显示出将一般人群模型适应非典型语音的前景。然而,这些方法假设对所适应的非典型言语障碍有先验知识——诊断这种障碍需要专业知识,而这些知识并不总是可用的。即使有了这些知识,数据稀缺性和说话者之间/说话者内部的高差异性也进一步限制了传统微调的有效性。为了规避这些挑战,我们首先确定模型的最小集……

改进的联邦建模使用狄利克雷多项式混合的数据集

Improved Modelling of Federated Datasets using Mixtures-of-Dirichlet-Multinomials

实际上,使用联邦学习进行训练的速度可能比标准集中式训练慢几个数量级。这严重限制了可以进行的实验和调整的数量,使得在给定任务上获得良好性能变得具有挑战性。服务器端代理数据可用于运行训练模拟,例如用于超参数调整。这可以通过减少在真实客户端上执行的调整运行次数来大大加快训练流程。然而,确保这些模拟准确反映动态是一项挑战……