详细内容或原文请订阅后点击阅览
通过强大数据处理不平等的数据记忆中的权衡取舍
最近的研究表明,培训大语言模型涉及大量培训数据的记忆。在敏感用户数据上培训培训时,这种记忆可能会导致侵犯隐私,从而激发了对数据记忆在学习中的作用的研究。在这项工作中,我们开发了一种通用方法来证明过度数据记忆的下限,该方法依赖于强烈的数据处理不平等和数据记忆之间的新联系。然后,我们证明了几个简单而自然的二进制分类问题在…
来源:Apple机器学习研究详细内容或原文请订阅后点击阅览
最近的研究表明,培训大语言模型涉及大量培训数据的记忆。在敏感用户数据上培训培训时,这种记忆可能会导致侵犯隐私,从而激发了对数据记忆在学习中的作用的研究。在这项工作中,我们开发了一种通用方法来证明过度数据记忆的下限,该方法依赖于强烈的数据处理不平等和数据记忆之间的新联系。然后,我们证明了几个简单而自然的二进制分类问题在…
来源:Apple机器学习研究