Loading...
机构名称:
¥ 1.0

通过在线通信平台上使用算法适度,已经观察到自适应语言的增加,旨在逃避有问题内容的自动检测。这种适应语言的一种形式称为“ algospeak”,最常见于大型社交媒体平台,例如tiktok。它具有避免机器可读性的明确意图,建立在leetspeak或线条上。用于自动化内容中的过程的机器学习算法主要依赖于人类注释的数据集和受监督的学习,十个未针对多种语言和语言变化进行调整。这项工作使用了研究文献中确定的linguistic示例来介绍algoSpeak的分类法,并表明,使用LLM(GPT-4),可以将既定术语的79.4%纠正到其真实形式,或者如果需要,则可以纠正其潜在的相关概念。用示例句子,正确识别了98.5%的条款。这项研究表明,LLMS是解决AlgoSkeak避免适度问题的未来。

简单的基于LLM的反击Algoseak

简单的基于LLM的反击AlgoseakPDF文件第1页

简单的基于LLM的反击AlgoseakPDF文件第2页

简单的基于LLM的反击AlgoseakPDF文件第3页

简单的基于LLM的反击AlgoseakPDF文件第4页

简单的基于LLM的反击AlgoseakPDF文件第5页