详细内容或原文请订阅后点击阅览
麻省理工学院的研究人员使用大型语言模型来标记复杂系统中的问题
该方法可以检测随时间记录的数据中的异常,而无需任何训练。
来源:MIT新闻 - 人工智能在风电场中识别一个有故障的涡轮机,其中可能涉及查看数百个信号和数百万个数据点,类似于在干草堆中找到针头。
工程师经常使用深入学习模型来简化这个复杂的问题,这些模型可以检测到每种涡轮机(称为时间序列数据)随着时间反复进行的测量中的异常。
但是,每小时有数百个风力涡轮机记录数十个信号,训练一个深入学习模型来分析时间序列数据是昂贵且繁琐的。该模型可能需要在部署后需要重新训练,而风电场运营商可能缺乏必要的机器学习专业知识,这使情况更加复杂。
在一项新的研究中,麻省理工学院的研究人员发现,大型语言模型(LLMS)具有更有效的时间序列数据探测器的潜力。重要的是,这些预告片的模型可以在开箱即用。
研究人员开发了一个名为Sigllm的框架,其中包括一个组件,该组件将时间序列数据转换为基于文本的输入,而LLM可以处理。用户可以将这些准备好的数据馈送到模型,并要求其开始识别异常。 LLM还可以用来预测未来的时间序列数据点,作为异常检测管道的一部分。
虽然LLM无法在异常检测中击败最新的深度学习模型,但它们的确与其他AI方法一样。如果研究人员能够改善LLM的性能,则此框架可以帮助技术人员在重型机械或卫星(如卫星)发生之前提出潜在的问题,而无需培训昂贵的深入了解模型。
“由于这只是第一次迭代,我们没想到会从第一次开始就到达那里,但是这些结果表明,这里有机会利用LLM来完成复杂的异常检测任务。
sigllm上的论文