摘要 — 技术的最新发展为我们带来了令人惊叹的音频合成模型,如 TACOTRON 和 WAVENETS。另一方面,它也带来了更大的威胁,例如语音克隆和深度伪造,这些威胁可能无法被发现。为了应对这些令人担忧的情况,迫切需要提出能够帮助区分合成语音和实际人类语音并识别这种合成来源的模型。在这里,我们提出了一个基于卷积神经网络 (CNN) 和双向循环神经网络 (BiRNN) 的模型,有助于实现上述两个目标。使用双向 RNN 和 CNN 利用 AI 合成语音中存在的时间依赖性。该模型通过将 AI 合成音频与真实人类语音进行分类,错误率为 ≃ 1.9%,并以 ≃ 97% 的准确率检测底层架构,其表现优于最先进的方法。
通常,优化资产效率会对可靠性产生不利影响,反之亦然。客观确定最佳权衡的唯一方法是通过数据辨别。工厂经理经常提出的一些代表性问题,以及理想情况下数据驱动的决策应该回答的问题包括:• 我是否应该在更高的温度下运行这个固定床反应器以实现更高的转化率?如果是这样,这将如何影响我的催化剂活性以及反应器的整体机械完整性?• 考虑到维护成本和压缩机可能降低的等温效率之间的权衡,我应该何时维修我的多级压缩机的中间冷却器?• 我是否可以在不增加计划外维护成本的情况下延长工厂停机间隔时间?这样的例子不胜枚举。整个行业对“大数据”的兴趣高涨表明,这些运营问题的客观、敏捷和有见地的答案现在可能触手可及。当然,通过工业物联网 (IIoT) 的进步而实现的数字控制系统、数据历史记录和额外的传感器监控点为制造公司提供了前所未有的数据量。然而,这些高维数据集通常具有具有挑战性的信噪比和高度的相关性/冗余性,同时本质上是非因果性的(即,单个传感器读数的变化并不总是能够绘制