本文通过比较现象学和经验主义/媒体考古学方法来研究新的机器聆听技术。现象学将聆听与主观性联系起来,而经验主义则考虑了人类和非人类设备中聆听过程所涉及的技术操作。基于这一理论框架,本文对版权检测中使用的两种算法进行了媒体考古学研究:“声学指纹”和“音频水印”。在声音识别算法的技术操作中,经验分析表明多种空间共存:从发生在三维物理空间中的“声音事件”,到其在矢量空间中的数学表示,再到数据处理和机器对机器通信的一维信息空间。回顾德勒兹对“褶皱”的定义,我们将技术文化介导的声音中这些共存的空间维度定义为机器聆听的“折叠空间”。我们进一步论证了机器聆听中的空间问题在于自动识别的声音事件几乎无限的变化。困难在于调和声音传输的理论上持久的信息与受空间影响的声音的偶然表现。为了让机器能够处理特定于地点的声音,识别算法需要在信号处理层面重建三维空间,这是一种对声音现象的逆向工程,让人想起沃尔夫冈·恩斯特定义的“隐性声音”概念。虽然用来描述机器聆听的隐喻和社会表征往往是拟人化的——而“聆听”一词在指代数值运算时,本身就可以看作是一种隐喻——但我们认为,人类聆听和机器聆听都是在社会技术网络中共同定义的,其中聆听空间不再与聆听主体的位置重合,而是由人类和非人类机构协商确定的。
主要关键词