b'\xc2\xb9 意大利巴里大学教育、心理学和传播系 \xc2\xb2 意大利巴里大学药学系 \xc2\xb3 意大利巴里大学医学院:基础医学、神经科学和感觉器官 意大利巴里大学医学院:跨学科医学 奥胡斯大学临床医学系和奥胡斯/奥尔堡皇家音乐学院大脑音乐中心 (MIB),丹麦奥胡斯 * 两位作者贡献相同,并且是第一共同作者 通信地址:Mariangela Lippolis,Palazzo Chiaia - Napolitano Via Scipione Crisanzio, 42, 70121,巴里。电子邮件:mariangela.lippolis@uniba.it Elvira Brattico,奥胡斯大学临床医学系,Universitetsbyen 3,建筑 1710,8000 Aarhus C,丹麦。电子邮件:elvira.brattico@clin.au.dk 致谢:本研究由欧盟资助,属于 MUR PNRR 一项新颖的公私联盟,旨在为包容性的意大利老龄化社会提供社会经济、生物医学和技术解决方案(项目编号 PE00000015,AGE-IT)。'
本文通过比较现象学和经验主义/媒体考古学方法来研究新的机器聆听技术。现象学将聆听与主观性联系起来,而经验主义则考虑了人类和非人类设备中聆听过程所涉及的技术操作。基于这一理论框架,本文对版权检测中使用的两种算法进行了媒体考古学研究:“声学指纹”和“音频水印”。在声音识别算法的技术操作中,经验分析表明多种空间共存:从发生在三维物理空间中的“声音事件”,到其在矢量空间中的数学表示,再到数据处理和机器对机器通信的一维信息空间。回顾德勒兹对“褶皱”的定义,我们将技术文化介导的声音中这些共存的空间维度定义为机器聆听的“折叠空间”。我们进一步论证了机器聆听中的空间问题在于自动识别的声音事件几乎无限的变化。困难在于调和声音传输的理论上持久的信息与受空间影响的声音的偶然表现。为了让机器能够处理特定于地点的声音,识别算法需要在信号处理层面重建三维空间,这是一种对声音现象的逆向工程,让人想起沃尔夫冈·恩斯特定义的“隐性声音”概念。虽然用来描述机器聆听的隐喻和社会表征往往是拟人化的——而“聆听”一词在指代数值运算时,本身就可以看作是一种隐喻——但我们认为,人类聆听和机器聆听都是在社会技术网络中共同定义的,其中聆听空间不再与聆听主体的位置重合,而是由人类和非人类机构协商确定的。