音频谱图变压器超出实验室

使用AudiOmoth,Raspberry Pi和不错的深度学习构建便携式音景监视应用程序的配方。实验室以外的后音频频谱变形金刚首先出现在数据科学方面。

来源:走向数据科学

想知道是什么吸引了我进行声学分析?

这是一个将科学,创造力和探索结合在一起的领域。首先,您的实验室是您的脚走到哪里 - 森林小径,城市公园或偏远的山地路径都可以成为科学发现和声学调查的空间。其次,监视所选地理区域与创造力有关。 创新是环境音频研究的核心,无论是索具定制设备,在树冠中隐藏传感器还是使用太阳能进行离网设置。最后,庞大的数据确实令人难以置信,众所周知,在空间分析中,所有方法都是公平的游戏。 从数小时的动物呼唤到城市机械的微妙嗡嗡声,收集到的声学数据可能是庞大而复杂的,这为利用从深度学习到地理信息系统(GIS)的一切都打开了大门。

您的实验室无论您的脚带到哪里 监视所选地理区域与创造力有关。 庞大的数据确实令人难以置信,

在对波兰河流之一的音景分析进行了较早的冒险之后,我决定提高标准杆,设计并实施能够实时分析音景的解决方案。在此博客文章中,您会找到对所提出方法的描述,以及一些为整个过程提供动力的代码,主要是使用音频频谱变压器(AST)进行声音分类。

波兰河流之一的音景分析 实时 音频谱图变压器
传感器原型的室外/城市版本(作者图像)

方法

设置

覆盆子Pi tortenta jetson nano pi 4 b(4GB RAM) 700mAh AudiOmoth
AudiOmoth USB麦克风配置应用程序。在配置之前,请记住有关使用适当的固件刷新设备的内容。

捕获声音

陆主
arecord -d 1 -d Plughw:0,7 -f s16_le -r 16000 -c 1 -q/tmp/audio.wav
USB麦克风 16 kHz GDPR合规

分类

拥抱面 量化版本