机器学习能够分辨鸟鸣音频数据,实现物种生存状态的智能分析

从沙漠到森林,从山峰到海洋深处,生物学家们通过安装音频记录器来收集鲸鱼、大象、蝙蝠,特别是鸟类的口哨和歌声。

此前,为了记录加利福尼亚内华达山脉的声音景观,有超过2000只电子耳朵产生了近100万小时的音频,为了避免花费无法预计的时间和人力成本,研究人员正在利用人工智能对音频文件进行解码。比如,去年内华达山脉发生了历史性的森林大火,生物学家们通过收集到的音频记录了山火是如何影响鸟类不同栖息地的生态条件,并且可以揭示各种动物种群是如何度过这场灾难的,以及哪些保护措施有助于物种更有效地恢复。

这些录音还可以捕捉到更大群体中个体之间互动的细节,如伴侣如何在嘈杂的环境中找到配偶,科学家还可以利用声音来追踪种群迁徙时间或规模的变化。大量的音频数据也被用于其他地方的研究,包括统计昆虫数量,研究光和噪音污染对鸟类群落的影响,追踪濒危物种,以及在记录器探测到非法偷猎或伐木活动的噪音时发出警报。

相关研究员表示,音频数据蕴含了大量的信息,但是人类需要很长时间才能从录音中提取有用的见解。幸运的是,最新一代的机器学习人工智能系统可以在不到一天的时间里处理数千小时的数据。例如,如果要研究动物生物繁殖活动的模式和季节性种群变化,包括蟋蟀、青蛙、蝙蝠和蝈蝈等的录音。四名研究人员需要花费600小时,从10小时的录音中对各种蝈蝈物种进行分类,非常耗时。但新型的的机器学习算法,只需喝一杯啤酒的功夫,就能完成同样的任务。

当今最流行的鸟类声音识别系统是基于神经网络的自我学习模型开发的。这种系统从分析许多输入信号开始,比如数以百计的鸟类叫声都贴上了相应种类的“标签”。然后,神经网络自己学习哪些特征可以用来将输入的信号(鸟的叫声)与标签(鸟的身份)联系起来,这其中涉及到数以百万计的极其细微的特征,比如许多鸟类有不止一种鸣叫声,而且像其他动物一样,它们通常有地方“方言”。另外,系统还可以将鸟鸣声从背景噪音中区分出来,这些噪音包括昆虫的叫声、天气环境的声音等等。

这些机器学习算法仍有改进的空间,尽管它们分析声音的速度比人类快得多,但它们在筛选重叠声音以锁定感兴趣的信号方面仍然落后于人类。一些研究人员认为这是人工智能要解决的下一个问题。然而,即使是目前不完善的版本,也能实现大规模的项目,而人类独自处理这些项目将耗费太多的时间。

声明:本文版权归原作者所有,转载请注明出处,请勿转载至外网或用于商业用途。

打开APP阅读更多精彩内容