基于深度學習的聲音識別技術
立即咨詢
從聲音特性角度來看,聲音可以劃分為語音、音樂、環境音三大類,
而目前主流的語音識別及聲紋識別技術都是針對語音信號處理的,技術發展得已經相對成熟了。
PFU上海集團長期致力于環境音AI識別技術的研發。
針對需要辨別特定聲音的應用場景,我們事先采集聲音樣本,進行AI深度學習和訓練。
讓識別引擎自我學習,最終在實際現場中,能夠識別,甄別特定種類的聲音。
在人工智能國際性權威競賽DCASE 2018中取得過總冠軍(聲音識別領域)。
可以將一個復雜的環境中的聲音進行辨別和分類。
(需要事先對辨別的聲音進行學習,一種聲音大約需要200個聲音樣本)
【DCASE2018 Task4 世界冠軍】
異常音識別
針對異常音捕捉較困難的場景,
采用正常音學習和訓練的方法,識別異常音的技術。
【DCASE2020 Task3 世界第6名】
三種和道路安全密切相關的聲音事件AI識別。
把聲音事件的AI識別和視頻監控的圖像分析相結合,
解決了以前僅靠圖像識別所不能解決的問題!
預測以上六種機械發出的聲音里面是否包含異常音,
檢測技術對于實際現場業務的適用性強!
基于深度學習的聲音識別技術
立即咨詢