?????? 由日本株式會社PFU和PFU上海計算機有限公司聯合開發的基于深度學習的“環境音識別系統”參加了IEEE官方指定的國際大賽DCASE2018 Challenge的Task4的競賽,在50個參賽系統中脫穎而出,取得了第一名的佳績。
????? DCASE2018 Challenge是IEEE指定的AASP(Audio and Acoustic Signal Processing) Challenge大賽的一部分,也是IEEE官方指定的音頻和聲學信號處理的國際性權威競賽。Task4是“Large-scale weakly labeled semi-supervised sound event detection in domestic environments”,也就是“在室內環境中的大尺度弱標簽半監督聲音事件檢測”。今年的競賽內容是在給定一段室內環境中的音頻(包括了人的聲音,貓和狗的叫聲,警報聲,吸塵器的聲音,刮胡子的聲音,油炸食物的聲音等等)中識別出從第幾秒開始到第幾秒結束有哪種類型的聲音。
????? PFU上海團隊參加了上述的競賽,在與北京清華、中國科技大學、上海交大等國內知名大學,以及美國約翰·霍普金斯大學、奧地利格拉茨大學、韓國電子通信研究院、印度理工學院等諸多海外研究機構的同臺競技中,取得了第一名的優異成績。準確率比第二名大幅高出2.5%,比基準高出21.6%。
????? 近年來深度學習(Deep Learning)技術飛速發展,PFU上海團隊時刻緊盯最前沿技術的變化,通過不斷鉆研及運用,在神經網絡技術方面積累了豐富的經驗,具備了很強的實踐能力。在這次競賽中,PFU上海團隊充分利用了多年來對各種神經網絡技術研究的經驗,準確選取了最適合音頻處理的神經網絡的算法,提高了提取語音的聲學特征的準確率,為最后的優勝奠定了堅實的基礎。而且在傳統模型無法處理的弱標簽數據上,嘗試并挑戰了多種最前沿的新模型來訓練以前傳統模型無法處理的弱標簽數據,通過上下文關聯技術進一步強化了聲學特征,在這些新技術的運用方面,取得了新的突破。
?????? 今后, PFU上海團隊將繼續深耕AI領域,不斷挑戰,勇攀新的高峰。