複製鏈接
請複製以下鏈接發送給好友

聽歌識曲

鎖定
聽歌識曲只是音頻指紋檢索中的一種,是人工智能領域自動內容識別技術(Automatic content recognition)的核心算法,與語音識別將一段用户的語音轉化為文字不同,音頻指紋技術不區分語言,是一種聲音對聲音的精確檢索 [1] 
2019年11月,QQ音樂的“聽歌識曲”技術一舉拿下國際音頻檢索評測大賽(MIREX)“音頻指紋(Audio Fingerprinting)”項目世界冠軍 [2] 
2020年9月,國際音樂檢索評測大賽(MIREX)中,酷狗音樂對集中測試的5692個測試片段進行“識別”,取得了93.17%正確率的優秀成績,並一舉打破了由ACRCloud在四年前創造的最高記錄(91.88%正確率),取得世界冠軍。 [4] 
中文名
聽歌識曲
外文名
Music Recognition/Song Recognition/Audio Fingerprinting
應用授權
免費
學術名稱
音頻指紋檢索
特    點
快、準、穩
功能模塊
實時聽歌識曲、後台聽歌識曲、離線返回、小程序返回

聽歌識曲使用竅門

把手機QQ音樂儘量靠近音源,錄取需要識別的音頻錄音,錄取後由客户端提取錄音音頻特徵發送到服務端。服務端根據QQ音樂發上來的音頻特徵跟服務器中的歌曲進行遍歷匹配,匹配中哪首歌曲就把歌曲內容返回給客户端。識曲時不要大聲講話,儘量保證環境的安靜,儘量離音源更近,一次只識別一首歌。 [3] 

聽歌識曲功能特點

該功能有以下三個特點:
打開各大音樂播放器使用該功能,一般只需要一秒至幾秒長的片段,就可以進行查詢搜索歌曲,同時帶給你動態歌詞快速定位體驗。
如,用QQ音樂聽歌識曲功能,在安靜環境一般三秒以下,就能根據音頻片段識別出對應的歌曲名。 [3] 
該功能有很好的抗噪能力,在一定的嘈雜環境下也能實現很好的抗噪能力識別出對應的背景音樂,並返回精準的逐字歌詞,方便用户直觀的判斷出返回結果是否符合外放音頻。具備精準的數據建模能力,只用較少的數據便達到優異的識別性能;同時對海量數據處理也有很強的支持能力,綜合識別精度>99%。 [3] 
聽歌識曲主要運用到音頻指紋技術(Audio fingerprinting technology)的算法來提取每首歌的指紋,建立歌曲指紋庫,當用户通過錄音請求的時候,聽歌識曲會先對這段音樂提取其音頻指紋,再對該指紋進行比對匹配,找到多語言海量曲庫中匹配度最高的那首歌,算法和曲庫相輔相成。QQ音樂是國內識別率最高的音樂APP之一,能做到市面上99%以上播放的音頻都能搜索到並返回給用户。 [3] 

聽歌識曲功能模塊

實時聽歌識曲:偶然聽到一首好聽的歌曲,打開聽歌識曲,最快1s就能識別周圍環境中的原唱音樂,並給出歌名和歌曲等相關信息,同時還能立即使歌詞同步當前音樂播放進度。
後台聽歌識曲,就是當你在一個APP中聽到好聽的背景音樂時,聽歌識曲可以在後台識別當前播放的歌曲。 以QQ音樂聽歌識曲為例,進入QQ音樂APP的聽歌識曲頁面後,退出至手機主頁進入其他APP(或直接切換至其他APP),就可以識別另一款APP中正在播放的音樂。 [1] 
離線返回:當用户進行識別曲目的時候,如果遇見無法識別成功的音樂或不在曲庫內的曲目時。程序會將音頻指紋信息發送給雲端數據進行大數據擴展搜索,找到相關曲目後會離線反饋給用户所識別的內容。
小程序返回:為了方便用户使用聽歌識曲功能,QQ音樂已提供小程序版本供廣大用户選擇。 [1]  [3] 

聽歌識曲哼唱識別

與聽歌識曲相似的還有一個功能叫哼唱識別。同樣是以歌搜歌的功能,但區別於聽歌識曲,哼唱識別是指根據人聲的哼曲或清唱,識別出正在哼唱的是什麼歌曲,同樣的識別出來後可對該音頻進行播放、收藏等操作。

聽歌識曲功能測評

國內支持「識曲」功能的音樂APP有QQ音樂酷狗音樂酷我音樂網易雲音樂蝦米音樂、百度音樂、咪咕音樂等,對這幾款音樂類APP聽歌識曲功能進行測試,測試方法為在封閉房間內,使用一台設備隨機播放電台歌曲,另一台設備依次打開APP進行識曲。
每個App可以對同一首歌有兩次辨識機會。從結果中已經可以看出,酷狗音樂QQ音樂擁有較強的識曲能力,應對各種外文歌基本能做到一次識別成功。 [1]  [3-4] 

聽歌識曲實現原理

聽歌識曲 聽歌識曲
聽歌識曲,作為音頻信息檢索領域的一項重要課題,主流的歌曲識別技術主要運用到音頻指紋(Audio Fingerprinting)的算法來提取每首歌的指紋,建立歌曲指紋庫,當用户通過錄音請求的時候,聽歌識曲會先對這段音樂提取其音頻指紋,再對該指紋進行比對匹配,找到數據庫中匹配度最高的那首歌。 [3] 

聽歌識曲專業獎項

在2019國際音頻檢索評測大賽(MIREX)中,QQ音樂的“聽歌識曲”技術一舉拿下“音頻指紋(Audio Fingerprinting)”世界冠軍。
作為國際音頻檢索領域的頂尖賽事,MIREX致力於為音頻信息檢索及音樂信號處理領域中的各種前沿技術提供公正、可信的評估。自2005年啓動以來,MIREX吸引了世界知名大學、研究機構和科技公司企業等廣泛參與,像Spotify 、Apple Music等國際級音樂平台也會在此項賽事尋找頂級科學家,每一年的MIREX已經成為一項全行業關注的國際音樂技術盛事 [2] 
在2020年國際音樂檢索評測大賽(MIREX)中,酷狗音樂摘得“音頻指紋(Audio Fingerprinting)”項目的世界冠軍,並打破記錄。 [4] 
參考資料