獵曲奇兵soundhound的原理

好奇soundhound的搜索方法,在想能不能用到歌曲推薦上

網上看到說他們是有專利的,搜到專利:http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=%2Fnetahtml%2FPTO%2Fsearch-bool.html&r=1&f=G&l=50&co1=AND&d=PTXT&s1=%22System+method+storing+retrieving+non-text-based+information%22&OS=%22System+method+storing+retrieving+non-text-based+information%22&RS=%22System+method+storing+retrieving+non-text-based+information%22


略失望,和歌曲推薦需要的處理原音頻還是差得有點遠。。

稍微列一下這個專利裏說的原理

1)不保存實際的歌曲音頻,保存每個用戶的查詢片段,然後你來查新歌的話,就是和已經標記好的片段去匹配。有點類似監督學習

2)裏面的一些名詞。

tag:其實不是標籤,就是聲音片段。

key:tag經過一個算法——提取一些音頻特徵,聲調,音量,持續時間什麼的——轉換成的一個量化的向量。

3)然後,就是匹配了。有點長,我就懶得看完了。

當要查詢一個聲音片段時,先按統一的算法,轉換成key,然後按匹配算法,和數據庫中保存的key匹配。

中間還有些細節,聲音片段是切片的之類的,就不列了。


所以soundhound能搜索哼唱,其實他根本就不是去和原曲匹配- -b

tag和key的數據來源,略有提到,用些激勵手段讓用戶錄入

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章