好奇soundhound的搜索方法,在想能不能用到歌曲推薦上
略失望,和歌曲推薦需要的處理原音頻還是差得有點遠。。
稍微列一下這個專利裏說的原理
1)不保存實際的歌曲音頻,保存每個用戶的查詢片段,然後你來查新歌的話,就是和已經標記好的片段去匹配。有點類似監督學習
2)裏面的一些名詞。
tag:其實不是標籤,就是聲音片段。
key:tag經過一個算法——提取一些音頻特徵,聲調,音量,持續時間什麼的——轉換成的一個量化的向量。
3)然後,就是匹配了。有點長,我就懶得看完了。
當要查詢一個聲音片段時,先按統一的算法,轉換成key,然後按匹配算法,和數據庫中保存的key匹配。
中間還有些細節,聲音片段是切片的之類的,就不列了。
所以soundhound能搜索哼唱,其實他根本就不是去和原曲匹配- -b
tag和key的數據來源,略有提到,用些激勵手段讓用戶錄入