台部落SpeechImageKing

鑑於上篇文章中的問題，這裏爲了閱讀方便，新開一個。因爲cv2讀圖得到的肯定不是RGB的圖，而是GBR的，所以當保存其他RGB的圖的時候，肯定需要轉換纔可以。上面有兩層意思，下面復現： 1-cv2讀圖，存圖，不需要轉換沒毛病。只是保

2020-03-18 10:32:34

很多時候都是重複造輪子，反覆無常，這源於沒有結構性的記錄，東西放的地方不對，文件命名不規範，以後凡是能夠複用的務必寫readme文件，以防忘記。本文要解決的是兩個問題，這裏先來特徵提取【有實際的代碼比優秀的構想更重要，啥都別吹，寫代碼

2020-03-16 15:17:03

NetVLAD最初是用於位置識別中聚合空間表達，發現比常規的時間模型（LSTM/GRU）用於聚合視覺和聽覺特徵任務更有效、更快。Net VLAD主要的一個缺點是特徵維度高，基於這種特徵的大的分類模型需要幾百百萬的參數。例如，一個Net V

2020-03-14 22:30:42

最近一直困擾的就是特徵問題，視頻特徵——>幀特徵——>特徵聚合/融合前天看了對面大佬的ppt，也是用的linrongcheng大佬的想法來做的特徵，包括視頻幀/音頻/文字，大佬說其實還是視頻特徵最重要，影響很大，而音頻反而區分度不大，文

2020-03-14 00:05:44

阿里大佬講了下面的ppt，這都過去大半個月了我還是一頭霧水、一臉懵逼、一無所獲, 菜鳥的世界真是灰色. 圖片來源:阿里巴巴文娛技術公衆號問題：１　NeXtVLAD是預訓練的網絡嗎？如果是，如何獲取啊？如果是linrongcheng大

2020-03-14 00:05:44

嗨，經過我半天的折騰，結果沒折騰出來。ffmpeg命令在此，可直接在cmd下執行 ffmpeg -i baby.mp4 -vf select='eq(pict_type\,I)' -vsync 2 -f image2 keyframe-

2020-03-11 18:40:23

哈嘍，各位好，我是菜鳥小明哥。 personal Rank是random walk的應用，搞了幾天也沒明白到底是咋回事，其中難以理解的是第2個式子爲啥要加1-alpha?? 你肯定會告訴我，來看第1個式子，真不好意思，我第1個式子其實也沒

2020-03-06 16:51:07

前情提要：某BAT大牛親授個性化推薦算法？？？關於這個玩意我看了下，網上搜索的都是導向其他小衆連接，很多水軍，註冊購買才能看，真是垃圾。原是在慕課網的，現在都過去一年啦，還是那個價格，很多公開的要麼是代碼不全，要麼沒有視頻，或者根本沒

2020-03-05 03:10:02

近來看個簡單的視頻，很多東西都是很簡單的，結果拖時間，老太婆的臭腳。照着寫代碼出錯了。 AttributeError: 'dict' object has no attribute 'iteritems' 後來發現是版本問題，py3中

2020-03-04 00:43:38

本文是翻譯下面論文的一部分，本人不擁有版權，僅供學習交流。作者所用的split Bregman方法我沒找到源碼，作者給的過程也不太清楚，難以實現，本人水平有限。隱語義模型矩陣分解方法 Latent factor model 將評分矩陣

2020-02-29 22:45:25

哈嘍，鑑於上一篇博文出現問題，此處特地開一篇，我也是一臉矇蔽。很多博文只會求得矩陣特徵分解的特徵值和特徵向量，而從沒有進行驗證，驗證方法兩個 1 A*v=lam*v lam是特徵值 2 det(A

2020-02-29 16:36:37

向量的範數在這裏某百科已經說得清楚，矩陣A的1範數就是列和範數，2範數就是A^H*A的最大特徵值的開方，無窮大範數就是行和範數在我用python驗證時遇到了一些基礎問題：特徵值分解後想驗證下是否正確，結果驗證錯誤。詳見這裏 pytho

2020-02-29 16:36:37

還好嗎？諸位，不知道有沒有突然想起我？很多時候不是拿來數據就調參數，訓練模型，而是準備工作，對我這個菜鳥來說是這樣的，搬磚時候很少，大多數時候都是在找手套，沒有手套搬磚一會就幹不動了，手都磨破了。很多時候也會出現推倒重來，重新安裝py

2020-02-28 15:06:46

哈嘍，大家好，我回來了。在家辦公先用Keras寫個CNN，然後複製粘貼幾層，發現沒改每層的命名，發現報錯。 ValueError: The name "BN" is used 3 times in the model. All lay

2020-02-24 10:15:47

似乎數據類型先轉爲float32爲好，除了complex類型的數據。不然可能報錯。 >>> xx.shape (8, 10, 10) >>> xx2=tf.constant(xx,tf.float32) >>> inputs=kera

2020-02-20 23:44:55