原创 cv2保存的圖片是什麼?RGB or BGR

鑑於上篇文章中的問題,這裏爲了閱讀方便,新開一個。 因爲cv2讀圖得到的肯定不是RGB的圖,而是GBR的,所以當保存其他RGB的圖的時候,肯定需要轉換纔可以。 上面有兩層意思,下面復現: 1-cv2讀圖,存圖,不需要轉換 沒毛病。只是保

原创 視頻關鍵幀inceptionV3&Xception特徵提取

很多時候都是重複造輪子,反覆無常,這源於沒有結構性的記錄,東西放的地方不對,文件命名不規範,以後凡是能夠複用的務必寫readme文件,以防忘記。 本文要解決的是兩個問題,這裏先來特徵提取 【有實際的代碼比優秀的構想更重要,啥都別吹,寫代碼

原创 NeXt VLAD多模態視頻分類

NetVLAD最初是用於位置識別中聚合空間表達,發現比常規的時間模型(LSTM/GRU)用於聚合視覺和聽覺特徵任務更有效、更快。Net VLAD主要的一個缺點是特徵維度高,基於這種特徵的大的分類模型需要幾百百萬的參數。例如,一個Net V

原创 yt8m如何做幀特徵?

最近一直困擾的就是特徵問題,視頻特徵——>幀特徵——>特徵聚合/融合 前天看了對面大佬的ppt,也是用的linrongcheng大佬的想法來做的特徵,包括視頻幀/音頻/文字,大佬說其實還是視頻特徵最重要,影響很大,而音頻反而區分度不大,文

原创 阿里優酷視頻分類方法???咋理解啊?

阿里大佬講了下面的ppt,這都過去大半個月了我還是一頭霧水、一臉懵逼、一無所獲, 菜鳥的世界真是灰色. 圖片來源:阿里巴巴文娛技術公衆號 問題: 1 NeXtVLAD是預訓練的網絡嗎?如果是,如何獲取啊?如果是linrongcheng大

原创 如何獲取視頻關鍵幀????python中

嗨,經過我半天的折騰,結果沒折騰出來。ffmpeg命令在此,可直接在cmd下執行 ffmpeg -i baby.mp4 -vf select='eq(pict_type\,I)' -vsync 2 -f image2 keyframe-

原创 理解personal Rank算法

哈嘍,各位好,我是菜鳥小明哥。 personal Rank是random walk的應用,搞了幾天也沒明白到底是咋回事,其中難以理解的是第2個式子爲啥要加1-alpha?? 你肯定會告訴我,來看第1個式子,真不好意思,我第1個式子其實也沒

原创 LFM隱語義模型梯度下降法矩陣分解

前情提要:某BAT大牛親授個性化推薦算法??? 關於這個玩意我看了下,網上搜索的都是導向其他小衆連接,很多水軍,註冊購買才能看,真是垃圾。 原是在慕課網的,現在都過去一年啦,還是那個價格,很多公開的要麼是代碼不全,要麼沒有視頻,或者根本沒

原创 AttributeError: 'dict' object has no attribute 'iteritems'

近來看個簡單的視頻,很多東西都是很簡單的,結果拖時間,老太婆的臭腳。 照着寫代碼出錯了。 AttributeError: 'dict' object has no attribute 'iteritems' 後來發現是版本問題,py3中

原创 隱語義模型LFM矩陣分解方法

本文是翻譯下面論文的一部分,本人不擁有版權,僅供學習交流。 作者所用的split Bregman方法我沒找到源碼,作者給的過程也不太清楚,難以實現,本人水平有限。 隱語義模型矩陣分解方法 Latent factor model 將評分矩陣

原创 矩陣運算——矩陣乘除法python

哈嘍,鑑於上一篇博文出現問題,此處特地開一篇,我也是一臉矇蔽。 很多博文只會求得矩陣特徵分解的特徵值和特徵向量,而從沒有進行驗證,驗證方法兩個 1  A*v=lam*v                    lam是特徵值 2 det(A

原创 矩陣的範數

向量的範數在這裏 某百科已經說得清楚,矩陣A的1範數就是列和範數,2範數就是A^H*A的最大特徵值的開方,無窮大範數就是行和範數 在我用python驗證時遇到了一些基礎問題:特徵值分解後想驗證下是否正確,結果驗證錯誤。詳見這裏 pytho

原创 python自帶IDLE清屏設置——ClearWIndow.py

還好嗎?諸位,不知道有沒有突然想起我? 很多時候不是拿來數據就調參數,訓練模型,而是準備工作,對我這個菜鳥來說是這樣的,搬磚時候很少,大多數時候都是在找手套,沒有手套搬磚一會就幹不動了,手都磨破了。 很多時候也會出現推倒重來,重新安裝py

原创 keras層的name必須獨一無二

哈嘍,大家好,我回來了。 在家辦公先用Keras寫個CNN,然後複製粘貼幾層,發現沒改每層的命名,發現報錯。 ValueError: The name "BN" is used 3 times in the model. All lay

原创 BatchNorm是什麼&如何查看keras模型每一層的結果?

似乎數據類型先轉爲float32爲好,除了complex類型的數據。不然可能報錯。 >>> xx.shape (8, 10, 10) >>> xx2=tf.constant(xx,tf.float32) >>> inputs=kera