原创 【論文精讀】Noiseprint: a CNN-based camera model fingerprint

paper:https://ieeexplore.ieee.org/document/8713484 開源代碼:https://github.com/grip-unina/noiseprint 文獻分類 基於semantic或者physi

原创 【轉】學習R語言超強資源

#學習 R 的方法 知識和耐心,是成爲強者的唯一方法。 - 通過閱讀來學習。 包括了閱讀經典的教材、代碼、論文、學習公開課。 - 通過牛人來學習。 包括同行的聚會、討論、大牛的博客、微博、twitter、RSS。 - 通過練習

原创 【Python系列6】Navigate for mysql顯示Python導入的中文

很多國外軟件對中文的支持都不太好,mysql也不例外。爲了在客戶端Naviagte for mysql中顯示中文,核心是要求客戶端、數據本身、系統連接、數據庫等都統一爲utf8編碼的,具體地需要做到如下幾點: 1. Python程序本

原创 【招聘系列2】Hive面試問題

Hive的運算邏輯 存的是和hdfs的映射關係,hive是邏輯上的數據倉庫,實際操作的都是hdfs上的文件,HQL就是用sql語法來寫的mr程序。 Hive與關係型數據庫的關係 沒有關係,hive是數據倉庫,不能和數據庫一樣進行實時的

原创 【HTTP協議系列5】http proxy原理

Web 代理是一種存在於網絡中間的實體,提供各式各樣的功能。現代網絡系統中,Web 代理無處不在。 代理的作用 一、提高訪問速度。因爲客戶要求的數據存於代理服務器的硬盤中,因此下次這個客戶或其它客戶再要求相同目的站點的數據時,就會直

原创 【Spark系列3】Spark優化

數據傾斜問題 現象 1、絕大多數task執行得都非常快,但個別task執行極慢。比如,總共有1000個task,997個task都在1分鐘之內執行完了,但是剩餘兩三個task卻要一兩個小時。這種情況很常見。 2、原本能夠正常執行的Spa

原创 【HTTP協議系列1】Chrome瀏覽器查看http頭

使用chrome瀏覽器自帶的開發者工具查看http頭的方法 1.在網頁任意地方右擊選擇審查元素或者按下 shift+ctrl+c, 打開chrome自帶的調試工具; 2.選擇network標籤, 刷新網頁(在打開調試工具的情況下刷新);

原创 【Python系列4】國外程序員整理的機器學習資源大全——Python篇

原文鏈接: awesome-machine-learning   翻譯: 伯樂在線 - toolate譯文鏈接: http://blog.jobbole.com/73806/ 上面的鏈接中,還有其他常用語言(C++, Closure, G

原创 人工智能與數據挖掘頂級會議

第一等級: (DM) SIGKDD: ACM Knowledge Discovery and Data Mining (since 1995)(DM) ICDM: IEEE International Conference on Da

原创 【Spark系列2】reduceByKey和groupByKey區別與用法

在spark中,我們知道一切的操作都是基於RDD的。在使用中,RDD有一種非常特殊也是非常實用的format——pair RDD,即RDD的每一行是(key, value)的格式。這種格式很像Python的字典類型,便於針對key進行一些

原创 【特徵工程系列1】用戶評價信息的特徵化

       在各種互聯網平臺中,或多或少都可以獲得用戶對商品、產品、服務等的評價信息(往往以星級或分數的形式展現)。通過這些信息,我們可以方便的提取這些商品、產品或服務的“質量”特徵。        對於“質量”特徵,常用的方法是求數

原创 【讀書筆記】2018-阿里雲《區塊鏈在企業的落地探索》

前沿: 雖然是2018年雲棲大會的報告,但是整體思路清晰,特別是與金融/保險行業強相關,還是值得一讀和一品。 PPT下載地址:https://download.csdn.net/download/zongzhiyuan/12127331

原创 【讀書筆記】2009-郎鹹平-黑領崛起

新興黑領階層:就職於政府和官有壟斷企業。10年間,通過土地財政和壟斷政治權利,官方組織一步步通過各種高手段將社會財富向自己手中集中。不僅以重稅和重複收費罰款的方式,從橫向上苛刻聚斂社會財富,而且以資源浪費和環境污染等方式,從縱向上大肆透支

原创 【Spark系列1】Windows下Spark單機版的安裝

安裝Windows單機版spark: 預編譯http://www.nikest.com/web/jswd/2015/0310/137975.html 自己編譯http://thinkerou.com/2015-05/How-to-Bui

原创 【特徵工程系列3】Zipf定律及其特徵化

(1). Zipf定律描述 1932年,哈佛大學的語言學專家Zipf在研究英文單詞出現的頻率時,發現如果把單詞出現的頻率按由大到小的順序排列,則每個單詞出現的頻率與它的名次的常數次冪存在簡單的反比關係(如圖1),這種分佈就稱爲Zipf定律