原创 mark一下fancyimpute的安裝

在做缺失值填充的時候需要用到fancyimpute這個庫,Ubuntu直接pip install就能成功安裝,但是windows下安裝太坑啦。這裏記錄一下: 1、fancyimpute的依賴包裏有TensorFlow,所以pyth

原创 Tesseract-OCR源碼編譯問題

最近在用Tesseract做OCR識別,被折磨了好多天,終於成功編譯出來了。mark一下編譯過程中遇到的幾個問題。(vs2013 + Tesseract 3.04.01) 1、error C1083: 無法打開包括文件: “allh

原创 英文學術論文寫作——模式識別方向(筆記)

文章目錄文章結構英文寫作tipsLatex小技巧 英文學術論文寫作經驗幾乎爲0,在老師和師兄們的幫助下,學習到了如何撰寫文章。僅限於模式識別方向的。 文章結構 文章除去abstract,acknowledgment以及refere

原创 【IJCAI 2016】Modularity Based Community Detection with Deep Learning 閱讀小記

一、動機   從低秩嵌入的角度來看,現有的多種社團檢測算法中有兩類代表:隨機模型(Stochastic Model)和模塊度最大化模型(Modularity Optimization Model)。在這兩種算法的設計中用到了非負矩陣分

原创 社團檢測結果評估指標

社團檢測從數據集的角度來看分爲兩大類,已知真實社團(ground community)和未知真實社團的檢測,這兩種檢測方法的評估指標是不同的。我就最近看過的社團檢測論文中高頻出現的評估方法進行總結,並結合了不同的博客內容。 1. 已知真實

原创 網頁爬蟲(超超簡單的一個小例子)

(一) 目標:   在Uniprot中查詢一系列基因編號(如圖中第二列gene)對應的詳細信息,基因編號以csv格式存儲,輸出的詳細信息也存入csv中 (二) 思路:   查詢了幾個基因編號之後發現,網頁的排版不會變化,

原创 【更新】社團檢測(community detection)相關文獻整理(2015-2018)

剛剛開始接觸community detection相關的內容,在找資料和了解相關定義、算法的過程中發現自己的記錄很混亂,所以藉此記錄下自己的一些學習過程,希望可以一起學習交流。 首先咱們來討論一下文獻查找,本文主要列出了機器學習、數據挖掘

原创 社團檢測(Community Detection)和聚類(Clustering)

組會彙報社團檢測相關論文的時候,老師說了一句“其實這個就是聚類啊”,當時我的內心是一萬個黑人臉問號臉:啊。這倆好像差不多吧,爲啥有此感嘆。說實話在老師問我這個問題之前,我從沒想過社團檢測和聚類之間會有區別,一直都是把兩者傻傻分不清楚,覺得