原创 關於mongodb的Capped Collection

        在mongodb中日誌的累積是個可怕的問題,日誌會記錄mongodb中的每項操作,項目中我們在做測試,連續發查詢一週就積累了快4G的日誌。查閱一些博客發現一些人是固定住日誌的大小,當文件大小達到一些數目時就自動創建另一個文

原创 python解析XML常見方法

python解析XML常見的有三種方法: 一是xml.dom.*模塊,它是W3C DOM API的實現,若需要處理DOM API則該模塊很適合,注意xml.dom包裏面有許多模塊,須區分它們間的不同; 二是xml.sax.*模塊,它是SA

原创 ICDE 2017 論文目錄與一些想法的整理

ICDE 2017 1.1 Research Session 1A: Graphs UniWalk: Unidirectional Random Walk Based Scalable SimRank Computation over L

原创 記錄一些python的使用

1.從list中取出每個int元素,用0補爲固定長度,形成一個字符串: box_str="-".join(['0'*(4-len(str(x)))+str(x) for x in position]) 2.用來計算兩個矩形overlap

原创 《機器學習實戰》學習筆記--樸素貝葉斯

機器學習實戰,樸素貝葉斯一章代碼詳解:#encoding:utf-8 from numpy import * #詞表到向量的轉換函數 def loadDataSet(): postingList = [['my','dog',

原创 python-獲取系統時間

代碼爲: import datetime nowTime=datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')#現在 pastTime = (datetime.datetime.now

原创 面試資料

先說說面試,我深深的覺得刷題檢驗自己知識和鞏固知識的方式,推薦如下:那些深度學習《面試》你可能需要知道的如何準備機器學習工程師的面試 ?七月在線實驗室 ---BAT 機器學習面試題如何準備機器學習工程師的面試 ?讀完這 21 個機器學習面

原创 GBDT的一些總結

相關鏈接:1.https://www.zybuluo.com/yxd/note/611571;GBDT原理深入解析

原创 劍指offer--從尾到頭打印鏈表 java實現

Q:輸入一個鏈表,從尾到頭打印鏈表每個節點的值。兩種實現方式: public static ArrayList<Integer> printListFromTailToHead(ListNode listNode) {

原创 SIGMOD 2017論文的摘要與看法

SIGMOD2017 持續更新 3.1 Concurrency併發 ACIDRain: Concurrency-Related Attacks on Database-Backed Web Applications ACIDRain:對

原创 mongodb常用命令

前陣子在使用mongodb,這裏記錄下常用的命令,待續未完...DB:從指定主機上克隆數據庫: db.cloneDatabase(“127.0.0.1”); 將指定機器上的數據庫的數據克隆到當前數據庫 從指定的機器上覆制指定數據庫數據到某

原创 python numpy np.linalg的用法

numpy下的linalg=linear+algebra,包含很多線性代數的運算,主要用法有以下幾種:1.np.linalg.norm:進行範數運算,範數是對向量(或者矩陣)的度量,是一個標量(scalar);2.np.linalg.ei

原创 mongodb移除分片

關於mongodb中移除分片的操作:一、移除分片1.確定balancer已經開啓: mongs>sh.getBalancerState() true2.移除分片--在admin db下執行命令: mongo

原创 劍指offer--二維數組中的查找 java實現

在一個二維數組中,每一行都按照從左到右遞增的順序排序,每一列都按照從上到下遞增的順序排序。請完成一個函數,輸入這樣的一個二維數組和一個整數,判斷數組中是否含有該整數。java實現如下: public

原创 Python-Image 基本的圖像處理操作

Python 裏面最常用的圖像操作庫是:Image library(PIL),功能上,雖然還不能跟Matlab比較,但是還是比較強大的,廢話補多少,寫點記錄筆記。 首先需要導入需要的圖像庫: import Image 讀取一張圖片: