原创 多python環境下使用pip安裝包

筆記本上安裝了2.7和3.5兩個版本的python,在使用3.5版本的pip安裝keras時出現了failed to create process錯誤。解決方法如下:1.由於我在環境變量中同時配置了2.7和3.5的路徑,所以我可以直接在命令

原创 collections應用

最近做項目時發現一個很好用的包——collections,這它是Python內建的一個集合模塊,提供了許多有用的集合類,下面記錄一些我覺得很有用的類或方法。1.CounterCounter可以幫我們直接計算出元素的數量 import col

原创 tensorflow在windows安裝及小試

由於工作需要,這裏嘗試在windows下再安裝一套tensorflow。正好本機之前已經安裝過Anaconda,可以直接通過Anaconda Navigator進行。啓動Anaconda Navigator,進入環境設置頁面(Environ

原创 __future__模塊引用

1.from future import absolute_import模塊絕對路徑引用,當自己在當前目錄開發的模塊名與系統模塊名發生衝突時,python會首先使用自己開發的模塊(首先在當前目錄搜索),若要使用系統自帶的模塊,需在代碼開頭加

原创 tensorflow在ubuntu安裝及小試

安裝tensorflow在ubuntu上安裝其實比較簡單(已編譯文件),並不像某些資料上描述的那麼複雜。這裏我們採用python來安裝和使用。1.安裝python-pip和python-dev啓動ubuntu的終端窗口,輸入:sudo ap

原创 tensorflow數據加載方式

tensorflow當前具有三種讀取數據的方式:1.預加載(preloaded):在構建tensorflow流圖時直接定義常量數據,由於數據是直接鑲嵌在流圖中,所以當數據量很大時將佔用大量內存 import tensorflow as tf

原创 K-近鄰(KNN)

1.KNN定義        KNN屬於有監督的學習,其基本思想是:在已知分類的一個訓練數據集中,輸入新的未知分類的實例,通過與訓練數據集中的數據一一對比,找到與該實例最近的k個實例,這k個實例的多數屬於某個類,則將該輸入實例分爲這個類。 

原创 任意相鄰時間段數據獲取

通過sql語句獲取相鄰時段數據不比通過其它編程語言,因爲sql裏面沒有for循環,故在實現時需要增加一份副表數據,這裏對該方法做一個記錄。背景:獲取2017年全年平臺用戶進出貴州省的次數(分爲進港次數和出港次數)。處理方式:1.根據定位數據

原创 jupyter notebook安裝

    在mac上安裝jupyter notebook還算順利,主要是借鑑了mybefly的分享文檔,這裏講安裝過程使用到的步驟做一個記錄:    1.升級pip:sudo python -m pip install --upgrade -

原创 jupyter notebook在網頁上顯示作圖

    今天嘗試使用jupyter notebook作圖像展示工具時,發現用matplotlib所作的圖像會自動啓動一個圖像展示窗口,無法顯示在網頁上,而我的初衷是使用jupyter notebook做圖像即時呈現及存儲(有點類似PPT作圖

原创 蒙特卡羅(monteCarlo)

    蒙特卡羅(Monte Carlo)是世界著名的賭城,是摩納哥的標誌,與拉斯維加斯、澳門號稱世界三大賭城。但是這裏我們要講到的蒙特卡羅並不是,而是一種統計方法。其原理是通過大量隨機樣本,去了解一個系統,進而得到所要計算的值。它誕生於上

原创 python列表推導式中使用if-else

   今天在處理自動化郵件數據時碰到數據行中包含字符串後,從hive中拿到的整數型數據自動轉化成了浮點數,嚴重影響美觀性。因此想到了用列表推導式來做轉化,將其中的數字型數據全部轉化爲整型,而字符型數據保留原樣。列表推導式總共有兩種形式:①[

原创 python函數中帶*及**參數

    python在定義函數的時候,不僅可以設置普通的形參:如def fun(arr1, arr2 = '我是2號參數'):  #arr1爲必傳參數,arr2可以不用    另外還可以傳入兩種特殊的參數:帶*或**的參數。這兩類形式的參數