原创 LR用戶挖掘,如何選取閾值

 在用邏輯迴歸做潛在用戶挖掘時,閥值(Z)的選取是一個頭疼的問題。取太高,查全率雖然高了,但是查詢條件過於嚴格,挖掘出的潛在用戶過少。取的太低,資源浪費的太多。對於一般的營銷而言,這個問題很好解決,只要按照預算,從高往下選取就可以了。但對

原创 anaconda 安裝scrapy

scrapy是一個python的爬蟲框架。 1.首先查看anaconda中是否裝有scrapy工具包,具體方法如下: cmd命令中,輸入 conda list,查看所有已經安裝的工具包及版本號。 發現沒有scrapy,。。。 2

原创 anaconda 使用import sklearn.model_selection 出錯ImportError: No module named model_selection

在anaconda的spider窗口中使用model selection中的函數時,需要import,比如 from sklearn.model_selection import cross_val_score 時出現: Import

原创 python 中函數format()函數進行字符串格式化

如下[“{:02d}”.format(i) for i in range(24)] 得到00,…24的字符list. :號後面帶填充的字符,只能是一個字符,不指定的話默認是用空格填充,這裏用0填充; “{:02d}”.format(i

原创 navicat for mysql ,從遠程數據庫中到數據到本地數據庫(笨辦法)

啓動遠程的數據庫服務器,打開想要導出的數據庫中的某表。 有兩種簡單粗暴的方法: 方法一: 如圖,假如想導出表grade,那麼選擇“導出嚮導”,選擇表類型: 下一步,將表grade導出到指定的路徑中,需要選擇一些附加項。

原创 anaconda2 打開jupyter Notebook及簡單使用

Anaconda集成了NumPy,Pandas, matplotlib, scikit-learn,jupyter notebook等很多的工具包。在安裝上簡便很多。 一,修改起始路徑配置: 安裝了anaconda後,查看電腦的開始下

原创 anaconda 中安裝seaborn ,plotly,jieba

Seaborn是斯坦福大學出的一個非常好用的可視化包。 原始安裝的anaconda 中,並沒有包含seaborn,需要安裝。 具體安裝方法: 1.從電腦的開始,打開cmd命令窗口,然後輸入 conda install seaborn

原创 R語言安裝.tar.gz包方法

以安裝 fUnitRoots 包爲例。 1.安裝Rtools 下載:https://cran.r-project.org/ 點擊R Binaries -》windows-》Rtools,下載Rtools33.exe 下載Rtoo

原创 python出錯:local variable XXX referenced before assignment

出錯:局部變量XXX在定義前被引用 如上在多次調用函數時使用返回的值bestThreshVal 時,提示local variable bestThreshVal referenced before assignment。 原因是,在

原创 python 劃分數據集爲訓練集和測試集

sklearn的cross_validation包中含有將數據集按照一定的比例,隨機劃分爲訓練集和測試集的函數train_test_split from sklearn.cross_validation import train_test

原创 統計學相關

變量劃分: 1.分類數據:對事物的分類結果,用文字描述,例如性別男,女;按照行業分醫療企業,家電企業,紡織品企業。 2.順序數據:只能歸於某一類別的非數字型數據。類別是有順序的。比如,成績分爲優,良,中,差。 3.數值型數據:按照數

原创 python 快速排序法

遞歸實現快速排序法: def quitsort(arr): if len(arr)<=1: return arr pivot=arr[len(arr)/2] left=[x for x in arr

原创 python 判斷爲空nan, null

pandas 空值定義爲numpy.nan 對整體的series或Dataframe判斷是否未空,用isnull() eg: pd.isnull(df1) #df1是dataframe變量 對單獨的某個值判斷,可以用 np.isna

原创 反欺詐資料 搜索與整理

無監督反欺詐 http://www.360doc.com/content/17/0111/22/32626470_621872620.shtml python +隨機森林 http://blog.csdn.net/tbdp6411/

原创 python2,繪圖title,xlabel,ylabel出現中文亂碼

繪製圖形時使用了中文標題,會出現亂碼 原因是matplotlib.pyplot在顯示時無法找到合適的字體。 先把需要的字體(在系統盤C盤的windows下的fonts目錄內)添加到FontProperties中。具體解決方法如下: