原创 L18函數:靈活即強大

形式函數(parameter): 函數創建和定義過程中小括號裡面的參數 實際函數(argument): 實際調用過程中傳遞進去的參數 >>> def MyFirstFunction(name):     "函數定義過程中的name是形參

原创 非結構化數據分析

結構化數據>>數據庫   二維表   非結構化數據>>信息檢索  自由文本最典型 圖片 視頻 音頻    以關鍵字查詢 半結構化數據 文本挖掘的基本流程: 分詞tokenizer 文法處理  把他還原成原始單詞  linguistic

原创 非結構化數據分析三

GMM  高斯混合模型方法  被聚到某類的概率 >>信息量較多 假設數據服從高斯混合分佈 從K個高斯分佈生成 目標: 求3K個參數  (W係數 MU SIGMA) 評價方式:似然函數最高 EX

原创 非結構化分析二

決策邊界 二維分類 線性分類器  常用文本分類器都是線性分類器  樸素貝葉思  羅吉回歸  支持向量機  選擇分割面的方式不同 非線性分類器並不一定比線性分類器好  貝葉思及其在郵件過濾中的應用 垃圾郵件問題 傳統的垃圾郵件過濾法 主

原创 L21匿名函數lambda()

lambda(參數:返回值) >>> def ds(x): return 2*x+1 >>> ds(5) 11 >>> lambda x : 2*x+5 <function <lambda> at 0x02C66D68> >>> g

原创 L19函數:我的地盤聽我的

<strong>函數function</strong>有返回值 過程procedure簡單的特殊的沒有返回值 python嚴格來說只有函數沒有過程 >>> def hello():     print("hello")      >>

原创 hw14+16

0. 請寫一個密碼安全性檢查的腳本代碼:check.py 1. #密碼安全性檢查代碼 2. # 3. #低級密碼要求: 4. #  1.密碼由單純的數字或字母組成 5. #  2.密碼長度小於等於8位 6. # 7. #中級密碼要求:

原创 ARMA

http://www.morefund.com/a/duichongshidian/2011/0422/327.html http://lidequan12345.blog.163.com/blog/static/28985036201

原创 c

10200-日期 收盤價 40300-日期 收盤價 ######## 6174 ######## 229.4 ######## 6080 ######## 224.8 ######## 6013 ######## 22

原创 廣告聯盟中的CPA、CPS、CPC、CPM分別是什麼意思

http://wenku.baidu.com/view/4db5874cfe4733687e21aaab.html

原创 共整合r

# 指定路徑為桌面 setwd("C:/Users/user2/Desktop") #  讀入csv檔 rawdata<-read.csv("test.csv") #  把title名稱轉為英文 #  x

原创 CRM

CRM  鎖定 本詞條由“科普中國”百科科學詞條編寫與應用工作項目 審覈 。 CRM即客戶關係管理,是指企業用CRM技術來管理與客戶之間的關係。在不同場合下,CRM可能是一個管理學術語,可能是一個軟件系統。通常所指的CRM,指用

原创 留學資料

http://www.1point3acres.com/bbs/thread-95831-1-1.html 14Fall 非名校本科的統計PhD/部分MS申請經驗 https://www.douban.com/note/14123801

原创 R中設置圖形參數--函數par()詳解

R有着非常強大的繪圖功能,我們可以利用簡單的幾行代碼繪製出各種圖形來,但是有時候默認的圖形設置沒法滿足我們的需要,甚至會碰到各種各樣的小問題:如座標軸或者標題出界了,或者圖例說明的大小或者位置遮擋住了圖形,甚至有時候默認的顏色也不能滿足

原创 R語言裏面的lag()和diff()函數

R裏面的LAG只適用於時間序列,不適合於dataframe或者向量,因此需要自己寫一個小小的函數來實現lag的功能。 lagdf <- function(x, k) {     c(rep(NA, k), x)[1 : length(x