原创 Python學習路線彙總

Python是一種面向對象、直譯式計算機程序設計語言,由Guido van Rossum於1989年底發明。由於他簡單、易學、免費開源、可移植性、可擴展性等特點,Python又被稱之爲膠水語言。下圖爲主要程序語言近年來的流行趨勢,Pyth

原创 SAS學習之sas7bdat文件的讀取

從外部導入或自創數據集後,數據集的保存格式爲sas7bdat。 讀取該種文件,需切換到數據分析窗口,即解決方案--分析--分析家(Analyst),然後點擊文件,打開.sas7bdat文件。 將導入的文件保存爲臨時數據庫的窗口操作爲,視圖

原创 Python學習之selenium庫

selenium庫可以指揮瀏覽器自動工作,除了正常的安裝調用之外,還需要設置瀏覽器引擎。 優點:簡單直觀;缺點:爬取大量數據時,有點慢;通常是其他方法無法解決或者很難解決時纔會用到這個庫。 例 # 本地Chrome瀏覽器設置方法 fro

原创 Python學習之定時程序

關於時間,Python有兩個內置的標準庫——time和datetime,標準庫一般意味着最原始最基礎的功能,但操作邏輯比較複雜。這裏可以選擇用第三方庫,schedule,調用了標準庫中封裝好了的操作函數,可以直接解決定時功能,代碼簡單。查

原创 Python學習之cookies及session用法

當想利用Python在網頁上發表評論的時候,需要一些賬號密碼登錄的信息,這個時候用requests.get()請求的話,賬號密碼全部會顯示在網址上,這顯然不科學!這個時候需要用post請求,可以這麼理解,get是明文顯示,post是非明文

原创 廣義相加模型(GAM)及R實現

當解釋變量與效應變量間關係不明確時,通常可以使用廣義相加模型來檢測比變量間是否具有非線性關係。 廣義相加模型通過光滑樣條函數 、核函數或者局部迴歸光滑函數,對變量進行擬合。GAM採用模型中的每個預測變量並將其分成多個部分(由'結'​​分隔

原创 主成分分析

Principal components analysis 來源:http://blog.csdn.net/m0_37788308/article/details/78115209   我們在作數據分析處理時,數據往往包含多個變量,而較多