原创 《Python數據分析與挖掘實戰》第7章——kmeans

本文是基於《Python數據分析與挖掘實戰》的實戰部分的第七章的數據——《航空公司客戶價值分析》做的分析。旨在補充原文中的細節代碼,並給出文中涉及到的內容的完整代碼。 1)在數據預處理部分增加了屬性規約、數據變換的代碼2)在模型構建的部分

原创 歡樂頌小說的文本基礎的數據處理工作

閒來無事寫點小程序自己樂呵樂呵~~~~背景:    歡樂頌2剛播出那會,每週更新的太慢,所以想起去翻看歡樂頌的小說,然後,三分鐘熱度,想起對歡樂頌中的數據進行處理一番,原來還假想可能會發現一些好玩的,後來因爲某些原因不了了之了,但是,剛開

原创 《Python數據分析與挖掘實戰》第12章(上)——協同推薦

本文是基於《Python數據分析與挖掘實戰》的實戰部分的第12章的數據——《電子商務網站用戶行爲分析及服務推薦》做的分析。旨在補充原文中的細節代碼,並給出文中涉及到的內容的完整代碼。在作者所給代碼的基礎上增加的內容包括: 1)原書中所分析

原创 《Python數據分析與挖掘實戰》第6章——LM+CART

本文主要是對《Python數據分析與挖掘實戰》中的第6章——電力竊漏電用戶自動識別數據進行的分析。旨在補充原文中的細節代碼,並給出文中涉及到的內容的完整代碼。1 背景與目標分析    通過電力系統採集到的數據,提取出竊漏電用戶的關鍵特徵,

原创 《Python數據分析與挖掘實戰》第11章——時間序列

本文是基於《Python數據分析與挖掘實戰》的實戰部分的第11章的數據——《應用系統負載分析與磁盤容量預測》做的分析。旨在補充原文中的細節代碼,並給出文中涉及到的內容的完整代碼;在作者所給代碼的基礎上增加的內容包括:  1)數據探索時畫C

原创 【利用Python進行數據分析——經驗篇4】將多張DataFrame表寫入到同一個Excel的不同sheet中

# 創建一個輸出文件writer = pd.ExcelWriter('out.xlsx')data = pd.read_table('table_All_pivot.csv',sep=',')data.to_excel(writer,'t

原创 【利用Python進行數據分析——經驗篇2】計算微博轉發/評論/點贊h指數的Python代碼

本文中記錄瞭如何得出h指數的計算值微博轉發/評論/點贊h指數:(定義),某博主如果他/她發表的N篇博文中有h篇每篇至少被h次轉發/評論/點贊,而剩下的(N-h)篇博文中每篇被轉發/評論/點贊次數均少於h次,則數值h則表示的是這個微博的轉發

原创 《Python數據分析與挖掘實戰》第14章——層次聚類

本文是基於《Python數據分析與挖掘實戰》的實戰部分的第14章的數據——《基於基站定位數據的商圈分析》做的分析。旨在補充原文中的細節代碼,並給出文中涉及到的內容的完整代碼。在作者所給代碼的基礎上增加的內容包括: 1)探索了不同的meth

原创 Windows 10下keras+theano安裝教程(極速)

Win10下keras+theano安裝教程(極速) 1 Keras簡介: (1)Keras是一個高層神經網絡API,Keras由純Python編寫而成並基於Tensorflow或Theano。Keras爲支持快速實驗而生,能夠把你的i

原创 【利用Python進行數據分析——經驗篇1】將Excel表中幾列合併到一列中

我們都知道,在Excel中可以很容易實現,採用‘A1&B1’ 或者利用CONCATENATE(A1&B1)方式可以實現,但是在Python的pandas包中,本人沒有找到合適的用於連接表中兩列的函數,因此本人使用了字符串連接的方式。本文中

原创 mysql/hive實現lead()不同偏移量數據

由於MySQL中不帶有LEAD()函數功能,因此,參考着一篇已有的文檔實現了不同偏移量的功能原文鏈接地址:mysql的lag和Lead函數 本文對比了hive和MySQL實現該功能的方式: Hive實現方法 PS :空值處設置爲N

原创 《Python數據分析與挖掘實戰》第8章——Apriori關聯規則

本文是基於《Python數據分析與挖掘實戰》的實戰部分的第八章的數據——《中醫證型關聯規則挖掘》做的分析。旨在補充原文中的細節代碼,並給出文中涉及到的內容的完整代碼。主要有:1)將原始數據按照聚類結果進行標記類別1 背景與目標分析   

原创 《Python數據分析與挖掘實戰》第9章——svm

本文是基於《Python數據分析與挖掘實戰》的實戰部分的第9章的數據——《基於水色圖像的水質評價》做的分析。旨在補充原文中的細節代碼,並給出文中涉及到的內容的完整代碼。在作者所給代碼的基礎上增加的內容包括: 1)數據預處理部分:切割圖片、

原创 《Python數據分析與挖掘實戰》第10章(下)——DNN

本文是基於《Python數據分析與挖掘實戰》的實戰部分的第10章的數據——《家用電器用戶行爲分析與事件識別》做的分析。接着前一篇文章的內容,本篇博文重點是處理用水事件中的屬性構造部分,然後進行構建模型分析。1 屬性構造    由文中可知:

原创 《Python數據分析與挖掘實戰》第12章(中)——協同推薦

   本文是基於《Python數據分析與挖掘實戰》的實戰部分的第12章的數據——《電子商務網站用戶行爲分析及服務推薦》做的分析。由於此章內容很多,因此,分爲三個部分進行分享——數據探索(上)、數據預處理(中)、模型構建(下)本文是繼前一篇