原创 Python面向對象編程(五)

一、繼承父類屬性和方法 1. 繼承        面向對象的編程帶來的好處之一是代碼的重用,實現這種重用方法之一是通過繼承機制。繼承(Inheritance)是兩個類或多個類之間的父子關係,子類繼承了父類的所有公有數據屬性和方法,並且可以

原创 Python3爬蟲知識(問題)彙總(一)

Python:python3 以下是本人在爬蟲項目中遇到並積累的問題與知識點: 一、獲取國內髙匿代理IP網站的免費IP代理,並驗證哪些IP爲可用代理,最後將可用代理輸出。        首先需要爬取到代理IP的協議、ip地址、端口,本人採

原创 Python配置TensorFlow-GPU環境(筆記I)-2018-10-25

系統:Windows10 Python:Anaconda3-5.0.0-Windows-x86_64 主要步驟: 1、環境配置        打開Anaconda Prompt,輸入清華倉庫鏡像,這樣更新會快一些。        同樣在

原创 2019年用戶流失分析(五)——Python實現

5、 模型應用        選擇4月份爲正常狀態的電視用戶,計算他們的收視時長、收視在線天數、距最近一次收視時間、入網時長、用戶主動辦理次數和投訴與報障次數6個特徵指標,利用構建好的用戶流失模型預測5月份的用戶流失情況。 5.1 離網傾

原创 Python編輯器之jupyter使用介紹(基本功能)

一、熟悉Python數據分析的工具 1、瞭解數據分析常用工具        目前主流的數據分析語言有Python、R、Matlab三種程序語言。其中Python具有豐富和強大的庫。它常被暱稱爲膠水語言,能夠把用其他語言製作的各種模塊(尤其

原创 Python編輯器之jupyter使用介紹(快捷功能、設置工作路徑)

一、Jupyter Notebook 快捷鍵        Jupyter Notebook 有兩種鍵盤輸入模式。編輯模式,允許你往單元中鍵入代碼或文本;這時的單元框線是綠色的。命令模式,鍵盤輸入運行程序命令;這時的單元框線是灰色。 (1

原创 Python編輯器之jupyter使用介紹(拓展插件使用手冊)

一、jupyter拓展工具        Jupyter Notebook 是一個很棒的教學、探索和編程環境,但其功能不足也是出了名的。幸好,有許多方法可以改進這個不錯的工具,如 Jupyter Notebook 擴展工具。      

原创 Python配置TensorFlow-GPU環境(筆記II)-2019.03.04

       由於之前電腦問題導致系統重裝,需要重新安裝了GPU版的TensorFlow來跑人臉識別的代碼,發現安裝過程中與上一次筆記的不同了(有了新的版本匹配),這次是新的配置說明。 系統:Windows10 GPU:NVIDIA Ge

原创 Linux系統下安裝Python爬蟲環境+模擬瀏覽器插件

一、服務器版本        Centos7以上版本 二、配置python環境 1、安裝依賴包 yum -y install gcc gcc-c++ yum -y install zlib zlib-devel yum -y insta

原创 2019年用戶流失分析(四)——Python實現

(3)、隨機森林模型        隨機森林屬於一種集成算法,指的是利用多棵樹對樣本進行訓練並預測的一種分類器。隨機森林的混淆矩陣如表格 6所示。 表格 6 混淆矩陣表 predictedclass 類=0 類=1 ac

原创 2019年用戶流失分析(三)——Python實現

(2)、決策樹分類算法模型 數據劃分        在分類算法建模過程中與聚類算法稍有不同。聚類指事先並不知道任何樣本的類別標號,實現的目標是通過某種算法來把一組未知類別的樣本劃分成若干類別,把相似的東西聚到一起,在機器學習中被稱作無監

原创 2019年用戶流失分析(二)——Python實現

3.3 工單情況分析(輿情分析)        13241個用戶一年內的工單數爲8480條,裏面有用戶投訴與報障的具體內容信息。我們可以對投訴與報障內容進行情感分析,利用LDA主題模型提取內容關鍵信息,瞭解用戶的需求、意見,提出改善的建議

原创 debug調試神器pysnooper

       異常bug定位,print()函數也可以,但效率上還是慢,後來發現了一個叫PySnooper的裝飾器。一般debug調試,都是在我們可能覺得會有問題的地方,去打印輸出,看下實際輸出了什麼,然後思考問題所在。 下載庫: pi

原创 循環進度可視化tqdm

       Python的tqdm庫是循環進度條可視化,可以在 Python 循環中添加一個進度提示信息,用戶只需要封裝任意的迭代器 tqdm(iterator)。         這裏我們分3個部分展示:介紹,使用,實例。安裝用pip

原创 Python機器學習庫scikit-learn使用小結(二)

scikit-learn庫(後三小結)        在做數據分析和挖掘的過程中,數據的處理(標準化)、劃分、快速建模都是必不可少的方式。這裏本人總結了一些scikit-learn(以下簡稱sklearn)庫的使用方法小結,當然也本人在工