快捷美麗的決策樹可視化(無需安裝 graphviz 與其他插件)

👆 關注一下~,更多商業數據分析案例等你來撩

本文將專注於決策樹的可視化過程,建模原理、結果分析和模型優化則會在未來的博文中呈現。P.S:決策樹爲客戶流失預警項目的必會技能,相關數據源和超詳細的代碼解析可空降文末~~

前言

以下是筆者見過的對可視化初學者們最友好的概括:數據可視化是數據視覺表現形式的科學技術研究,主要是藉助圖形化的手段來清晰有效地傳達與溝通信息。但這絕不意味着數據可視化必須爲實現其功能而去深究枯燥的繪圖代碼,亦或是爲了使圖畫看上去高端絢麗而顯得過於複雜


需求

決策樹模型是解釋性模型的鼻祖,也是最好解釋的模型.最難解釋的則是神經網絡,所以TA 又被稱爲“黑盒模型”。所以兩者一塊學可以更好的比較優缺點。有些實踐案例和業務運用上只需要效果好,能較快的響應和被使用就行,那決策樹是一個不錯的選擇;如果領導堅持要求模型可解釋,而且一定要在數據庫中落地(如能寫出 sql,讓業務人員一下子就看懂,而且也能獲得一些靈感),決策樹就是一個很不錯的模型。其實用戶畫像就是用戶的特徵,決策樹也可以用來做用戶畫像。

決策樹建模的結果需要可視化後才能很好的看出分類過程,方法便捷的同時還要兼具一定的美感。搜索引擎以及一些常見的程序員求助社區(Baidu, Google, CSDN, Stackoverflow, 簡書,博客園,知乎等)等反饋的最常用的決策樹可視化方法的關鍵詞都包含 dot,Graphviz,先來看一下主要代碼:

在這裏插入圖片描述
代碼也不長,只需要往 sklearn.tree 的 export_graphviz 函數中傳入指定參數即可。要想使上述代碼成功運行,需安裝額外的包還不算什麼,但相信 graphviz 的配置過程還是難到了一部分 windows 客戶,以下爲官方用法的步驟拆解:

使用dot文件進行決策樹可視化需要安裝一些工具:

第一步:安裝graphviz。linux可以用apt-get或者yum的方法安裝。如果是windows,就在官網下載msi文件安裝。無論是
linux 還是 windows,裝完後都要設置環境變量,將 graphviz 的 bin 目錄加到 PATH,比如 windows,將
C:/Program Files (x86)/Graphviz2.38/bin/加入了PATH

第二步:安裝 python 插件 graphviz:pip install graphviz

第三步:安裝 python 插件 pydotplus: pip install pydotplus

配置方面還是有點麻煩的,而且 “ graphviz + dot ” 的這個組合畫出的許多圖又都是如下這樣的,在一定程度上欠缺美感。
在這裏插入圖片描述
所以筆者通過廣閱資料和優秀的技術博文,加以實操總結和優化,最終發現 sklearn.tree 裏面就已經有了自動實現決策樹可視化的函數,只需通過添加不同參數並結合 matplotlib 便可快速繪製出較爲精美的決策樹,對數據可視化初學者十分友好。


效果實現

篇幅原因,這裏只展示核心的可視化過程,簡單的建模過程都放在了後臺資源,文末回覆關鍵詞即可獲取。

方法1:只添加最基本的參數(跟沒可視化沒什麼區別,可讀性很糟糕)
在這裏插入圖片描述
方法2:通過結合 matplotlib,添加參數來優化可視化結果
在這裏插入圖片描述
在這裏插入圖片描述

注:相關數據源和超詳細的代碼(python,Jupyter Notebook 版本 + 詳細註釋)已經整理好,在 “ 數據分析與商業實踐 ” 公衆號後臺回覆 “ 決策樹可視化 ” 即可獲取。

精彩回顧

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章