原创 python3掃盲系列-(3)

Linux/Unix的系統上,一般默認的 python 版本爲 2.x,我們可以將 python3.x 安裝在 /usr/local/python3 目錄中。 安裝完成後,我們可以將路徑 /usr/local/python3/bin 添加

原创 python掃盲系列-(2)

Python 使用反斜槓(\)轉義特殊字符,如果你不想讓反斜槓發生轉義,可以在字符串前面添加一個 r,表示原始字符串:--------------------文章內容來自菜鳥教程;(僅用做學習!) Python 中的變量不需要聲明。每個變

原创 python之微信機器人

import itchat import pandas as pd itchat.auto_login(hotReload=True) friends=itchat.get_friends(update=True) def get

原创 決策樹數學原理(ID3,c4.5,cart算法)

  上面這個圖就是一棵典型的決策樹。我們在做決策樹的時候,會經歷兩個階段:構造和剪枝。 構造 簡單來說,構造的過程就是選擇什麼屬性作爲節點的過程,那麼在構造過程中,會存在三種節點: 根節點:就是樹的最頂端,最開始的那個節點。在上圖中,“

原创 python掃盲系列--(4)

python中的常用數學函數: import math print (abs(-1)) print (math.ceil(3.4)) #返回數字的上入整數 print (math.ceil(-3.1)) print (math.exp

原创 如何做到自動化運營--數據驅動

這篇文章,只是以數據分析的視角進行一個自動化運維的解析,不提供代碼和具體技術,就當作培養數據思維了。 我們都知道很多社交網絡上可以刷粉,也可以刷閱讀量,這已經形成了一個“產業鏈”。 那麼如何通過技術來實現了? 首先我梳理了一下整個流程,可

原创 決策樹算法實現

ID3,c4.5只用於做分類,得到的結果是連續值; cart既可以做分類,也可以做迴歸,得到的結果是連續值。 CART 分類樹 在 Python 的 sklearn 中默認採用的是 CART 分類樹。 下面,我們來用 CART 分類

原创 python 掃盲系列(1)

#!/usr/bin/python3 print("Hello, World!") ---------------------內容來自菜鳥教程。(僅作爲學習使用!) 你可以將以上代碼保存在 hello.py 文件中並使用 pytho

原创 數據分析項目某電商app行爲數據分析(1)

安裝mysql數據庫(官網下載即可,免費) 安裝過程如下: MySQL數據庫安裝 安裝數據庫客戶端(官網下載試用版或破解版),安裝過程如下 數據庫客戶端安裝 數據集下載: 天池競賽 將下載到的csv文件導入到mysql數據庫,參考以

原创 pycharm使用import numpy報錯

遇到這個問題的主要原因是 PyCharm 會給每一個新建的項目都是一個全新的虛擬環境。 在這個環境下,默認的包只有 pip、setuptools 和 wheel 這三個工具,你可以在 File->Settings 裏面找到這個界面。 這

原创 R繪圖 vs Python繪圖(散點圖、折線圖、直方圖、條形圖、箱線圖、餅圖、熱力圖、蜘蛛圖)

寫在前面:爲啥不用excel繪製這些圖,用PoweBI,帆軟BI等可視化軟件來繪圖,不是更方便嗎?的確,這些工具都很方便,但同時,它們顯得很呆,不夠靈活,更爲致命的是,它們繪製出的圖形,分辨率不夠,用來出版論文,是不合格的。所以,要做學術

原创 數據分析思維框架---認知決定差異

當發現近4天的訂單量明顯下滑;這就引起了產品經理的注意。 產品經理分析:是否有負面報道在被擴散,是否競爭對手在做活動,是否某商品缺貨,價格異常,一通發問,並沒有找到原因。 於是將其當作需求拋給了數據分析團隊; BI是這樣做的: 數據驗證:

原创 數據轉換

數據變換是數據準備的重要環節,它通過數據平滑、數據聚集、數據概化和規範化等方式將數據轉換成適用於數據挖掘的形式。 數據平滑:去除數據中的噪聲,將連續數據離散化。可以採用分箱、聚類和迴歸的方式進行數據平滑。 數據聚集:對數據進行彙總。 數

原创 數據可視化(推薦Tableau、 PowerBI 、FineBI、Echarts、ggplot、PYTHON、R)---數據分析領域的萬金油技能

首先,這是一篇擴大知識面的文章,適合收藏起來,在地鐵,公交,廁所,睡前,吃飯時看。。。。(耶,惡趣味) 我們常用的可視化視圖超過 20 種,分別包括:文本表、熱力圖、地圖、符號地圖、餅圖、水平條、堆疊條、並排條、樹狀圖、圓視圖、並排圓、線

原创 數據清洗---佔據了數據分析師80%的時間

以點一份披薩爲例,講清數據分析全流程。 01播種 農場的西紅柿提供了披薩的配料,在農場播種西紅柿種子。這就相當於數據生成過程,比如用戶操作,觸發傳感器,前端埋點等。 02收穫 採摘成熟的西紅柿。這就相當於數據收集,將用戶的交互行爲記錄爲