原创 【數據分析與數據挖掘】三、單因子探索分析與可視化(上)

目錄 1.單因子分析和對比分析必要的理論知識 2.編碼實現   1.單因子分析和對比分析必要的理論知識 集中趨勢:均值,中位數,分位數,衆數 離中趨勢:標準差、方差 數據分佈:偏態與峯態、正太分佈於三大分佈 抽樣理論:抽樣誤差、抽樣精度

原创 【Python語法】X[:,0]和X[:,1] 什麼意思?

X[:,0]和X[:,1] 什麼意思? X[:,0]是numpy中數組的一種寫法,表示對一個二維數組,取該二維數組第一維中的所有數據,第二維中取第0個數據; 直觀來說,X[:,0]就是取所有行的第0個數據, X[:,1] 就是取所有行的第

原创 【數據分析與數據挖掘】四、多因子與複合分析(上)

這一章內容:屬性與屬性之間常見的聯繫。 理論鋪墊: 假設檢驗與方差檢驗; 相關係數:皮爾遜、斯皮爾曼; 迴歸:線性迴歸; PCA與奇異值分解; 1.假設檢驗 概念:做出一個假設,根據數據已知的分佈性質,來推斷該假設成立的概率有多大。 過程

原创 【pycharm】1.格式化代碼

1.格式化代碼 1)使用快捷鍵 ctrl+Alt+L,但是沒用,可能發生了熱鍵衝突 2)全選代碼-> Code(菜單欄) - > Reformat code

原创 【數學】1.分佈函數與概率密度函數

學習鏈接:https://zhuanlan.zhihu.com/p/48140593 隨機變量分爲離散型(discrete)、連續型(continuous);變量的取值來自一個集合,可以是有限集,也可以是無限集。對於無限集,可以是離散的,

原创 【Pycharm】2.把某個變量全部替換或者刪除

2.把某個變量全部替換或者刪除 1)Ctrl+R

原创 【Jupyter】安裝、使用、快捷鍵

1.安裝和使用 Ctrl +R 打開操作系統命令行 安裝命令:pip install jupyter 安裝後打開Jupyter命令:jupyter notebook (輸入後回車會自動跳出瀏覽器) 2.新建文件編寫python代碼  

原创 【數據分析與數據挖掘】三、單因子探索分析與可視化(下)

目錄 1.函數講解 (1)matplotlib.pyplot.xticks(ticks, [labels], **kwargs) 2.柱狀圖 3.直方圖 4.箱線圖 5.折線圖 6.餅圖 python可視化工具:matplotlib、se

原创 【數學】2.貝葉斯公式

學習鏈接:https://juejin.im/post/5b6287d9f265da0fae4f39cd

原创 大數據核心技術

該文章從知乎轉載過來,做個筆記。 作者:帆軟 鏈接:https://www.zhihu.com/question/27696290/answer/668243645 來源:知乎 著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註

原创 【論文】文獻綜述

目錄   1.綜述種類 2.綜述的意義和功能 3.如何找文獻 4.文獻評估 5.文獻管理 6.思維導圖輔助文獻整理 7.文獻引用-三明治結構 8.引入文獻中的觀點 9.引用時反對他們觀點的句式搭配 10.指出文獻不足 11.文獻引用— 冰

原创 【數據分析與數據挖掘】三、單因子探索分析與可視化(中)

目錄 3.數據分類 4.單屬性分析 5.對HR.csv中的屬性進行分析 3.數據分類 (1)定類(類別):根據事物離散、無差別屬性進行的分類,例如性別、名族; (2)定序(順序):可以界定數據的大小,但不能測定差值。例如:收入:高、中、低

原创 【數據分析與數據挖掘】三、單因子探索分析與可視化

目錄 1.單因子分析和對比分析必要的理論知識 2.編碼實現 3.數據分類 1.單因子分析和對比分析必要的理論知識 集中趨勢:均值,中位數,分位數,衆數 離中趨勢:標準差、方差 數據分佈:偏態與峯態、正太分佈於三大分佈 抽樣理論:抽樣誤差、

原创 【數據分析與數據挖掘】一、數據分析概述

1.數據分析概述 (1)數據分析 利用統計學的方法,在數據中提取有用的信息,並進行總結與概括的過程。 (2)數據分析與挖掘的流程 數據獲取 —> 探索分析 —> 預處理 —> 數據建模 —> 模型評估。 數據獲取的方法有很多,例如網頁抓

原创 【數據分析與數據挖掘】二、數據獲取方法彙總

目錄 1.數據獲取手段 (1)數據倉庫 (2)監測與抓取 (3)填寫、埋點、日誌 (4)計算 2.好用的數據學習網站 1.數據獲取手段 數據獲取手段有:數據倉庫,監測與抓取,填寫、日誌、埋點,計算等。 (1)數據倉庫 如果一個網站是賣書的