統計學基礎-數據的圖表展示

理論基礎:

  1. 什麼是統計學?

統計學分爲描述統計和推理統計

  1. 統計學研究什麼?

統計學沒有固定的研究對象,統計學研究的是來自各個領域的數據,靠解決其他領域內的工作而生存,我們並不能因此就看輕統計學,就好像計算機現在滲透在各行各業、我們生活中的方方面面,計算機也是爲了應用而生的。在很多領域,如果沒有統計學,雖然不會死亡但是一定會變的很弱。統計學在各個學科領域的獨特地位和作用表明了統計作爲一門獨立學科而具有的特點。

  1. 統計學的定位

數據分析的真正的目的是從數據中找出結論、從數據中尋找啓發,而不是尋找支持。真正的數據分析事先是不知道結論的,通過數據分析才得出的結論。

實踐部分-數據的圖表展示

  1. 數據預處理(參考:https://www.cnblogs.com/zhizhan/p/4870397.html

計算機領域常說:數據的質量可以再很大程度上決定模型的表現,但是在我們實際的工作中幾乎不可能直接得到高質量的數據,在把數據餵給算法之前有大量的數據預處理的工作。一般我們從系統中拿到數據第一個工作就是檢查其完整性和準確性(異常值的檢測,通常情況下會根據具體的業務需求,進行處理,常用的方法有:

  1. 數據清洗 —— 去噪聲和無關數據
  2. 數據集成 —— 將多個數據源中的數據結合起來存放在一個一致的數據存儲中
  3. 數據變換 —— 把原始數據轉換成爲適合數據挖掘的形式
  4. 數據規約 —— 主要方法包括:數據立方體聚集,維度歸約,數據壓縮,數值歸約,離散化和概念分層等。
  5. 圖說事實
  1. 品質數據的整理與展示(這裏主要是指使用Excel簡單的分析)

常用的一些功能主要有:

數據的排序和篩選:可以大概瞭解數據的特徵,有助於對數據檢查糾錯。

數據的圖表展示

當我們有多個維度的時候需要將數據進行分組,常用的是數據透視表

如原始數據是這樣的:

 

當我們想要查看每個部門有多少人數時,可以選擇插入數據透視表 輕鬆拖拽就可以很好的展示,插入數據透視表後的效果:

數據透視表具有很強大的功能,操作也比較簡單 可以滿足我們常用的,求和、計數、平均值、最大(小)值、乘積、方差、標準偏差等等的數據分析功能。這裏只是簡單的介紹一下,具體的教程還需要各位看官自行百度哈!!!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章