數據分析概論
一、概念和意義
-
概念
-
數據分析是指,通過恰當的統計方法和可行的的分析手段,對數據進行收集和彙總,然後加工處理。然後對有效數據進行分析,發現問題,發掘可行方案,從而幫助人們採取更科學的行動
-
一切爲分析信息提供的有效數據,均是數據,文字、圖形、行爲方式等等。
-
-
類型
-
描述性統計分析:概括,表述事物關係
-
探索性數據分析:發現數據特徵
-
驗證性數據分析:對假設進行驗證
-
二、數據分析步驟
-
明確目標
確定目標,圍繞目標展開分析工作,並選擇相關有效的分析方式和分析工具。
-
數據收集
數據收集有以下途徑:
-
內部數據庫:公司、企業自開始建立的數據庫
-
互聯網:利用搜索引擎,在各個平臺收集數據
-
出版物:許多官方出版物,如《中國統計年鑑》
-
市場調查:可以保證數據的時效性和真實性,問卷調查、觀察調查、走訪調查。
-
購買數據:互聯網上很多專業的數據機構
-
-
數據處理
-
目的:提高數據質量,經過處理的數據更加準確、更有規律。
-
方法:檢查、清洗、轉換、提取、計算。
-
數據檢查:準確性檢驗、邏輯檢查
-
條件格式檢查數據
-
-
數據清洗:刪除錯誤數據、多餘數據、重複數據
-
去重三種方法:
-
數據—>刪除重複項—>單元格同時刪除
-
排序重複數據的單元格區域—>手動刪除
-
條件格式刪除—>顯示
-
-
-
數據轉換:格式轉換、單位轉換
-
轉置
複製—>選擇性粘貼—>轉置
-
-
數據提取:重點數據、最大/最小數據
-
數據分組:特點相同的數據分爲一組
-
VLOOKUP
-
Look_value:查找的值
-
table_array:數據表區域
-
col_index_num:填數值,代表意思是根據第幾列的數據顯示
-
range_lookup:模糊匹配或者精確匹配,可以不填
-
-
數據拆分
-
數據—>分列
-
-
數據重組
-
& 連接符
-
TEXT函數 :將數據轉換爲文本形式
-
CONCATENATE函數:將單元格數據連接成文本(CONCATENATE(A1,B1))
-
-
數據抽取
-
LEFT():獲取文本從左邊開始第指定的字符
-
-
-
數據計算:求和、平均值
-
-
-
數據分析
-
運用多種工具
-
透視表
-
excel中的數據分析工具
-
專業的數據分析思維:關聯思維、對比思維
-
常用的分析方法:PEST分析方法、4P理論
-
-
分析思路
-
分析現狀
對比分析/平均分析/總量分析/佔有率分析
-
分析原因
結構分析/漏斗圖分析/關聯分析/分組分析
-
進行預測
迴歸分析/時間進程/決策樹/神經網絡
-
-
-
數據展現
-
目的
-
從枯燥數據中發現規律
-
直觀展現,更好理解數據
-
-
-
數據報告
-
一份神形兼備的數據報告
-
完善的內容
-
框架完整
報告封面/目錄/報告詳述/結論和建議
-
邏輯性強
-
熟悉業務
-
數據可靠
-
-
合理的表達
-
可讀性強
-
直觀化
-
簡明扼要
-
-
-
工具
-
通常情況,使用word和powerpoint撰寫靜態熬膏
-
必要情況,使用excel撰寫動態報告
-
或者使用VBA語言直接撰寫PPT動態報告
-
-
word報告和PPT報告的區別
-
word報告:內容更詳盡,沒有遺漏
-
ppt報告:圖形爲主,文字爲輔
-
-
報告自動化
-
數據不是一成不變的,數據要靜態和動態相結合,展示即使的數據和數據變化。
-
ppt可以插入、連接excel動態數據表格
-
powerpoint本身可以使用VBA製作動態數據報告
-
-
三、專業術語及其他
-
平均數
總量處以總個數,各個數據與平均數的大小關係,重要指標。
-
衆數
-
一組數據中出現次數最多的數值,可以存在多個衆數。
-
有一個衆數,單峯/有兩個衆數,雙峯/三個衆數,三峯
-
每個數字只出現一次,沒有衆數
-
-
中位數
-
數據從大到小排序,處在中間的數值的一個值(或者兩個值的平均數)
-
-
絕對值和相對值
-
絕對值,某時間段的業務量大小
-
相對值,與其他部門業務量的大小比較
-
-
百分比和百分點
-
50%
-
50百分點
-
-
比例和比率
-
比例:部分/整體
-
比率:部分/另一部分
-
-
同比和環比
-
同比:今年第一季度和去年第一季度比
-
環比:今年第一季度和今年第二季度比
-
-
五種分析模型
-
SWOT模型中
-
分爲內部因素和外部因素。內部因素包括,S代表 strength(優勢),W代表weakness(劣勢 );外部因素包括,O代表opportunity(機會),T代表threat(威脅)。
-
SWOT模型又稱態勢分析法,該模型是20世紀80年代初由舊金山大學的管理學教授提出,是一種能夠較客觀而準確地分析和研究一個單位現實情況的方法。
-
-
PEST模型
-
是企業宏觀環境的分析模型,其中,P是政治(politics),E是經濟(economy),S是社會(society) ,T是技術(technology)。
-
該模型適合用來分析企業集團所處的客觀背景
-
-
5W2H模型
-
七問分析法,該模型簡單、方便、容易理解,且富有啓發意義。廣泛應用於企業問題分析、決策措施的尋找、疏漏問題彌補等情況的數據分析
-
-
4P營銷理論模型
-
產生於20世紀60年代的美國, 該模型常用於企業營銷狀況 分析、商品銷售策略分析。
-
產品(Product)、價格(Price)、渠道(Place)、宣傳(Promotion)。
-
-
-
通用分析模型
-
邏輯樹模型又稱問題樹、演繹樹或分解樹模型。是一種通用的分析模型,廣泛適合於各種情況下的問題分析,作用在於層層分解、追本溯源,找到問題的癥結所在。
-
邏輯樹的基本結構是,從最高層開始,逐步向下擴展分解。即將一個已知的大問題當成最高層,然後考慮與該問題
-
相關的因素,每考慮到一個點,就添加一根“樹枝”,以此類推,將每個問題都細化到最小處,最終形成一顆“邏輯樹
-
-
優秀學習網站
-
艾瑞網
-
學習分析思路、報告撰寫方法 http://www.iresearch.cn/
-
數據分析網站,其團隊深入互聯網等相關領域進行數據分析,爲業內人士提供豐富的產業資訊、數據、報告、觀點等內容。在艾瑞網中,可以看到專業的數據分析報告,從這些報告中可以學 習其分析思路和規範報告的撰寫方法
-
-
網易數度
-
網易數讀通過深度挖掘數據,爲讀者提供數據新聞。網易數讀的數據新聞不僅“用數據說話”,還 藉助圖表、設計圖等形式,讓數據變得美觀、有趣。其數據呈現方式十分值得借鑑。
-
UED
-
學習數據分析在用戶研究上的應用http://www.aliued.com/
-
阿里巴巴中文站UED是阿里巴巴集團資深的用戶體驗設計部門。在UED網站中,提供了關於用戶 體驗設計及研究的數據資訊。其中包括瞭如何通過數據分析來提升用戶體驗、解決用戶需求,從而讓數據 分析在商業中得到實際運用。
-
-
-
excel常用工具
-
易用寶
-
是Excel功能擴展工具,可以有效提升Excel的操作效率。針對Excel軟件在數據處理與分析過 程中的多項常用需求,Excel易用寶集成了數十個功能模塊,從而讓繁瑣或難以實現的操作變得簡單可行 ,甚至能夠一鍵完成。
-
合併工作表功能,使用易用寶,可以批 量合成不同文件中的工作表。
-
-
金數據
-
在線製作調查問卷,並輕鬆收集統計數據。
-
-
問卷星
-
在線測評、調查系統,任何人都可以使用問卷星自主設計調查問卷,讓人們通過網絡 參與問卷調查,從而快速收集到調查數據
-
-
四、數據分析思路
-
思路
-
預測
-
實質是根據現在和過去的數據進行未來趨勢預測,這裏有兩個關鍵點,一是數據在時間上的連續性,二是數據的數量,三是數據的全面性,時間點上的數據越多、連續性越高、全面性越好,預測結果越準確。
-
預測分析的思路可爲各類企業、政府等機構提供確定未來結果的信息,幫助各類機構權衡不同決策方向的效果,並提前採取預防措施。
-
定性預測法、數學模型法、模擬模型法
-
-
交叉
-
建立在縱向分析法和橫向分析法的基礎上,從數據交叉的點出發,進行數據分析。
-
理清數據間的關係/快速分析每個交叉點的值/方便地對數值進行求和計算/將注意力集中在目標數據項上。
-
-
假設/對比/分組/概率/平均/指標綜合杜邦分析/漏斗分析/象限分析
-
-
工具
-
數據透視表
-
圖表
-
迷你圖
-
條件格式
-
分類彙總
-
Power
-