如何成為數據分析師?這些技能需要必備!

什麼是數據分析師?大樂透加碼號碼查詢
數據分析師指的是不同行業中,專門從事行業資料蒐集、整理、分析,並依據資料做出行業研究、評估和預測的專業人員。
他們知道如何提出正確的問題,善於資料分析,利用資料視覺化工具和資料呈現;輔助公司商業決策,幫助降低成本,提高收益,改進產品,留住客戶,發現新的商業機會等。總的來說,根據資料分析師的級別,他們主要的工作內容可能包括以下:

與IT部門,管理部門,資料科學家(Data Scientist)合作,整合資料,決定整個公司的團隊目標
從primary research和secondary research中收集提取資料
清理和選取資料,去除無關資訊
熟悉使用報表軟體和其他技術分析和解讀資料
總結資料裡的趨勢或相關性
為過程改進發現潛在機會並提出可行建議
提供準確的資料分析和視覺化報告
建立並管理維持資料庫
修改程式碼相關的問題
數據分析師的前景如何?
隨著科技的發展,人類社會產生的資料規模呈指數級增長。每時每刻都有大量資料被產生儲存下來,尤其在電子商務、網路遊戲、社交網站、旅遊、線上教育等領域。現在,全世界每天產生的新資料超過400萬TB。資料分析師則成為當前炙手可熱的職業之一。

必備技能TOP5,你不可以不瞭解!
要成為一名成功的數據分析師,需要的技能主要分為倆個版塊:硬技能(包括掌握一些資料分析軟體等)和軟技能(良好的溝通能力和PPT能力)。

知識體系
這裡麵包括對統計學的基本瞭解和machine learning的認識,大部分對消費者的分析都離不開描述統計方法,如平均數、中位數、顯著等。統計學是資料分析中至關重要的課程,不管是在業務方面發展還是在技術方面發展都需要重視資料分析工作,大家在學習統計方面知識的時候一定要學會裡面的資料分析思維框架,這樣才能夠對日後的資料分析工作有很好的幫助。

計算機軟體
對於數據分析師來說,可能每個項目的70%到80%的時間都是在收集和處理資料,他們需要首先想好需要什麼樣的資料,比如timeframe是一年還是十年。選定好需要的資料後要進入一個或多個數據庫去收集資料,最後需要對資料進行一些處理,看看是不是有missing value或者outliers等等。

這個過程之後得到了可靠的資料,然後便進入到核心的資料分析。為了能更好的從資料裡提取到需要的資訊,以下這些軟體就是數據分析師們常用的。Querying language和statistical language主要是用來做一些初步的數據分析,例如可以出一些圖表,看一下資料的分佈,從而對資料有個瞭解。而scripting language則可以用於建模或者測試一下hypothesis。因此總的來說,這些軟體對於數據分析師來說就像廚師的刀,是必不可少的工具。

查詢語言(Querying Language)

如SQL、Hive和Pig,

指令碼程式語言(Scripting Language)

如Python和Matlab,如果想更偏向於General purpose programming,最好還要學Python或者近年來發展迅猛的F#Dataquest 這個網站上提供了一系列和資料分析相關的python教程:

從python基本語法到data analysis的基本函數,
PANDAS包的使用方法,
machine learning裡常用的Python指令,
甚至還有手把手教你玩Kaggle。
當然這個只是入門級教程,高階技巧需要在實戰項目裡積累。

統計語言(Statistical Language)

如R和SPSS,就社群規模和質量與學習成本與前景,最好學R。

夯實基礎程式設計語句。這一部分主要是R的最基礎部分的學習,包括資料管理(向量、矩陣、資料框、字元串等的操作等)、數學計算與常見函數、陣列與矩陣操作的常用函數、邏輯運算、流程控制語句(if, else, while, for 等)

掌握基礎統計模型與分析方法
學會運用視覺化工具,主要是學習ggplot2包
高階R進階:掌握一些厲害的package
資料圖表(Spreadsheet)

如Excel和FineReport,對於剛剛入門的新手還是比較推薦從Excel入手,打好做報表的基礎。Excel的功能很強大,但對於資料處理量並不是很給力,我是比較FineReport這樣的報表工具去學習和實踐的!理由很簡單,以我自身的例子來看,很明顯VBA只能解決少量的個體需求。而開發一款基於資料庫的應用軟體系統,需要寫大量jsp/asp/php程式碼,基於資料庫的展示,查詢和錄入的網頁。不僅開發效率不高,專案交付的維護工作量大,而且成本很高。

客觀來講,FineReport是操作簡單卻功能極其強大的工具。入門容易,升級難。在FineReport的知識層次中,每一個層次有很多級別。

操作:FineReport的使用技巧,按照大功能可分為資料表、圖表、參數查詢、資料填報、行動端、平臺搭建、定時排程、部署整合。
擴充套件:FineReport外圍但非常相關,主要是底層的資料處理,需要掌握的有資料庫知識SQL語言、ETL等,前端的一些實現開發,需要掌握的是JS
開發:FineReport支援各類外掛,不滿足的功能可以自己開發定製,需要掌握java

明確問題(Defining the Problem)
將分析範圍縮小是很重要的技能。如何將複雜的問題去掉細枝末節,抓住重點需要良好的溝通能力和對商業需求的充分理解能力。注意:避免向客戶遞交太多對解決核心問題無用的資訊。另外,對公司和行業的瞭解也會使得這個過程更加得心應手。

瞭解聽眾(Knowing the Audience)
通常來說一個數據分析師需要面對PM和CEO。因此,在準備presentation時,要注意回答這兩方關心的不同的問題。對於PM來說,需要的是簡單無修飾,多幹貨介紹在各種情況下如何進行協作互動。而面對CEO,需要展示的是稍加修飾的PPT和最重要提供具體的建議。

另外很需要注意的一點是communication。很有可能資料分析師們面對的聽眾並不是有technical的背景,如何將很專業的術語轉化為商業語言是十分重要的。而掌握一定的data visualization的技能便會在此時讓展示更為有效。

強調結果(Delivery)
一定要有研究成果的展示,如果只是分析內容的步驟,而缺乏最後對成果的總結,將很有可能延滯項目的推進。對於公司或項目的管理者來說,分析的過程並不是他們最看重的,而分析的結果和針對這個結果有什麼合理的建議或解決方法才是最讓他們關注的,因此為了更為有效地推進項目,重點強調結果是十分必要的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章