數據科學工具箱week1筆記

最近同時在上cousera的另一門課程,希望三年後能成爲一名出色的數據分析師,曾想過往大數據挖掘那方面試下的,不過慢慢地想法改變了下,只抱着單純的學習數據處理技能來學習,或許也不錯吧

第一節。series motivation

第一節嘛,主要還是講下學習的理由,以及什麼叫做data scientist。確實看過之後讓我的觀念有所改變,並不是只有像anderew NG 這樣的牛人才能搞數據分析,也不是隔壁的華工機器學習那幫人才能搞,高端有高端玩法,只要把跟自己工作相關的數據處理好,依靠數據作決策,就應該有碗飯吃了吧

不說閒話,先放一個維恩圖,不錯的框架,努力的方向呀(編程能力,數學及統計學知識,實務能力),有意思的是隻有編程和實務能力,看來是成不了數據分析師的哦


第二節 數據科學家的工具箱

R,Github.當然我覺得有價值的應該是下面這張圖吧,感覺全程像是做菜


1.3 getting help

首先是一些r的幫助


1.4 finding answer

以下是各方面牛人的關鍵特徵,也可以說是長處,要學會啊(有點感覺week1是在進行德育訓練,不像是技能訓練呢) 

參照第一圖

不得不說外國人還是敬業,這都總結,呵呵




1.5 r語言總覽(五筆爲jtyq)之所以第三筆是y,是要加一點

1.6 getting and cleaning data overview

 這是我覺得很重要的一環





1.7exploratory analysis overview

  探索式分析內容,這些都是基本步吧

分析圖的原則

探索式繪圖

plotting systems in R    -base -lattice(晶格式) -ggplot2(另一種繪圖包)

hierarchical分層 聚類  k-means聚類

維降約




1.8 reproducible research overview(重複性研究概論)

重複性研究內容:

一個數據分析的結構

組織一個數據分析

markdown

LaTeX

R Markdown

基於證據的數據分析

RPubs

數據分析的步驟見1.2最後一張圖


1.9統計推斷概述statistical inference overview


1.10迴歸模型概述regression models overview


1.11實用機器學習概述

主要是marchine learning in R


1.12 數據產品創建概述

R包是一個很好的展示自己的機會,若有實力,可以做一個,於是找工作什麼的應該就不難了吧


注意R allows object oriented programming這句話是錯的,要記住

發佈了31 篇原創文章 · 獲贊 1 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章