数据科学工具箱week1笔记

最近同时在上cousera的另一门课程,希望三年后能成为一名出色的数据分析师,曾想过往大数据挖掘那方面试下的,不过慢慢地想法改变了下,只抱着单纯的学习数据处理技能来学习,或许也不错吧

第一节。series motivation

第一节嘛,主要还是讲下学习的理由,以及什么叫做data scientist。确实看过之后让我的观念有所改变,并不是只有像anderew NG 这样的牛人才能搞数据分析,也不是隔壁的华工机器学习那帮人才能搞,高端有高端玩法,只要把跟自己工作相关的数据处理好,依靠数据作决策,就应该有碗饭吃了吧

不说闲话,先放一个维恩图,不错的框架,努力的方向呀(编程能力,数学及统计学知识,实务能力),有意思的是只有编程和实务能力,看来是成不了数据分析师的哦


第二节 数据科学家的工具箱

R,Github.当然我觉得有价值的应该是下面这张图吧,感觉全程像是做菜


1.3 getting help

首先是一些r的帮助


1.4 finding answer

以下是各方面牛人的关键特征,也可以说是长处,要学会啊(有点感觉week1是在进行德育训练,不像是技能训练呢) 

参照第一图

不得不说外国人还是敬业,这都总结,呵呵




1.5 r语言总览(五笔为jtyq)之所以第三笔是y,是要加一点

1.6 getting and cleaning data overview

 这是我觉得很重要的一环





1.7exploratory analysis overview

  探索式分析内容,这些都是基本步吧

分析图的原则

探索式绘图

plotting systems in R    -base -lattice(晶格式) -ggplot2(另一种绘图包)

hierarchical分层 聚类  k-means聚类

维降约




1.8 reproducible research overview(重复性研究概论)

重复性研究内容:

一个数据分析的结构

组织一个数据分析

markdown

LaTeX

R Markdown

基于证据的数据分析

RPubs

数据分析的步骤见1.2最后一张图


1.9统计推断概述statistical inference overview


1.10回归模型概述regression models overview


1.11实用机器学习概述

主要是marchine learning in R


1.12 数据产品创建概述

R包是一个很好的展示自己的机会,若有实力,可以做一个,于是找工作什么的应该就不难了吧


注意R allows object oriented programming这句话是错的,要记住

发布了31 篇原创文章 · 获赞 1 · 访问量 3万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章