最全大數據分析學習優質資源

大約兩個月前,我開始學習數據科學。我並沒有統計學、數學、數據科學、工程學、經濟學方面的學位。說實話,在學生時代,數學和統計並不是我的強項,我更擅長語言方面。

我擁有管理學的學士和碩士學位。我論文更偏向於文獻綜述,而不是運用定量研究方法。我的工作是時尚領域的買手。因此我的教育背景和工作中都很少與數學以及統計打交道。

那我是怎麼開始學習數據科學的呢?我對“從數據中獲得分析見解”這個觀點非常感興趣。因此,我下定決心去克服對數學和統計的恐懼感。

數據產生的速度非常快,我們可以在2天內生產出2003年以前的所有數據。如今可能更快只需要10分鐘。並且這些數據中只有1%進行了分析,該領域充滿了可能性。因此我認爲我有必要投生數據分析領域,這就是我的初衷。

以下我將從線上課程、Youtube頻道、TED演講、博客、博客等方面列出數據分析領域不可錯過的優質資源。

  1. 線上課程 MOOC

Coursera創始人吳恩達和Daphne Koller

統計基礎(Basic Statistics)
https://www.coursera.org/learn/basic-statistics
掌握統計學對於理解社會和行爲科學的研究至關重要。在該課程中,你將學習統計學的基礎知識。

機器學習(Machine Learning)
https://www.coursera.org/learn/machine-learning
吳恩達熱門的機器學習課程,學習時需要提前掌握一定的編程、數學、統計方面的基礎知識。

Python for Everybody
https://www.coursera.org/specializations/python
我強烈推薦這門。如果你像我一樣,之前沒有相關技術背景,那麼通過這堂課能夠很好的學習如何用Python進行編程。

  1. Youtube頻道

Youtube上有很多不錯的頻道,下面按類別區分。分爲教程、會議演講、訓練營三個類型。

教程類型

機器學習

Siraj Raval
https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A
人們對其意見不一,但我仍認爲對於初學者而言這個頻道是不錯的開端。

Harrison Kinsley
https://www.youtube.com/user/sentdex
總體來說,對初學者而言這是不錯的開端。這類YouTube教程主要偏向於如何解決某個問題。

Welch Labs
https://www.youtube.com/user/Taylorns34

當中不錯的系列教程有:
Learning to see
https://www.youtube.com/watch?v=i8D90DkCLhI&list=PLiaHhY2iBX9ihLasvE8BKnS2Xg8AhY6iV

Neural Networks Demystified
https://www.youtube.com/watch?v=bxe2T-V8XRs&list=PLiaHhY2iBX9hdHaRr6b7XevZtgZRa1PoU

這兩個課程主要針對初學者的,大數據學習扣qun74 零零加【41三八一】有助於掌握概念,絕對值得一看。

統計

Brandon Foltz’s Statistics 101
https://www.youtube.com/channel/UCFrjdcImgcQVyFbK04MBEhA

可汗學院的統計學系列(Khan Academy’s Statistics playlist)
https://www.youtube.com/watch?v=uhxtUt_-GyM&list=PL1328115D3D8A2566

數學

mathbff
https://www.youtube.com/channel/UCy5ev9EE-u5Iwbt2NHrcayw
當你遇到不熟悉的數學術語以及數學規則時,該頻道是不錯的選擇。

Python

Chuck Severance’s Python for Everybody
https://www.youtube.com/user/csev

會議演講類型

該類型中有些對於初學者來說可能不容易理解,但是可以從中把握數據科學的前沿動態。

PyData
https://www.youtube.com/user/PyDataTV

Open Data Science
https://www.youtube.com/channel/UCDS20hpBFiv_Kdp5Ibh0vew

Data Science Festival
https://www.youtube.com/channel/UCB02fDSj9GR4rhb1APMNclw/feed

Scipy: Scientific Computing with Python
https://www.youtube.com/user/EnthoughtMedia/playlists

O’Reilly
https://www.youtube.com/user/OreillyMedia

Goto
https://www.youtube.com/user/GotoConferences

Google Developers
https://www.youtube.com/channel/UC_x5XG1OV2P6uZZ5FSM9Ttw

KDD 2016
https://www.youtube.com/channel/UCPsUUDUlcTJuP-fRa7z85aQ

KDD 2017
https://www.youtube.com/channel/UC_sfvZvvPUbOQhDs_cqlx_A

訓練營類型

General Assembly
https://www.youtube.com/user/gnrlassembly

Data Science Dojo
https://www.youtube.com/user/DataScienceDojo

  1. TED演講

我特別喜歡TED演講。通過各種話題的演講者,我總能發現新的事物,獲得靈感。

值得注意的是TED演講分爲: TED Talks 和 Tedx Talks。

TED Talks 和 Tedx Talks的區別在於,前者偏向於從全球的角度把握,而後者主要是由當地社區舉辦。

TED Talks
https://www.youtube.com/user/TEDtalksDirector

TEDx Talks
https://www.youtube.com/user/TEDxTalks

下面列出一些熱門的數據科學TED演講:

我們都是數據科學家
(We’re All Data Scientists | Rebecca Nugent)
https://youtu.be/YMnqPTLoj7o

數據科學家最重要的技能
(The most important skills of data scientists | Jose Miguel Cansado)
https://www.youtube.com/watch?v=qrhRfPY4F4w&feature=youtu.be

給我看數據—成爲你自己的專家
(Show me the data — becoming an expert in yourself | Talithia Williams )
https://www.youtube.com/watch?v=TDCYJ3_gx2w&feature=youtu.be

通過講故事,讓數據更有意義
(Making data mean more through storytelling | Ben Wellington)
https://www.youtube.com/watch?v=6xsvGYIxJok&feature=youtu.be

數據的權重
(The Weight of Data | Jer Thorp)
https://www.youtube.com/watch?v=Q9wcvFkWpsM&feature=youtu.be

播客

當然,短短几十分鐘的播客不會讓你成爲專家,但你會聽到專業的數據科學家如何談論相關主題,並將其應用於實際問題。

Data Skeptic
https://dataskeptic.com/
主持人Kyle Polich和Linh Da用通俗易懂的語言解釋各種數據科學概念,當中不會涉及到數學或計算。

Partially Derivative
http://partiallyderivative.com/
很遺憾,該播客在2017年9月5日最後一期之後就停播了。通過該播客,我學習到了如何在特定情況下應用相應的機器學習算法。

Partially Derivative的主持人:左起Jonathon Morgan、Vidya Spandana、Chris Albon

Linear Digressions
http://lineardigressions.com/
主持人是數據科學家Katie Malone和UI工程師Ben Jaffe。他們從不同的角度對數據科學進行了闡述。

Learning Machines 101
http://www.learningmachines101.com/
關注機器學習的播客。建議你從頭開始聽,因爲可以讓你瞭解該領域的發展歷程,積累必要的理論知識。

Stats + Stories
http://www.npr.org/podcasts/530134710/stats-stories
該播客主要關注統計和新聞方面。由於許多數據科學概念來自統計學,學習如何像統計學家一樣思考是非常有用的。

More or Less
http://www.bbc.co.uk/programmes/p02nrss1/episodes/downloads
BBC的播客,主要關注人們身邊的數學和統計學問題。

博客

數據科學方面有許多優質的博客,這是可以利用RSS來訂閱相關內容。

出版商博客

Data Blog——The Guardian
https://www.theguardian.com/data
英國衛報的博客,分享新聞背後的數據。

Data——O’Reilly Media
https://www.oreilly.com/topics/data
分享關於數據領域的高質量文章

組織機構博客

Facebook Research Blog
https://research.fb.com/category/data-science/
關於數據科學的博客,當中包括各種主題的研究論文; 自然語言處理,計算機視覺等。

AWS AI Blog
https://aws.amazon.com/blogs/ai/

Tableau Blog
https://www.tableau.com/about/blog

Bloomberg——Graphics
https://www.bloomberg.com/graphics
具有數據可視化的經濟新聞報道。

Data at GDS Blog
https://gdsdata.blog.gov.uk/
英國政府的數字服務數據博客,從中能夠政府對數據的使用情況。

數據社區/門戶

FiveThirtyEight
http://fivethirtyeight.com/
美國著名統計學家Nate Silver的網站,主要關注政治和體育方面,有時會在Github中分享數據集。

Fiverthirtyeight風格的圖形非常有名。

Analytics Vidhya
https://www.analyticsvidhya.com/
專注數據科學的商業分析方面,包括相關教程、技巧等。

Dataconomy
http://dataconomy.com/
側重於數據科學在現實中的應用。

KDnuggets
http://www.kdnuggets.com/
著名的數據網站,包括各種主題、新聞、教程等。

Dataquest Blog
https://www.dataquest.io/blog/
包括在線數據科學課程,教程類型文章很有幫助。

個人博客

Jer Thorp: blprnt.blg
http://blog.blprnt.com/
數據可視化方面的專家。

西歐的酒店地圖,顯示巴黎、倫敦、馬德里和羅馬等首都城市的酒店密度。
(圖片來自Jer Thorp: flickr.com/photos/blprnt/)

Data Science 101
http://101.datascience.community/
Demystifying Data Science的主講人之一,Ryan Swanstrom。關於如何學習數據科學的不錯資源。

Dr. Randal S. Olson
http://www.randalolson.com/blog/
分享如何將數據科學應用於現實生活中的問題。

個人興趣(時尚和零售方面的數據科學)

Net-A-Porter Technical Blog
http://techblog.net-a-porter.com/

Lyst’s Engineering Blog
https://making.lyst.com/

Etsy Technicla Blog: Code as Craft
https://codeascraft.com/

Stitch Fix Technical Blog
http://multithreaded.stitchfix.com/blog/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章