還在“收集”證書?學好數據科學,做項目纔是第一位的

全文共1903字,預計學習時長7分鐘

還在“收集”證書?學好數據科學,做項目纔是第一位的

圖源:unsplash

 

筆者曾經覺得當一個數據科學家實在是太容易了,註冊一個在線課程,按部就班地學習基礎知識,學完就可以獲得證書,只要多拿幾個證書就能去找工作。整個過程十分順利,筆者很快就拿到了這些證書。

 

你猜接下來怎麼着?我遭到了現實世界的毒打!

 

提供證書的課程能讓你掌握基礎知識,熟悉數據科學領域。然而,它們並不能給你帶來顛覆性的改變。當然,這裏說的證書是指通過完成MOOC課程,而不是通過像AWS之類的綜合考試獲取的證書。

 

1.證書很難讓人“主動學習”

 

獲取證書的過程沒有挑戰性。只要上課認真聽講,通讀材料,就能輕鬆通過考試。它也不會逼着你去真正消化吸收知識,如果自己不願意費心思考,不捨得逼自己一把,那學到的知識只能在短期記憶裏暫時停留,很快就會還給老師。

 

正如尼克·達姆所言:“神經連接發生變化對學習來說至關重要,然而當學習活動不夠主動時,神經連接就不會發生變化。許多研究表明,主動參與是大腦神經連接發生變化的先決條件。因此,僅僅依靠演講或講座是學不到東西的。”

 

別把大部分時間都花在MOOC的課程上,做項目是主動學習的一個很好的方法,它們逼着你主動參與到整個過程中來。

 

還在“收集”證書?學好數據科學,做項目纔是第一位的

圖源:unsplash

 

2.數據不是現成的

 

課程中,我們接觸到的大部分數據都是現成的,它們排版清爽乾淨。有時會缺少一些值,但這些值的結構易於處理。某些情況只要求進行基本的預處理。

 

然而大部分數據科學家不會碰到這樣的情況,他們在處理數據的過程中無時無刻不在思考,數據科學家通常要弄清楚以下問題:

 

· 怎麼收集?

· 需要哪種數據?

· 怎麼整理和預處理數據?

 

做項目的主要任務之一就是準備數據,你會從中獲得數據收集與準備的實踐經驗,這對是一項特別有價值的技能,單純靠收集證書是無法提高這項技能的。

 

3.不會帶來創造性思考

 

還在“收集”證書?學好數據科學,做項目纔是第一位的

圖源:unsplash

 

想要獲得證書,你得嚴格遵循課程安排,這樣一來,你可以從基礎到高級逐步積累知識。但是它也爲你規劃好了路線,你不用逼着自己去做創新性思考。

 

然而數據科學領域的項目沒有既定路線,也沒有任何限制,你可以自己定義問題、設計解決方案。這是做數據科學家最有挑戰性的工作,數據科學家用數據來解決問題,在現實生活中,問題和數據都不是現成的。

 

當然,在獲取證書的過程中可以學會使用工具和技術,但如果你不能用這些工具和技術來創造價值,那麼掌握它們的意義何在呢?

 

爲了創造價值,你需要跳出固有思維。爲項目設計想法並加以實施,能幫助你用數據科學來創造價值。課堂上討論的案例都受到特定條件的限制,而數據科學項目卻具有更大的潛在價值,只想着拿證書就很難做到創新性思考。

 

4.現實處處有意外

 

課堂上學到的都是可預測的情況,然而現實生活卻充滿了意外。想通過拿一個證書學會解決所有可能存在的問題是不可能的,詳細列舉出所有可能的解決辦法和用到的技術,那麼學習過程又會變得冗長。過長的課程安排會挫敗你的積極性,降低成就感。

 

我在MOOC上學完幾門課後自以爲已經是pandas大師了,用pandas做數據分析的所有必要知識我都掌握了。然而當開始做第一個項目的時候,筆者發覺萬里長征纔剛剛踏出第一步。儘管只是一個入門級的簡單項目,筆者卻在下面的過程中反覆花費了許多時間:

 

· 遇到問題

· 找解決辦法

· 在找解決辦法的過程中學到了很多東西

 

項目能教你學會許多東西。更重要的是,完成項目的喜悅激勵你立刻開啓下一個新項目。

 

5.可行性問題

 

證書課程將引導你完成從數據收集到模型評估一個典型的數據科學項目流程,你可以爲示例創建模型。然而,證書課程不會深入討論模型的可行性問題。

 

可行性與項目其他過程同樣重要。如果你的解決方案特別複雜難以實施,那麼這個方案就毫無價值。通過做項目你纔會考慮可行性問題。你不僅要設計一個模型,還要想辦法部署模型,讓模型創造出價值。

 

你聽說過Netflix在kaggle平臺舉辦的有獎競賽嗎?獎金有一百萬美元。Netflix最終沒有使用獲獎模型,因爲它們可行性太低。執行獨立項目不需要你去實際部署模型或將其投入生產,但至少要考慮一下可行性問題。

 

還在“收集”證書?學好數據科學,做項目纔是第一位的

圖源:unsplash

 

實踐是進步最直接的道路。學習任何東西都是這樣,我們從簡單項目入手,通過做更多的項目實現進階,最終可以讓項目具有投入生產的潛力。學習課程,收集證書,你學會的只是基礎知識和紙上談兵的能力,做項目纔是真正的落地過程。勤於動手做大量項目是學習數據科學最好的練習。

還在“收集”證書?學好數據科學,做項目纔是第一位的

一起分享AI學習與發展的乾貨

歡迎關注全平臺AI垂類自媒體 “讀芯術”

(添加小編微信:dxsxbb,加入讀者圈,一起討論最新鮮的人工智能科技哦~)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章