tensorflow2.0概述

前言

通過這一節,瞭解tensorflow可以做什麼,遇到一個問題能夠判斷tensorflow有什麼現成的庫,最後需要明白自己要學什麼,不要一窩蜂地都學,那樣沒啥效果。我們要知道哪些內容需要理解並熟練掌握,哪些內容可以選擇記憶,用到的時候再看這部分內容。

tensorflow summary

簡介

tensorflow是一個非常全的,開源的,針對機器學習(不止是深度學習),**平臺(具體怎麼發揮取決你)**的軟件包。

全景圖

在這裏插入圖片描述
上圖是tf的全景,左邊train部分包括distribution統一調度底層的硬件,tf.keras和estimators這兩個高級api去搭建模型,這裏還可以通過底層custm層自定義層(學術型的工作)。tensorflowhub裏面有很多先進的算法實現,可以拿到本地去使用。read&preprocess data 是花費時間最多的地方,很多時候模型搭建寫不了多少時間,大都在data處理上,因此這部分要掌握好。
右邊是開發部分,serving是把訓練好的model設置成後端api, lite部署到嵌入式,針對前向傳播進行大量的編譯優化,.js是面對前端網頁的。此外還有其他語言的轉換。
tf2.0 和1.0相比,它把高層api統一合併到keras,並刪除了大量的冗餘的api,降低學習難度。

training 階段

在這裏插入圖片描述
這是訓練的流程,其中tf.data和feature colums用好的話可以大大降低在數據處理上花費時間,因此是整個訓練部分最應該要熟練掌握的。 tensorboard可以對訓練整個過程進行調控和監視。keras和estimators簡單知道幾個常用的就行,其他的用到時候可以查google,但是custom自定義層要熟練掌握。

develpment部分

把模型部署出來,略。

tensorflow擴展工具

在這裏插入圖片描述
tensorboard:模型可視化工具,經常會用到

XLA:加速庫

probability:自己加入先驗知識,強加到模型中,也就是掌舵tf變化。

ragged tensor: 讓tensor 變成可變長的tensor,常用在rnn中。

tensor2tenor: 加速dl的研究,將先進的模型放入進去。

privacy: 加密。

federated: 解決數據分散和數據不能共享問題,但是所有人基於共同的數據能夠訓練出來一個好的模型。有點像區塊鏈。

rl :強化學習,但是不完善。

其他:也有很多其他的生態擴展包,用到時候可以查。

tensorboard(模型訓練駕駛艙)

在這裏插入圖片描述

XLA

工業中對模型的大小和運行進行優化,學術領域用不到。
在這裏插入圖片描述

機器學習的工作全景

從下圖可以看出,機器學習真正code只有中間很少的一部分,如果只鑽到ML code很容易陷入一個技術瓶頸。大多數的時間會在data收集、驗證、提取特徵上。很多研究人員在ml code領域,雖然他們工作很少,但是整個流程都是圍繞他運行的。因此要對ML code有正面評價,但是還要有負面評價。如果在大公司一個人只做其中的一個小方向,好處是能夠做到精尖的水平,但是小公司就要全做了,這樣能鍛鍊水平但是我覺得增值慢。沒有精尖增值快。
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章