初識Tensorflow，基本概念及簡單示例

一、前言

目前，深度學習已經廣泛應用於各個領域，比如圖像識別，圖形定位與檢測，語音識別，機器翻譯等等，對於這個神奇的領域，很多童鞋想要一探究竟，這裏拋磚引玉的簡單介紹下最火的深度學習開源框架 tensorflow。本教程不是 cookbook，所以不會將所有的東西都事無鉅細的講到，所有的示例都將使用 Python。

那麼本篇教程會講到什麼？首先是一些基礎概念，包括計算圖，graph 與 session，基礎數據結構，Variable，placeholder 與 feed_dict 以及使用它們時需要注意的點。最後給出了在 tensorflow 中建立一個機器學習模型步驟，並用一個手寫數字識別的例子進行演示。

1、 tensorflow是什麼？

tensorflow 是 google 開源的機器學習工具，在2015年11月其實現正式開源，開源協議Apache 2.0。

下圖是 query 詞頻時序圖，從中可以看出 tensorflow 的火爆程度。

2、 why tensorflow?

Tensorflow 擁有易用的 python 接口，而且可以部署在一臺或多臺 cpu , gpu 上，兼容多個平臺，包括但不限於安卓/windows/linux 等等平臺上，而且擁有 tensorboard這種可視化工具，可以使用 checkpoint 進行實驗管理，得益於圖計算，它可以進行自動微分計算，擁有龐大的社區，而且很多優秀的項目已經使用 tensorflow 進行開發了。

3、易用的tensorflow工具

如果不想去研究 tensorflow 繁雜的API,僅想快速的實現些什麼，可以使用其他高層工具。比如 tf.contrib.learn，tf.contrib.slim，Keras 等，它們都提供了高層封裝。這裏是 tflearn 的github樣例集。

4、 tensorflow安裝

目前 tensorflow 的安裝已經十分方便，有興趣可以參考官方文檔。

二、 tensorflow基礎

實際上編寫tensorflow可以總結爲兩步.

（1）組裝一個graph;

（2）使用session去執行graph中的operation。

因此我們從 graph 與 session 說起。

1、 graph與session

（1）計算圖

Tensorflow 是基於計算圖的框架，因此理解 graph 與 session 顯得尤爲重要。不過在講解 graph 與 session 之前首先介紹下什麼是計算圖。假設我們有這樣一個需要計算的表達式。該表達式包括了兩個加法與一個乘法，爲了更好講述引入中間變量c與d。由此該表達式可以表示爲：

當需要計算e時就需要計算c與d，而計算c就需要計算a與b，計算d需要計算b。這樣就形成了依賴關係。這種有向無環圖就叫做計算圖，因爲對於圖中的每一個節點其微分都很容易得出，因此應用鏈式法則求得一個複雜的表達式的導數就成爲可能，所以它會應用在類似tensorflow這種需要應用反向傳播算法的框架中。

（2）概念說明

下面是 graph , session , operation , tensor 四個概念的簡介。

Tensor：類型化的多維數組，圖的邊；

Operation:執行計算的單元，圖的節點；

Graph：一張有邊與點的圖，其表示了需要進行計算的任務；

Session:稱之爲會話的上下文，用於執行圖。

Graph僅僅定義了所有 operation 與 tensor 流向，沒有進行任何計算。而session根據 graph 的定義分配資源，計算 operation，得出結果。既然是圖就會有點與邊，在圖計算中 operation 就是點而 tensor 就是邊。Operation 可以是加減乘除等數學運算，也可以是各種各樣的優化算法。每個 operation 都會有零個或多個輸入，零個或多個輸出。 tensor 就是其輸入與輸出，其可以表示一維二維多維向量或者常量。而且除了Variables指向的 tensor 外所有的 tensor 在流入下一個節點後都不再保存。

（3）舉例

下面首先定義一個圖（其實沒有必要，tensorflow會默認定義一個），並做一些計算。