原创 人工智能如此簡單(1)—— 關於權重與偏置

1、人工智能的本質         人工智能是使用程序模擬人類神經感知的技術,他從根本上改變了傳統程序的思維。傳統程序採用斷言的方式來進行,而人工智能則採用抽取規律來實現對應的功能。        這種方式其實是對分析歸納法的一種體現,隨

原创 第二章:新版tensorflow入門,使用檢查點保存模型

1、概述和老版本的tensorflow一樣,模型需要進行保存,而且這種保存方式是週期性的。因爲在很多情況下,梯度會在局部最小值左右進行搖擺,也就是說,在很多情況下,最後一次訓練的模型不見得是最優化的。2、保存模型我們可以在構建模型時,制定

原创 第一章:新版tensorflow入門,對鳶尾花進行分類

1、背景2018年tensorflow進行了版本升級1.8.0,新版tensorflow對原來版本進行了進一步的封裝,編程方式也與之前的內容有了很多的不同。本文介紹在新版TensorFlow 中解決鳶尾花分類問題。2、新版tensorfl

原创 第三章:新版tensorflow入門,處理特徵列

1、概述特徵列是原始數據與模型之間進行鏈接的橋樑。一般來說,人工智能的本質是要進行權重與偏置的運算用來確定模型的形態。在使用之前的tensorflow版本時,都需要預先將數據進行類型、分佈的處理,才能被人工智能模型所使用。而特徵列的出現則

原创 第五章:新版tensorflow入門,自定義模型(estimator)

1、概述新版tensorflow內置了六款模型,包含線性迴歸模型和邏輯迴歸模型,能夠使用這些模型非常方便快捷的實現自己的業務需求。但如果內置模型不能滿足我們的業務需求時,就需要我們來自定義自己的模型。如下圖所示,預創建的 Estimato

原创 人工智能如此簡單(2)—— 激活函數

1、關於激活函數如果按照上一篇文章的思路,人工智能是無法模擬曲線方程的,比如拋物線方程,及時加入再多的參數值,也無法達到效果,所以需要引入激活函數。爲了方便這裏介紹一種最爲簡答的函數sigmoid函數,sigmoid函數的原型如下:這個函

原创 第七章:新版tensorflow入門,RNN與LSTM

1、概述傳統的神經網絡對線性迴歸、邏輯迴歸都有比較好的效果。卷積神經網絡主要應用與計算機視覺技術。使用過濾器對圖片的邊緣特徵值進行檢測。在之前的章節中使用cnn對文本分類其實是借用了計算機視覺的一些原理,過濾器的尺寸也有着特殊的設置。在人

原创 第四章:新版tensorflow入門,處理數據集

1、概述tensorflow對於數據的格式有着特殊的要求,另外所需要的數據量也是巨大,同樣會有批量梯度下降這樣的需求。爲了保證數據的隨機性,我們有時候還需要隨機化數據分佈。這樣數據預處理就變得十分的關鍵。tensorflow提供了一系列的

原创 第六章:新版tensorflow入門,卷積神經網絡進行手寫數字識別

1、概述新版的tensorflow的layer模塊提供了更爲簡單的api,是我們能夠非常快速的創建卷積神經網絡。卷積神經網絡被廣泛的應用在計算機視覺的技術當中。現在要用卷積神經網絡來進行手寫數字的識別。可以使用minist數據集來進行本次

原创 使用對抗生成模型生成手寫數字

1、概述 對抗生成模型是人工智能模型中經常使用的結構,本文介紹使用tensorflow實現手寫數字的生成。生成式對抗網絡(GAN, Generative Adversarial Networks )是一種深度學習模型,是近年來複雜分佈上無

原创 使用attention機制的seq2seq模型實現論文翻譯

1、概述 本文是關於attention-seq2seq模型實現中文到英文的翻譯。論文的核心gru作爲seq2seq模型的基本單元。基本翻譯效果如下圖所示: 2、模型結構 整體模型結構如下圖所示: 相關數學公式如下圖所示 相關模型

原创 論文翻譯-通過無監督方法產生不同風格的唐詩

1、摘要 原論文 Stylistic Chinese Poetry Generation via Unsupervised Style Disentanglement 鏈接: http://nlp.csai.tsinghua.edu.cn

原创 論文翻譯-阿里小蜜,基於檢索模型和生成模型相結合的聊天引擎

1、摘要 阿里小蜜是一款開放領域的聊天機器人引擎,他結合了IR(檢索)模型與帶有注意力機制的seq2seq生成模型。從效果上來講,阿里小蜜的表現明顯優於只使用某一種單一模型的情況。 2、介紹 近年來,聊天機器人技術發展非常迅速,比如微軟小

原创 論文翻譯-通過對齊與翻譯聯合學習實現機器翻譯

1、摘要 基於神經網絡的機器學習是目前最爲流行的一種機器翻譯的方法。與傳統的統計學翻譯不同,這種翻譯方式是通過構建一個神經網絡來最大限度提升翻譯的性能。該模型是encoder–decoders模型家族中的一種。他使用編碼器(encoder

原创 成語接龍改版

1、概述 上一版的成語接龍中,對漢字進行了嚴格匹配,我們會發現,在這種情況下,成語接龍的長度很短。如下圖所示: 原因是什麼呢,因爲我們一般在玩成語接龍遊戲時遵循的原則是可以音同字不同。給予這種需求,我們對之前的代碼進行一次改版 2、代碼