chatbot聊天機器人環境搭建以及項目運行指南

項目地址

網傳有一位程序員因忙於工作,無暇陪伴女友,便做了個聊天機器人的軟件來陪女友聊天,然後自己就安心工作去了。等到程序員下班時一看,機器人已經和女友聊到了二胎的娃叫啥名了。博主不明覺厲,便去拷貝一份源碼試試水。
項目的github地址:https://github.com/sea-boat/seq2seq_chatbot
可以clone下來,但是感覺速度太慢,直接下載壓縮包會快一點。
最近有讀者反映github地址打不開,而且網速也太慢,博主就把代碼拉取到了一個國內的代碼託管平臺,鏈接:https://gitee.com/july825633167/seq2seq_chatbot

環境搭建

根據項目readme文件中的說明,項目對環境有一定的版本要求,推薦大家最好嚴格按照項目中的環境要求來安裝,包括版本也是。博主曾被版本問題虐得死去活來博主從來沒有安裝過錯誤版本。
![]
如圖上所示,該版本需要python3.5以及tensorflow1.3的環境,如果版本不匹配將會造成兼容性問題,在下文中會詳細介紹。

1. 安裝Anaconda

1)Anaconda簡介

Anaconda 是一個用於科學計算的 Python 發行版,支持 Linux, Mac, Windows, 包含了衆多流行的科學計算、數據分析的 Python 包。
tensorflow是一種基於python腳本語言的高級應用,它的運行依賴於底層的應用,因此需要安裝python以及許多相應的擴展包。這些擴展包一個個安裝會消耗太多時間,python的大部分擴展包,都集成在anaconda裏面,因此可以通過使用集成環境anaconda完成環境搭建。

2)下載及安裝Anaconda

由於官網下載較慢,博主使用了清華大學的鏡像:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/
在這裏插入圖片描述
上圖爲清華大學鏡像網上的文件,大家可以根據自己的電腦系統以及環境要求選擇合適的版本。這些都是可執行的exe文件,下載下來之後直接雙擊就可實現安裝。安裝完成之後,可以使用cmd驗證是否安裝成功。輸入conda --version
在這裏插入圖片描述
上圖即爲博主電腦上安裝的anconda,版本爲4.3.8。

3)安裝其他版本的python

如果我們這個時候使用python命令查看python的版本,會發現電腦上已經有了可用的python環境。
在這裏插入圖片描述
如上圖所示:使用python --version命令會發現電腦上已經有了python3.6.0的環境,如果使用where python命令查看其安裝路徑,會發現python的文件路徑是指向anaconda文件夾下面的。說明這個版本是anaconda自帶的python。
由於tensorflow最適合的版本是python3.5,所以我們不能使用Anaconda自帶的3.6的,這裏我們要下載3.5版的python。
在命令行中鍵入如下命令:conda create --name python352 python=3.5.2
其中python=3.5.2是版本號,python352是自己的命名,劃重點:命名中不能出現".“符號,即不能寫成"python3.5.2”,不然在後面引用的時候會被當成非法命名,不能正常使用。此坑博主親踩
輸入之後會出現如下信息,此處需要手動輸入 字母y 同意當前操作。
在這裏插入圖片描述
在這裏插入圖片描述
如果出現上圖的信息,就說明安裝成功了。接下來可以通過activate python352指令來激活。
在這裏插入圖片描述
在激活之後,如果輸入指令python --version查看python的版本,可以看到這裏的python版本就是我們剛纔安裝的3.5.2的版本了,而不是anaconda自帶的3.6.0版本。查看了版本之後,可以使用deactivate python352指令退出。

2. 安裝Tensorflow

博主用的系統是win10,這裏主要介紹一下windows下基於anaconda安裝tensowflow的步驟。最常用的指令是:pip install tensorflow但是這種指令默認安裝最新版的tensorflow,前面有提到過chatbot要求運行環境中tensorflow的版本爲1.3,不同的版本會造成一系列兼容性問題。比如tensorflow1中支持的placeholder到了tensorflow2中就不再支持了。此坑博主親踩
如果想要從官網獲取指定的版本可以使用指令pip install tensorflow==1.3.0但是官網的速度會很慢,因此在這裏,博主推薦一種安裝指定版本的指令:
pip install tensorflow==1.3.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
這個指令能夠從清華大學鏡像網上獲取指定版本的tensorflow。
在這裏插入圖片描述
很多人中途會遇到上圖這樣的情況,不用慌,這是超時造成的,只要重新輸入上一條指令繼續等待即可。
在這裏插入圖片描述
用不了多久,就會顯示上圖中的信息,這就表示安裝成功了。

3. 安裝Spyder插件

執行完上一步的操作之後,很多人會以爲tensorflow已經安裝好了,但事實上還缺少了最後一步的配置操作。

1)導入tensorflow

在這裏插入圖片描述
首先,我們從開始菜單中找到anaconda prompt,通過它激活python352並進行導入tensorflow。
在這裏插入圖片描述

2)安裝spyder

接下來通過開始菜單進入anaconda navigator:
在這裏插入圖片描述
在這裏插入圖片描述
不難發現,目前的Applications欄中填寫的是root,即爲anaconda的根,它的默認環境是python3.6。
在這裏插入圖片描述
我們需要將其切換爲之前安裝的python352。如上圖。
在這裏插入圖片描述
然後再點擊install按鈕進行安裝,上圖spyder中的install按鈕在安裝之後就會變成launch按鈕,安裝完成之後點擊即可啓動。
Spyder啓動之後,整個環境的搭建工作就完成了。

項目運行

在這裏插入圖片描述根據chatbot項目的readme文件介紹,文件運行順序如上圖所示,但是在運行項目之前,我們還需要做一些準備工作:

1. data.py

在這裏插入圖片描述
首先是data.py文件,第一行有個import nltk,這個nltk包在anaconda集成環境中並不存在,需要用戶自己去安裝,安裝指令也很簡單,直接在命令行中輸入即可:pip install nltk,同時data.py文件第三行import numpy as np,numpy包有些人的電腦上可能也會沒有,需要自己安裝,指令爲:python -m pip install numpy

2. train.py

在這裏插入圖片描述
其次是train.py文件,該文件中有一個控制訓練循環的次數變量,github上拉取下來的代碼中默認是5000000次,大家可以根據自己的需要修改,畢竟博主電腦性能不夠,訓練五百萬次需要二十多天電腦性能好的或者跑gpu的同志們可以自行忽略本段文字。不過如果將訓練次數減少,最終得到的結果準確度肯定也不會那麼精確,畢竟魚和熊掌不可兼得。

3.項目運行

按照readme文件中指定的順序運行即可:data.py->train.py->test_model.py。但是中間train.py文件的訓練時長需要很久,大家在訓練的時候記得不要切斷電源
博主也是第一次使用tensorflow,如果有講的不對的希望大家多對包容,也歡迎各位在評論區指正。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章