智能語音交互式檢索系統

簡介和注意事項

歷時幾個月的項目基本開發完成了,除了一些細節代碼還在更改調試。感覺甚是舒服。
注意:項目部分代碼將會發布到github上面,地址是:等我上傳後再提供地址,目前還沒有上傳。由於整個項目是實際項目,所以部分核心代碼將不會提供。此外代碼僅供大家學習交流。我的qq1310517843。下面先用一些圖片和文字介紹一下項目。具體的功能流程圖,實現細節後續會慢慢添加。

1. 說話人識別

1.1 用戶登錄
用戶通過隨機說一句話來驗證說話人是否是已經註冊的用戶,如果是纔可以登錄系統,當然每個用戶是有不同的權限等級的,根據管理員來賦予權限。下面是登錄界面:
在這裏插入圖片描述
1.2 用戶註冊
點擊註冊即可進入註冊頁面,註冊可以上傳您自己的錄音文件,也可以直接在線錄音,錄音完成後,點擊註冊,您的語音文件將會上傳至服務器,並且調用說話人識別的算法模型對您的語音進行特徵提取和保存,並對您賦予默認權限。當您再利用語音登錄時,服務器調用說話人識別的算法模型把您的錄音和語音特徵庫進行對比,從而驗證您的身份。註冊頁面如下:
在這裏插入圖片描述
調用身份驗證的代碼截圖如下:
在這裏插入圖片描述

2.模式選擇

用戶登錄成功後,可以選擇模式,個人模式和會議模式,個人模式適用於個人檢索數據使用,會議模式一般用於多人模式,具體使用細節後面會介紹。下面是模式選擇截圖:
在這裏插入圖片描述

3.個人模式

選擇個人模式後,就可以盡情享用啦,想要檢索什麼就說出來!想要檢索什麼就說出來!想要檢索什麼就說出來!重要的事情說三遍,點擊開始說話,說出你想要檢索的內容。代碼將會根據你說的內容爲您檢索出相關數據。
檢索原理爲:頁面上傳您說的語音指令,然後服務器調用語音識別算法模型將您的語音識別爲文本,然後根據自然語言文本******************檢索出數據,*省略100字,將檢索出來的數據顯示給您。截圖如下:
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
注意:測試使用,以上數據並不是真實數據。

4.會議模式

該模式適合多人開會的場景,例如投影屏幕登錄了系統,那麼投影屏幕進入等待界面,等待用戶發出檢索數據的語音指令,令人興奮的的是,我們拿起手機,掃描二維碼進入語音控制界面,對着你的手機說出你要查詢的內容,對着你的手機說出你要查詢的內容,對着你的手機說出你要查詢的內容,重要的事情說三遍,然後系統會把檢索的數據投影到大屏幕上。
投影屏幕截圖如下:
在這裏插入圖片描述
手機控制界面:
在這裏插入圖片描述
在這裏插入圖片描述
數據投影至大屏幕如下:
在這裏插入圖片描述

5.插入一段漂亮的代碼片

在這裏插入圖片描述
結束啦!!!!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章