lzg_ad:在WES中添加語音識別功能

如果我們希望在WES操作系統中添加語音識別和語音朗讀功能,那麼我們需要關注以下組件:
Speech Control Panel:
添加該組件可以在控制面中添加語音控制圖標,我們可以通過這個功能來選擇或者配置Speech recognition(SR-語音識別)或者 text-to-speech engine(TTS-文本語音轉化引擎)。 這些設置取決與可選擇的語言,聲音輸出和聲音質量, 也包括可選擇的麥克風輸入。 在語音屬性中可以制定和更新用戶配置文件。通過用戶配置文件,使語音識別引擎能夠更好地認識到一個發言者的習慣和在一個特定的環境下的背景聲音。
Text To Speech Core:
該組件作爲一個文本語音轉換的核心組件爲文本語音轉換和語音識別提供了一個公共的、基礎的組成文件。 因爲任何系統以外的語音或講話都直接訪問這些動態鏈接庫的情況是不可能的。
注意:SAPI的共同組成部分文件無法直接測試。因爲這些文件需要的語音業務,而成功的測試功能需要包括相關講話來證實他們的存在和目前的狀態。
Speech API English Text To Speech Engine:
該組件包含一個設備驅動程序,負責的文字轉換成語音。該動態鏈接庫( DLL )無法直接被應用程序所訪問,但可以通過語音的API ( SAPI模塊)獲得。這一組件默認提供了微軟英文支持和至少包含一個英文的聲音。一般來說,每一種語言,都需要自己的DLL和支持文件。此外,至少有一個朗讀聲音是需要爲每種語言所必需的可用發音。製造商可以提供他們自己的語言格式,或符合現有的Microsoft模式。
Speech API English Text To Speech Voice (Sam):
該組件包含一個程序,輸入或儲存轉換的文字語言。通過該程序可以用語音描述文本。 Microsoft提供了一個默認的聲音-Microsoft Sam。可以從獨立的語音引擎製造商購買到更多的第三方廠商提供的聲音,並在安裝過程中加載到語音識別系統中。
Speech API Core:
該組件提供了基本的語音功能所提供的語音應用程序編程接口( SAPI模塊) 。sapi.dll文件是組件的一個組成部分,需要依賴所有的語音功能組件。組件的其他文件-sapisvr.exe,用於語音識別,該功能不能在操作系統初始安裝後安裝。
Speech Text Services v1.1:
該組件是一個是基於文本服務框架的API的Windows輸入服務。結合語音的API( SAPI模塊)和語音識別引擎,該組件提供聽寫和文字轉換語音服務。
Text Services Framework:
文字服務框架(TSF)的組成部分是一個組件對象模型(COM)爲基礎的系統服務,它提供了一種簡單且可擴展的框架,以便提供先進的文本輸入和自然語言技術。TSF可以啓用在應用程序中或作爲TSF文字服務啓動。TSF提供多國語言文字服務的支持,並提供文字服務,如鍵盤輸入服務,手寫識別和語音識別。
TSF是一個獨立於設備的,語言中立,和可擴展的系統提供文字和語言的技術。TSF的應用程序可以使用任何文字服務來支持TSF。
下面的列表介紹了這部分的內容:
  • 一個具有TSF的應用程序將會與文本服務框架交互。
  • TSF文字服務,提供了多種輸入編輯功能。文字服務控制軟鍵盤輸入,語音識別,文字轉換,和文本編輯。
  • 作爲TSF文字服務和啓用了TSF的應用程序之間的接口。除了從TSF文字服務響應輸入,TSF也迴應改變的文件,這將啓動更多的文字服務。
CUAS IME:
該組件允許以前版本的應用程序或文本服務框架不知道的控件免費的使用TSF。該組件還爲所有的應用程序在桌面上提供了一個一致的用戶界面。這部分還可以在任何應用程序上用於語音聽寫和手寫輸入的文字,例如記事本。
Accessibility Core:
該組件是一套組件對象模型(COM)界面和應用編程接口(API),用於提供了一個可靠的方式來表現和收集有關基於Windows的用戶界面(UI)元素。利用此信息,可以查詢技術供應商用於用戶界面表現的替代格式,如語音、盲文、語音指揮和控制應用程序可以遠程操作的界面。
Windows Narrator (Screen Reader):
該組件爲弱視用戶提供了文本語音轉換工具。朗讀文本內容顯示在用戶的屏幕上,例如,內容的活動窗口,菜單選項,並輸入文字的網頁。
該組件將能夠讀取記事本,寫字板,控制面板程序, Internet Explorer , Windows桌面和Windows安裝程序。在其他應用程序中,該組件可能無法正確地讀詞。
該組件允許通過用戶定製的方式閱讀屏幕的以下幾個方面內容:
  • 在顯示新的窗口,菜單或快捷菜單可以朗讀。
  • 鍵入的字符可以朗讀。
  • 鼠標指針可以按照項目在屏幕上的位置進行朗讀。
  • 朗讀速度,音量,或音調可以更改。
輔助工具在Microsoft Windows XP的目的是提供一個最低限度的功能以供有特殊需要的用戶使用。
Microsoft Japanese IME Soft Keyboard Program:
微軟日語IME軟鍵盤擴展計劃的組成部分爲微軟日語IME核心組件,允許用戶通過軟件鍵盤在屏幕上輸入字符。這一組件提供了以下軟件鍵盤。
  • 字母, QUERTY鍵盤佈局
  • 字母數字,字母鍵盤佈局
  • 平假名/片假名,日本JIS鍵盤佈局
  • 平假名/片假名,拼音鍵盤佈局
  • 軟件鍵盤輸入號碼和日期
Utility Manager:
該實用程序管理器組件使用戶能夠檢查無障礙計劃中的狀態和啓動或停止的無障礙計劃程序。用戶管理員級訪問權限可以通過管理器有計劃的啓動輔助工具。用戶還可以在Windows登錄之前,或者在登錄到計算機歡迎屏幕時,按下Windows徽標鍵+u啓動輔助程序。
開始時打開輔助工具管理器可以使用內置的輔助程序,像放大鏡,朗讀和屏幕鍵盤,敘述者,文字語音轉換程序。這使低視力用戶也能立即進入操作系統。
使用輔助工具管理器,用戶可以通知Windows在每次登錄到他們的電腦時自動啓動無障礙程序,或當輔助工具管理器啓動鎖定他們的電腦桌面。例如,用戶可以指定自動啓動放大鏡程序在下一次登錄到計算機上的時候。這不需要在每次用戶登錄到計算機上按照標準步驟打開放大鏡。
Microsoft Japanese IME Speech Recognition Program:
日文語音識別程序組件作爲Microsoft Japanese IME Core組件的擴展功能,允許用戶輸入日文文本並作爲語音發音從麥克風中輸出。另外,作爲語音識別功能,該組件還提供能語音回放,text-to-speech engine(TTS-文本語音轉化引擎和錄音功能。
注意:該組件不包括語音識別引擎,你需要從WES的其他組件中添加語音識別引擎。 微軟輸入法的語音識別程序的設計目的是與Microsoft IME Pad 功能協同工作。語音識別組件還需要依賴Microsoft Japanese IME Core組件。
Microsoft Japanese IME Character List/Stroke Count/Radical Programs:
微軟日語IME字符列表/筆畫數/基礎程序組件擴展了微軟日文輸入法編輯器( IME )核心組件,允許用戶輸入未知的漢字字符。這部分支持以下的功能:
  • 字元列表程序,它允許用戶從一個列表中輸入一個字符。
  • 筆畫數程序,它允許用戶使用指定其筆畫數輸入一個字符。
  • 基礎程序,它允許用戶根據基礎字符輸入一個字符。
Microsoft Japanese IME Handwriting Program:
微軟日語IME手寫計劃的組成部分擴展了微軟日語IME核心組件,允許用戶通過鼠標輸入日文文本或手寫筆。這部分採用日本的手寫識別部分承認手繪日語字符,併發布了官方的字符輸入法。
 
    以上組件是WES中關於語音識別相關功能的組件,如果我們需要在我們的WES操作系統中添加語音功能,首先應該保證的是添加了以上的組件並進行了完整的關聯檢查。在以上組件說明中,我是以日文語言包來描述各個組件功能的,如果我們需要添加中文語音識別功能,則需要替換成相應的中文語言包。WES中默認帶的是英文的(Microsoft Sam),如果我們需要使用中文的,是必須在安裝WES的時候,把中文語言包支持勾選上的。
    另外,由於WES\XPE均是局部漢化,而不是像XPP那樣從內核開始漢化,所以對與中文語言的語音支持,可能不能像XPP那樣完善。但是我們可以通過下載第三方的一些語音識別程序來達到一樣的功能效果。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章