google sdk speech-to-text(谷歌語音轉文本、谷歌語音轉字幕)

google sdk speech-to-text

  • 同步識別(REST 和 gRPC)將音頻數據發送到 Speech-to-Text API,對該數據執行識別,並在所有音頻處理完畢後返回結果。同步識別請求僅限於持續時間不超過 1 分鐘的音頻數據。
  • 異步識別(REST 和 gRPC)將音頻數據發送到 Speech-to-Text API 並啓動長時間運行的操作。使用此操作,您可以定期輪詢識別結果。異步請求可用於任何持續時間不超過 180 分鐘的音頻數據。
  • 流式識別(僅限 gRPC)對 gRPC 雙向流內提供的音頻數據執行識別。流式傳輸請求專爲實時識別(例如從麥克風採集實時音頻)而設計。流式識別可以一邊採集音頻一邊提供臨時結果,例如實現在用戶仍在講話時顯示結果。

源碼

識別率超高的在線麥克風語音轉文本(免費工具)

官網文檔

Java 流式和非流式語音識別示例(官網示例)

google speech-to-text

google 語音轉文本(短語音)

google 語音轉文本(英文短語音)

google 語音轉文本(異步短語音)

google 語音轉文本(每個單詞帶時間戳)

google 語音轉文本自動加標點符號(短語音)

google 通過流的方式發送語音文件轉文本

google 通過流的方式發送語音(直接用電腦上的麥克風說話)

google 語音轉文本(多軌支持)

Google Speech 多語言支持

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章