google sdk speech-to-text
- 同步識別(REST 和 gRPC)將音頻數據發送到 Speech-to-Text API,對該數據執行識別,並在所有音頻處理完畢後返回結果。同步識別請求僅限於持續時間不超過 1 分鐘的音頻數據。
- 異步識別(REST 和 gRPC)將音頻數據發送到 Speech-to-Text API 並啓動長時間運行的操作。使用此操作,您可以定期輪詢識別結果。異步請求可用於任何持續時間不超過 180 分鐘的音頻數據。
- 流式識別(僅限 gRPC)對 gRPC 雙向流內提供的音頻數據執行識別。流式傳輸請求專爲實時識別(例如從麥克風採集實時音頻)而設計。流式識別可以一邊採集音頻一邊提供臨時結果,例如實現在用戶仍在講話時顯示結果。
源碼
識別率超高的在線麥克風語音轉文本(免費工具)
官網文檔
- https://cloud.google.com/speech-to-text/docs/quickstart-client-libraries#client-libraries-usage-java
Java 流式和非流式語音識別示例(官網示例)
- https://github.com/GoogleCloudPlatform/java-docs-samples
- https://github.com/GoogleCloudPlatform/java-docs-samples/tree/master/speech