google sdk speech-to-text(谷歌語音轉文本、谷歌語音轉字幕)

原創

2019-04-02 09:22

google sdk speech-to-text

同步識別（REST 和 gRPC）將音頻數據發送到 Speech-to-Text API，對該數據執行識別，並在所有音頻處理完畢後返回結果。同步識別請求僅限於持續時間不超過 1 分鐘的音頻數據。
異步識別（REST 和 gRPC）將音頻數據發送到 Speech-to-Text API 並啓動長時間運行的操作。使用此操作，您可以定期輪詢識別結果。異步請求可用於任何持續時間不超過 180 分鐘的音頻數據。
流式識別（僅限 gRPC）對 gRPC 雙向流內提供的音頻數據執行識別。流式傳輸請求專爲實時識別（例如從麥克風採集實時音頻）而設計。流式識別可以一邊採集音頻一邊提供臨時結果，例如實現在用戶仍在講話時顯示結果。

源碼

https://github.com/opensourceteams/google-sdk-speech-to-text

識別率超高的在線麥克風語音轉文本(免費工具)

https://www.speechtexter.com

官網文檔

https://cloud.google.com/speech-to-text/docs/quickstart-client-libraries#client-libraries-usage-java

Java 流式和非流式語音識別示例(官網示例)

google speech-to-text

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/languages.md

google 語音轉文本(短語音)

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text.md

google 語音轉文本(英文短語音)

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-english.md

google 語音轉文本(異步短語音)

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-async.md

google 語音轉文本(每個單詞帶時間戳)

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-time.md

google 語音轉文本自動加標點符號(短語音)

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/Google_Gnome.wav

google 通過流的方式發送語音文件轉文本

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-steam.md

google 通過流的方式發送語音(直接用電腦上的麥克風說話)

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-micsteam.md

google 語音轉文本(多軌支持)

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-multiChannel.md

Google Speech 多語言支持

https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-multiLanguage.md

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

阿里淘系自研編解碼器包攬兩項世界冠軍！

12月15日，2020 年 MSU 世界視頻編碼器大賽成績公佈，阿里巴巴淘系技術自研的奇點編碼器首次參賽就包攬圖像失真指標PSNR的兩項冠軍。奇點編碼器可以在離線和在線場景下將視頻壓縮50-1000倍後，實現最好的畫質播放。在未來，奇

2024-05-14 01:40:19

KubeKey v3.1 發佈：快速自定義離線安裝包

日前，KubeKey v3.1 正式發佈。該版本主要對離線場景部署、離線包製作以及向 Kubernetes v1.24+ 升級進行了優化。 KubeKey 簡介 KubeKey 是 KubeSphere 社區開源的一款高效集羣部署工具，運

2024-05-17 23:16:50

記一次有點抽象的滲透經歷

0x01 獲取webshell 在各種信息蒐集中，發現某個ip的端口掛着一個比較老的服務。首先看到了員工工號和手機號的雙重驗證，也不知道賬號是什麼結構組成的，基本上放棄字典爆破這一條路。於是乎打開之前用燈塔的掃描結果，看看文件泄露是否

2024-05-17 23:16:30

MySQL 核心模塊揭祕 | 16 期 | InnoDB 表鎖

本文介紹了 InnoDB 支持哪幾類表鎖，以及它們分別都用在什麼場景下，還介紹了其中兩類表鎖爲什麼要存在。作者：操盛春，愛可生技術專家，公衆號『一樹一溪』作者，專注於研究 MySQL 和 OceanBase 源碼。愛可生開源社區出品，

2024-05-17 12:02:59

win 環境下 docker 的使用整理

1、下載： https://www.docker.com/products/docker-desktop/ 如果電腦分多個盤，建議下載到可用存儲較大的盤，安裝的時候默認安裝到 C 盤，安裝完成後雙擊啓動如果出現【Docker

2024-05-17 00:25:04

“她”來了，陪伴賽道鉅變！爲GPT-4o加上你的一個數字分身

OpenAI的每次發佈，感覺都會幹翻一個行業。昨晚GPT-4o的發佈，情感陪伴這個賽道像是又要掀起一番驚天鉅變。各位創業老闆們摩拳擦掌，無數創意精英又要踏入新的征程。開源社區一定也異常興奮，相信Huggingface和Github馬上又會

2024-05-16 23:56:27

通義千問 2.5 “客串” ChatGPT4，你分的清嗎？

作者：張添翼、董藝荃引子 OpenAI 發佈了最新的 GPT-4o 模型，通義千問也在前不久剛發佈通義千問 2.5，已經和 GPT-4-Turbo 不分伯仲：既然目前還沒有和 GPT-4o 文本生成能力的對比數據，就讓我們來和大模型一

2024-05-16 21:13:41

AI 一鍵生成高清短視頻，視頻 UP 主們捲起來...

現在短視頻越來越火，據統計，2023年全球短視頻用戶數量已達 10 億，預計到2027年將突破 24 億。對於產品展示和用戶營銷來說，短視頻已經成爲重要陣地，不管你喜不喜歡它，你都得面對它，學會使用它。但是，優質短視頻的持續輸出對視頻創作

2024-05-15 21:17:30

天地圖開發接入指南

註冊賬號 https://uums.tianditu.gov.cn/register 登錄已有賬號 https://sso.tianditu.gov.cn/login?service=https%3A%2F%2Fuums.tiandi

2024-05-15 12:08:42

詳解 MySQL 的 binlog 時間戳與 exec_time 的關係

詳解 binlog 時間戳與 exec_time 的關係。作者：李錫超，蘇商銀行DBA，負責數據庫和中間件運維和建設。擅長 MySQL、Python、Oracle，愛好騎行、技術研究和分享。愛可生開源社區出品，原創內容未經授權不得隨意

2024-05-15 00:02:08

go-kit學習指南 - 中間件

原文：https://blog.fengjx.com/pages/d6f092 介紹 go-kit的分層設計可以看成是一個洋蔥，有許多層。這些層可以劃分爲我們的三個領域。 Service: 最內部的服務領域是基於你特定服務定義的，也是

2024-05-14 12:17:31

go-kit學習指南 - 基礎概念和架構

原文：https://blog.fengjx.com/pages/40737e 介紹 go-kit 是一個微服務開發工具集，並不算一個完整的框架。根據工程實踐總結的一套開發規範，解決分佈式開發中的常見問題，它同樣也適用於單體服務開發。

2024-05-14 12:17:28

分析 MySQL 中的內存使用情況

瞭解如何可視化 MySQL 連接的內存使用情況。作者：Benjamin Dicken 本文和封面來源：https://planetscale.com/blog/，愛可生開源社區翻譯。本文約 3000 字，預計閱讀需要 10 分鐘。

2024-05-14 00:04:20

第三次團隊作業（需求分析）

這個作業屬於哪個課程 <a href="https://edu.cnblogs.com/campus/fzzcxy/SE" target="_blank" style="color: #0099ff; text-decoration:

2024-05-14 00:03:14

用python畫出全球疫情趨勢變化圖

前言文的文字及圖片來源於網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理。作者：謙睿科技 PS：如有需要Python學習資料的小夥伴可以加點擊下方鏈接自行獲取http://t.cn/A6Z

2024-05-14 00:03:10

24小時熱門文章

最新文章

最新評論文章