華爲雲語音識別：一句話識別API調用

原創

2020-06-13 19:55

最近想做一個智能硬件（實現單片機使用W600連接上位機或直接實現語音識別）

查看了華爲雲的語音交互服務SIS，有兩種：錄音文件識別以及一句話語音識別

名稱	功能
錄音文件識別	可以實現5小時以內的音頻到文字的轉換。支持垂直領域定製，對應領域轉換效果更佳。
一句話識別	可以實現語音到文字的轉換。支持垂直領域定製，對應領域轉換效果更佳。

在看了這兩種模式後，選擇了一句話識別，方便在下位機方面進行開發（前些時間已經實現STM32對語音文件實現8K採樣率16bit的PCM格式WAV文件生成）

跳轉到一句話識別的API介紹（https://support.huaweicloud.com/api-sis/api-sis.pdf），發現使用時需要先獲取該用戶的token(呃通過撥打華爲雲的客服電話解決了這個問題)

獲取用戶Token採用POST方式，地址格式爲：

針對不同的服務端點選擇Endpoint，後綴是相同的/v3/auth/tokens

此時使用華爲雲推薦的軟件（Postman）來實現這個過程

使用這個地址，進行提交

此時會反饋你的Token(只能使用24小時），如果打算長期使用請選擇SDK （https://support.huaweicloud.com/sdkreference-sis/sis_05_0004.html），目前只有JAVA格式的，本文主要介紹API方式

得到Token就可以進行語音識別啦！！這裏還是使用POST的方式，此時地址會發送改變，一句話語音識別的兩個服務端點爲：

區域名稱	終端節點（Endpoint）
華北-北京一	sis-ext.cnnorth-1.myhuaweicloud.com
華北-北京四	sis-ext.cnnorth-4.myhuaweicloud.com

因爲我的是華北-北京四，這裏選擇sis-ext.cnnorth-4.myhuaweicloud.com，繼續查看該API手冊，發現對於提交語音數據的包格式定義如下：

此時POST地址爲： https://sis-ext.cn-north-4.myhuaweicloud.com/v1/｛projectid｝/asr/short-audio

獲取Projectid的方式：將光標放在用戶名下面選擇我的憑證：

得到projectid後開始發包：

我採用的是WAV自識別模式，使用的WAV文件爲AU生成的錄音文件，利用BASE64編碼轉換後進行發送：

data數據爲轉碼後的base64格式，因爲太長就不放上來了。此時點擊SEND

測試成功，本篇結束。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

AppBuilder語音能力分享：讓AI給你講睡前故事吧

我們來更一篇最近大家非常關心的，但很多小夥伴找不到入口，和落地教程的，AppBuilder的語音功能的實戰貼~ Ai technology AppBuilder是個啥？先給剛入坑

2024-05-24 12:13:21

華爲雲受邀出席AICon2024 分享AI Agent在企業生產中的技術實踐

近日， InfoQ在北京舉辦行業技術盛會——AICon全球人工智能開發與應用大會2024，華爲雲aPaaS首席架構師陳星亮受邀出席，和技術愛好者分享AI Agent在企業生產中的技術實踐。大模型技術發展浪潮下，AI Agent成爲新一

2024-05-24 10:58:18

強大的VS插件CodeRush全新發布v23.2.6——支持語音

CodeRush是一個強大的Visual Studio .NET 插件，它利用整合技術，通過促進開發者和團隊效率來提升開發者體驗。 CodeRush v23.2.6正式版下載具體更新詳情如下：語音支持 - CTP 指定Azure語音識別

2024-03-27 01:01:35

AI大模型助力：離線生成中英雙語字幕

在數字化時代，隨着越來越多的影片、劇集、教學視頻等內容湧現，字幕作爲連接不同語言觀衆的重要橋樑，其重要性日益凸顯。傳統的字幕製作方式往往需要人工逐句翻譯和校對，效率低下且易出錯。現在，隨着AI技術的發展，我們有了更加高效和準確的方式來生成雙

2024-03-19 12:14:21

人工智能大模型原理與應用實戰：自動駕駛技術的飛躍

一、人工智能大模型的基本原理人工智能大模型，尤其是深度學習模型，通常由多層神經網絡組成。這些神經網絡通過海量的參數來建立輸入數據和輸出數據之間的複雜映射關係。在訓練過程中，模型通過反向傳播算法不斷調整參數，使得模型的預測結果與真實結果儘可

2024-03-15 00:33:20

掌握提示詞工程與大模型多場景實戰

隨着人工智能技術的飛速發展，AI已經滲透到我們生活的方方面面，從智能手機到自動駕駛，從智能家居到醫療診斷，都離不開AI的助力。在這個大背景下，越來越多的人開始關注AI技術，希望能夠掌握這門未來必備的技能。本文將帶你走進AI技術的兩個重要領域

2024-03-11 12:26:54

大模型技術調研與端應用形態探索

在人工智能領域，大模型（Large Model）技術的崛起標誌着深度學習進入了一個全新的階段。這些模型通常包含數十億甚至千億級別的參數，通過大規模的數據訓練，能夠在語音識別、自然語言處理、圖像識別等多個領域取得令人矚目的成就。那麼，大模型究

2024-03-08 12:36:05

文心一言變身虛擬患者，助力醫學生輕鬆開啓「實踐模式」

本期文心開發者說邀請到天佑星河團隊負責人，從醫療教育與人工智能結合的角度出發，分享“智慧醫療教育系統”的開發歷程。本期分享將從應用介紹、應用價值、應用亮點、技術全景等方面介紹“智慧醫療教育系統”應用的開發心得和技術路線。隨着生成式人工智能

2024-03-01 12:31:25

驍龍8 Gen3與百億參數大模型的共舞

近年來，隨着人工智能技術的飛速發展，手機已經成爲人們日常生活中不可或缺的智能終端。而隨着手機硬件的不斷升級和AI技術的不斷創新，我們迎來了一個令人振奮的時刻：手機將能夠運行百億參數大模型。這一技術突破的實現，離不開驍龍8 Gen3的強大性能

2024-03-01 00:25:04

大模型如何助力開發者打造新質生產力

在當今的AI編程時代，大模型已經成爲了推動技術進步和產業變革的重要力量。大模型，即大型神經網絡，具有海量的參數和複雜的結構，能夠處理更廣泛、更復雜的任務。隨着數據集的擴大和計算能力的提升，大模型在語音識別、自然語言處理、計算機視覺等領域取得

2024-02-26 12:25:04

燕千雲新版本 | ITSM專家會診功能上線，羣聊解難題，協同解決就這麼簡單！

在最新推出的V1.28.0版本中，燕千雲帶來了一系列激動人心的新功能及優化，旨在全面提升您的工作效率和體驗：全新的多會話模式，大幅強化的Prompt模板，便捷的羣聊功能，智能工單旅程和審批單動態記錄的深度優化，以及企業微信和釘釘的緊密整合

2024-02-23 21:19:07

語言大模型的現狀與未來趨勢

在過去的幾年裏，語言大模型已經成爲了人工智能領域最熱門的話題之一。從最早的基於規則的自然語言處理，到後來的基於統計的方法，再到現在的深度學習模型，語言大模型的發展歷程可以說是波瀾壯闊。語言大模型的現狀目前，語言大模型已經在許多領域得到了

2024-02-22 12:33:56

零門檻AI開發平臺EasyDL：百億參數大模型ERNIE的加持

隨着人工智能技術的不斷髮展，越來越多的企業和個人開始關注如何快速開發出高效的AI模型。在這個背景下，EasyDL應運而生，作爲一個零門檻AI開發平臺，它降低了AI開發的門檻，讓更多人能夠輕鬆地開發和部署AI模型。而當EasyDL與百億參數大

2024-02-21 12:33:38

我在京東做研發 | 從好玩到好用，爆火ChatGPT前沿分享

| 嘉賓：吳友政，京東集團高級總監、京東科技語音語言算法部負責人。 2006年中科院自博士畢業後，先後在日本國立信息通信研究機構、英國愛丁堡大學、索尼中國研究院從事自然語言處理相關研究工作，主要聚焦自然語言處理、人機對話、語音識別、機器翻

2023-02-24 23:41:13

大廠對外API平臺長啥樣？

近期在對接科大訊飛的接口，看了下幾個大廠，騰訊、阿里、華爲，其實不外乎由幾個部件構成，後期若要設計API平臺可參考。 API平臺作爲互聯網公司，對外暴露接口能力，比如科大訊飛的語音識別、圖像識別。華爲雲也提供了類似的AI服務。一般的流程就

2022-04-30 13:17:39

24小時熱門文章

最新文章

最新評論文章