大規模文本語音合成

原創

2020-04-25 02:45

先通過pip install baidu-api安裝必要的庫，然後通過調用百度api實現大規模文本的語音合成，這樣就可以很容易把文本格式的圖書轉化爲語音，從此開始聽書生活。當然，也可以調用百度的api，實現大規模的文字識別，把pdf格式的圖書轉化爲tx格式，然後再通過本文的方法實現語音合成。

from aip import AipSpeech
 
""" 你的 APPID AK SK """
APP_ID = '********'
API_KEY = '**************************'
SECRET_KEY = '*****************************'
 
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

file=open("耶路撒冷三千年.txt", encoding='utf-8')
text=file.readlines()
file.close()

soundF = open('audio.mp3','+wb')

for line in text: 
    #print(line)
    data=[]
    #split long sentences into small ones
    if len(line)>2000:
        data = line.split('。')
    else:
        data.append(line)
    #convert  txt to sound by baidu API
    for sentences in data:
        result  = client.synthesis(sentences, 'zh', 1, {
            'vol': 5,'per':4
        })
        if not isinstance(result, dict):
            soundF.write(result)
            print(len(sentences))
        else:
            print("failed length" + str(len(sentences)))

soundF.close()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

大規模文本語音合成

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

安利一款軟件：可視化磁盤分析（查看磁盤空間被那些文件佔據了）

機器學習速成課程----數據準備

libtorch c++ 線性卷積聯合網絡的訓練及測試用於識別MNIST手寫數據集

libtorch c++ 自定義數據類型並使用

調用百度AI接口的錯別字識別python代碼

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結