python 猿編程模塊(一)ybc_speech
首先先安裝模塊
C:\Python36\python.exe -m pip install ybc-speech
record:錄製音頻
def record(filename, seconds=__SECONDS, to_dir=__TO_DIR, rate=__RATE, channels=__CHANNELS, chunk=__CHANNELS):
"""
功能:錄製音頻文件。
參數 filename 是錄製生成的語音文件的名字,
可選參數 seconds 是錄製時長(單位:秒),默認 5 秒,
可選參數 to_dir 是存放語音文件的目錄,默認爲當前目錄,
可選參數 rate 是錄製採樣率,1 代表 16000,0 代表 8000,默認爲 1,
可選參數 channels 是聲道,默認 1,
可選參數 chunk 是一次讀取的字節數,默認 1024,
返回:錄製的音頻文件的路徑。
"""
示例:
import ybc_speech as s
import os
s.record("aaa.wav",10)
os.system("aaa.wav")
voice2text:語音轉文字
def voice2text(filename='', rate=__RATE, format_type=__FORMAT_TYPE):
"""
功能:把語音文件轉換成文字。
參數 filename 是當前目錄下期望轉換成文字的語音文件的名字,
可選參數 rate 是語音文件的採樣率,1 代表 16000,0 代表 8000,默認爲 1,
可選參數 format_type 是語音文件的類型,默認 PCM 格式,
返回:轉換成的文字。
"""
示例:
import ybc_speech as s
#import os
print(s.voice2text("aaa.wav"))
text2voice:語音合成
def text2voice(text, filename, speaker=__SPEAKER, speed=__SPEED, aht=__AHT, apc=__APC, volume=__VOLUME, _format=__FORMAT, rate=__RATE):
"""
功能:把文字轉換成語音。
參數 text 是待轉換的文字,
參數 filename 是生成的語音文件的名字,
可選參數 speaker 是發音人,1 代表小剛(男聲),2 代表小云(女聲),默認爲1,
可選參數 speed 是語速,1 代表正常速度,0.5 代表慢速,2 代表快速,默認爲1,
可選參數 aht 是音高,默認爲 0,
可選參數 apc 是音色,默認爲 58,
可選參數 volume 是音量,默認爲 100,
可選參數 _format 是語音文件的格式,1 代表 PCM,2 代表 WAV,3代表 MP3,默認爲 2 ,
可選參數 rate 是語音採樣率,1 代表 16000,0 代表 8000,默認爲 1,
返回:生成的語音文件的名字。
"""
示例:
import ybc_speech as s
import os
s.text2voice("Hello","hello.wav",2)
os.system("hello.wav")
speak:播放便捷函數
def speak(text='', speaker=__SPEAKER, speed=__SPEED, aht=__AHT, apc=__APC):
"""
功能:朗讀一段文字。
參數 text 是待朗讀的文字,
可選參數 speaker 是發音人,1 代表小剛(男聲),2 代表小云(女聲),默認爲1,
可選參數 speed 是語速,1 代表正常速度,0.5 代表慢速,2 代表快速,默認爲1,
可選參數 aht 是音高,默認爲 0,
可選參數 apc 是音色,默認爲 58,
返回:無。
"""
常量表
__RATE = 16000
__FORMAT_TYPE = 2
__SECONDS = 5
__TO_DIR = None
__CHANNELS = 1
__CHUNK = 1024
__SPEAKER = 1
__SPEED = 1
__AHT = 0
__APC = 58
__VOLUME = 100
__FORMAT = 2