《自拍教程69》Python 批量重命名音頻文件，AV專家必備！

本篇主要學習如何Python自定義模塊並調用該模塊，並重點介紹Python正則表達式的強大的文本處理能力。

案例故事: 任何一款終端產品只要涉及音頻輸出，就肯定涉及音頻的解碼,
作爲一名專業的AV (Audio & Video）測試人員，我們需要一堆的規範化標準的的音頻測試文件，
但是發現音頻資源名字命名的很隨意比如：青藏高原.wma,
以上命名不能看出音頻文件的具體編碼規格，
測試經理要求我進行批量重命名工作，模板如下,
音頻編碼格式_音頻採樣率_聲道數_比特率_容器.容器, 例如：
WMA_44.1KHz_stereo_192Kbps_wma.wma

音頻編解碼基本知識

將聲音存儲爲音頻文件的時候，需要經過以下幾個步驟：

需要錄製（採樣）成音頻原始數據;
通過一定的編碼壓縮技術將音頻原始數據儘可能地壓縮成最小;
通過音頻容器以獨立文件的形式存儲音頻;

主要涉及以下技術參數:

音頻參數	參數釋義	舉例
音頻編碼格式（壓縮技術）	即將音頻數據壓縮的一類技術, 不同的編碼格式，其壓縮率與壓縮效果不一樣。主要分成2類：有損壓縮（會導致失真，壓縮率高）無損壓縮（儘量保真，壓縮率低）	有損壓縮： Mpeg1 Level3(即我們常說的Mp3)； WMA；LCACC； LTPAAC； HE-AAC, HE-AACV2； AMR-WB, AMN-NB； Vorbis；MiDi；無損壓縮： Flac；PCM;APE
音頻採樣率 (單位：Khz)	將聲音記錄成數據文件的時候，需要對聲音進行採樣，每秒鐘對聲音信號的採樣次數即採樣率。採樣率越高，越能還原現場音質。	比如44.1Khz代表每秒採樣44100次 8Khz, 11.025Khz, 22.5Khz, 32Khz, 44.1Khz, 48Khz,96Khz
音頻位深度 (單位：bit)	每次採樣，採集數據量的大小	8bit, 16bit
音頻聲道數 (單位：channel)	一般有雙聲道即2個聲道，錄音的時候肯定是需要2個麥克風同時錄製的，即同時採集了2個音頻流。 5聲道，則需要有5個麥克風同時錄製	單聲道：1 channel, Mono 雙聲道：2 channels, Stereo 5聲道：5 channels
音頻比特率 (單位：Kbps)	每秒鐘的音頻流的數據量，其大小是直接取決於：音頻編碼格式（壓縮率），採樣率，位深度，聲道數乘積	48Kbps, 96Kbps, 128Kbps，256Kbps
音頻容器	文件後綴，將音頻流封裝的一種文件格式	.mp3; .wma; .aac; .3gp; .mp4; .flac ; .ape;.pcm; .raw; .mid; .ogg; .wav; .mkv; .m4a

我們碰到的任何音頻文件，都是數據的集合，
一般數據越大，其音頻播放質量越好。

準備階段

確保mediainfo.exe 命令行工具已經加入環境變量，查看其具體功能方法。
以下是某個音頻文件的mediainfo信息, 都是文本，Python處理起來肯定很簡單的。
如果要進行批量重命名音頻，我們還是用輸入輸出文件架構，如下：


	+---Input_Audio   #批量放入待命名的音頻
	|       1.mp3
	|       青藏高原.wma
	|       
	+---Output_Video   #批量輸出已命名的音頻
	|       Mpeg3L1_44.1KHz_stereo_128Kbps_mp3.mp3
	|		WMA_44.1Khz_stereo_96Kbps_wma.wma
	|
    \audio_info.py   # 獲取音頻文件info信息的模塊，
	\rename_audio.py  #調用audio_info.py並實現重名，可雙擊運行

定義audio_info.py模塊

由於涉及較複雜的代碼，建議直接用面向對象類的編程方式實現：

# coding=utf-8

import os
import re
import subprocess


class AudioInfoGetter():
    '''獲取音頻文件的codec, sample_rate, channels, bitrate'''

    def __init__(self, audio_file):
        '''判斷文件是否存在，如果存在獲取其mediainfo信息'''
        if os.path.exists(audio_file):
            self.audio_file = audio_file
            p_obj = subprocess.Popen('mediainfo "%s"' % self.audio_file, shell=True, stdout=subprocess.PIPE,
                                     stderr=subprocess.PIPE)
            self.info = p_obj.stdout.read().decode("utf-8")  # 解決非英文字符的編碼問題
        else:
            raise FileNotFoundError("Not this File!")  # 如果多媒體文件路徑不存在，必須中斷

    def get_audio_codec(self):
        '''獲取音頻的編碼格式，比如Mepg3L1就是我們常說的Mp3， 還有AAC系列，AMR系列，Flac等等'''
        try:
            audio_codec = re.findall(r"Format\s+:\s(.*)", self.info)[-1]  # 取第最後一個Format字段
            audio_codec = audio_codec.strip()  # 去除前後的空格
            if (audio_codec == "MPEG Audio"):
                audio_codec = self.__format_mpeg_audio()
            elif (audio_codec == "AMR"):
                audio_codec = self.__format_amr_audio()
            elif (audio_codec == "AAC"):
                audio_codec = self.__format_aac_audio()
            elif ("PCM" in audio_codec):
                audio_codec = "PCM"
            else:
                pass
        except:
            audio_codec = "undef"  # 防止程序因爲異常而中斷
        return audio_codec

    def get_audio_channel(self):
        '''獲取聲道數，如果是雙聲道是stereo, 如果是單聲道是mono,還存在5聲道的情況'''
        try:
            audio_channel = re.findall(r"Channel\(s\)\s+:\s(.*)\schannel.*", self.info)[-1]
            audio_channel = audio_channel.strip()  # 過濾掉前後空格
            if audio_channel == "2":
                audio_channel = "stereo"
            elif audio_channel == "1":
                audio_channel = "mono"
            elif audio_channel == "5":
                audio_channel = "5-channels"
            else:
                audio_channel = "undef"  # 設置爲undef，表示特殊異常規格，建議人工驗證並考慮手動重命名
        except:
            audio_channel = "undef"  # 防止程序因爲異常而中斷
        return audio_channel

    def get_audio_sample_rate(self):
        '''獲取音頻採樣率，比如常見的48Khz, 44.1Khz等'''
        try:
            audio_sample_rate = re.findall(r"Sampling rate\s+:\s(.*)", self.info)[-1].strip()
            audio_sample_rate = audio_sample_rate.replace(" ", "")  # 去1 536 這個數字裏的空格
            if "K" not in audio_sample_rate:
                audio_sample_rate = audio_sample_rate.replace("Hz", "")  # 先去掉“Hz"
                audio_sample_rate = str(int(int(audio_sample_rate) / 1000))
                audio_sample_rate = audio_sample_rate + "Khz"  # 再添上KHz的單位
            elif audio_sample_rate.endswith(".0Khz"):
                audio_sample_rate = audio_sample_rate.replace(".0", "")
            elif "/" in audio_sample_rate:  # 偶爾會有多個採樣率的情況 48.0 Khz / 44.1 KHz 這種
                audio_sample_rate = "undef"  # # 設置爲undef，表示特殊異常規格，建議人工驗證並考慮手動重命名
            else:
                pass
        except:
            audio_sample_rate = "undef"  # 防止程序因爲異常而中斷
        return audio_sample_rate

    def get_audio_bitrate(self):
        '''獲取音頻比特率，比如96Kbps, 128Kbps'''
        try:
            audio_bitrate = re.findall(r"Bit rate\s+:\s(.*)", self.info)[-1].strip()
            audio_bitrate = audio_bitrate.replace(" ", "")  # 去掉1 536 這個數字裏的空格
            if "K" not in audio_bitrate:
                audio_bitrate = audio_bitrate.replace("bps", "")  # 先去掉“bps"
                audio_bitrate = str(int(audio_bitrate) / 1000)
                audio_bitrate = audio_bitrate + "Kbps"  # 再添上KHz的單位
        except:
            audio_bitrate = "undef"  # 防止程序因爲異常而中斷
        return audio_bitrate

    def get_audio_container(self):
        '''獲取音頻容器，即文件後綴名'''
        _, audio_container = os.path.splitext(self.audio_file)
        if not audio_container:
            raise NameError("This file no extension")
        audio_container = audio_container.replace(".", "")
        return audio_container

    def __format_mpeg_audio(self):
        '''如果是Mpeg Auido的音頻格式（常見的比如Mp3(Mpeg1 Level3))，進行格式化'''
        try:
            mpeg_audio_version = re.findall(r"Format version\s+:\sVersion\s(.*)", self.info)[-1].strip()
            mpeg_audio_profile = re.findall(r"Format profile\s+:\sLayer\s(.*)", self.info)[-1].strip()
            mpeg_audio_profile = "Mpeg%sL%s" % (mpeg_audio_version, mpeg_audio_profile)
        except:
            mpeg_audio_profile = "undef"
        return mpeg_audio_profile

    def __format_amr_audio(self):
        '''如果是amr的音頻格式（常見的比如amr-nb amr-wb)，進行格式化'''
        try:
            amr_profile = re.findall(r"Format profile\s+:\s(.*)", self.info)[-1].strip()
            if amr_profile == "Wide band":
                amr_profile = "AMR-WB"
            elif amr_profile == "Narrow band":
                amr_profile = "AMR-NB"
            else:
                amr_profile = "undef"  # 設置爲undef，表示特殊異常規格，建議人工驗證並考慮手動重命名
        except:
            amr_profile = "undef"
        return amr_profile

    def __format_aac_audio(self):
        '''如果是acc的音頻格式（常見的比如AAC-LC, AAC-LTP, HE-AAC, HE-AACV2)，進行格式化'''
        try:
            amr_profile = re.findall(r"Format profile\s+:\s(.*)", self.info)[-1].strip()
            if amr_profile == "LC":
                aac_profile = "AAC-LC"
            elif amr_profile == "LTP":
                aac_profile = "AAC-LTP"
            elif amr_profile.startswith("HE-AACv2"):
                aac_profile = "HE-AACV2"
            elif amr_profile.startswith("HE-AAC"):
                aac_profile = "HE-AAC"
            else:
                aac_profile = "undef"  # 設置爲undef，表示特殊異常規格，建議人工驗證並考慮手動重命名
        except:
            aac_profile = "undef"
        return aac_profile


if __name__ == '__main__':
    # 以下代碼塊，只是用來測試本模塊的，一般不建議直接在這裏大面積調用本模塊'''
    a_obj = AudioInfoGetter("C:\\好聽的歌曲.wma")
    audio_codec = a_obj.get_audio_codec()
    print(audio_codec)

調用audio_info.py模塊並實現批量重命名

# coding=utf-8

import os
import audio_info
from shutil import copyfile

curdir = os.getcwd()

# 輸入文件夾，放入待重命名的音頻
input_audio_path = os.path.join(curdir, "Input_Audio")
filelist = os.listdir(input_audio_path) #獲取文件列表

# 輸出文件夾，已命名的視頻存放在這裏
output_audio_path = os.path.join(curdir, "Output_Audio")

# 如果沒有Output_Audio這個文件夾，則創建這個文件夾
if not os.path.exists(output_audio_path):
    os.mkdir(output_audio_path)


if filelist:  # 如果文件列表不爲空
    for i in filelist:  # 變量文件列表
        audio_file = os.path.join(input_audio_path, i)
        a_obj = audio_info.AudioInfoGetter(audio_file)
        audio_codec = a_obj.get_audio_codec()
        audio_sample_rate = a_obj.get_audio_sample_rate()
        audio_channel = a_obj.get_audio_channel()
        audio_bitrate = a_obj.get_audio_bitrate()
        audio_container = a_obj.get_audio_container()
        new_audio_name = audio_codec + "_" + audio_sample_rate + "_" + audio_channel + "_" \
                         + audio_bitrate + "_" + audio_container + "." + audio_container
        print(new_audio_name)
        new_audio_file = os.path.join(output_audio_path, new_audio_name)
        copyfile(audio_file, new_audio_file)  # 複製文件
else:
    print("It's a Empty folder, please input the audio files which need to be renamed firstly!!!")
os.system("pause")

本案例練手素材下載

包含：mediainfo.exe(更建議丟到某個環境變量裏去），
各種編碼格式的音頻文件，audio_info.py模塊，rename_audio.py批處理腳本
調轉自拍教程官網下載
運行效果如下：

以上可以看出，輸入輸出文件架構的好處，
我只需要將不同名字不同字符的，待重命名的音頻文件整理好，
丟到Input_Audio文件夾下，運行程序腳本後查看Output_Audio輸出文件，
就可以測試腳本的運行是否正常，健壯性（容錯）是否符合要求，
從而對這個程序腳本實現了“灰盒測試”。

小提示: 比如Android手機，Google推出了CDD(Compatibiltiy Definition Document兼容性定義文檔)，
其第5部分，涉及了很多音頻編解碼格式的規定：

這就是Android最主要的音頻多媒體編解碼測試需求。

更多更好的原創文章，請訪問官方網站：www.zipython.com
自拍教程（自動化測試Python教程，武散人編著）
原文鏈接：https://www.zipython.com/#/detail?id=2c26d313cea54e8ab9ab3ecb612b986c
也可關注“武散人”微信訂閱號，隨時接受文章推送。

《自拍教程69》Python 批量重命名音頻文件，AV專家必備！

音頻編解碼基本知識

準備階段

定義audio_info.py模塊

調用audio_info.py模塊並實現批量重命名

本案例練手素材下載

《自拍教程72》Python批量重命名視頻文件，AV專家必備！

《自拍教程73》Python 自動生成相冊文件夾

《自拍教程71》Python mediainfo批量重命名圖片文件 AV專家必備！

《自拍教程53》Python adb運行tcpdump工具

《自拍教程34》段位一 Python批處理腳本

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結