python批量將excel內容進行翻譯,寫入

python批量將excel內容進行翻譯,寫入

由於小編初來乍到,有很多地方不是很到位,還請見諒,但是很實用的哦!
1.首先是需要進行文件的讀寫操作,需要獲取文件路徑,方式使用os.listdir(路徑)進行批量查找文件。

file_path =/home/xx/xx/xx’
# ret 返回一個列表
ret = list_dir = os.listdir(file_path)
# 遍歷列表,獲取需要的結尾文件(只考慮獲取文件,不考慮執行效率)
for i in ret :
        if i.endswith('xlsx'):
       	# 執行的邏輯

2.改寫一下我調用的翻譯接口

def baidu_translate(appi, secretKe, content):
    appid = appi
    secretKey = secretKe
    httpClient = None
    myurl = '/api/trans/vip/translate'
    q = content
    fromLang = 'zh'  # 源語言
    toLang = 'en'  # 翻譯後的語言
    salt = random.randint(32768, 65536)
    sign = appid + q + str(salt) + secretKey
    sign = hashlib.md5(sign.encode()).hexdigest()
    myurl = myurl + '?appid=' + appid + '&q=' + urllib.parse.quote(
        q) + '&from=' + fromLang + '&to=' + toLang + '&salt=' + str(
        salt) + '&sign=' + sign
    try:
        httpClient = http.client.HTTPConnection('api.baidu_translation.baidu.com')
        httpClient.request('GET', myurl)
        response = httpClient.getresponse()
        jsonResponse = response.read().decode("utf-8")  # 獲得返回的結果,結果爲json格式
        js = json.loads(jsonResponse)  # 將json格式的結果轉換字典結構
        dst = str(js["trans_result"][0]["dst"])  # 取得翻譯後的文本結果
        print(dst)  # 打印結果
        return dst
    except Exception as e:
        print(e)
    finally:
        if httpClient:
            httpClient.close()

3.現在需要進行讀取excel的內容,使用方法,xlrd,小編使用的翻譯是借用的百度翻譯的API,獲取excel內容,傳遞給API

import hashlib
import http.client
import json
import os
import random
import time
import urllib

import openpyxl
import xlrd
# 借用上邊所述的文件路徑操作
# appid :翻譯API提供,需要註冊獲取
# secretKey :翻譯API提供,需要註冊獲取
def read_excel(file_path, appid, secretKey):
    list_dir = os.listdir(file_path)
    for i in list_dir:
        if i.endswith('.xlsx'):
        	# 拼接獲取絕對路徑
            file_path = file_path + '\\' + i
            rbook = xlrd.open_workbook(filename=file_path)
            rbook.sheets()
            # 獲取excel某頁數據
            sheet1 = rbook.sheet_by_index(0)
            row_num = sheet1.nrows
            for num in range(row_num):
                try:
                	# 小編這樣寫的原因是我值獲取指定列的數據,
                	# 例如現在獲取第3,4列數據
                    txt1 = sheet1.cell_value(num, 3)
                    txt2 = sheet1.cell_value(num, 4)
                    # 爲了2列數據可以同時進行翻譯
                    txt = txt1 + '=' + txt2
                    # ret返回翻譯結果
                    ret = baidu_translate(appid, secretKey, txt)				
                    
                    # 防止調用接口出錯
                    time.sleep(1)
                    # 將翻譯結果在寫如excel
                    write_excel(ret, num, file_path)
                except Exception as e:
                    print(e)
                    continue

4.因爲上一步調用了這個寫入excel的函數,所有我們需要寫一個函數來完成寫入的操作。

def write_excel(ret, num, file_path):
    f_txt = file_path
    book = openpyxl.load_workbook(f_txt)
    sheet1 = book.worksheets[0]
    # 在這個地方是獲取某列寫入
    txtE = 'F' + str(num + 1)
    txtF = 'G' + str(num + 1)
    s_txt = ret.split('=')
    sheet1[txtE] = s_txt[0]
    sheet1[txtF] = s_txt[1]
    book.save(f_txt)
    
if __name__ == '__main__':
    appid = 'xxxx'
    secretKey = 'xxxx'
    path = r'xxx'
    read_excel(path, appid, secretKey)
根據自己的需求在進行修改就可以了,如果出現什麼錯誤還請多多指教!!
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章