Python 去掉換行符

目錄

 

背景

代碼

缺點


背景

瞎寫一篇。最近因爲寫論文,常看外文的文獻,而我這飄過6級的水平想高效率讀懂一篇文獻甚至文獻摘要都實在是喫力。然後就是從PDF上copy過來,貼到谷歌翻譯上直接看中文。但是多數情況下,直接Copy過來的會是下面這個樣子:

 

代碼

每次手動刪換行符實在是累,然後就Python寫了個極簡陋的把文本中換行符換成空格的方法,直接貼代碼了:

# -*- coding: utf-8 -*-
"""
Created on Wed Mar 27 09:36:02 2019

@author: X
"""

# import re
# import csv

with open('deex.txt','r',encoding='UTF-8') as f:
    test = f.read()
for k in test:
    result = test.replace('\n',' ')

with open('dex_x.txt','w',encoding='UTF-8') as f:
    f.write(result)

在用的時候要先把你要翻譯的段落複製到 deex.txt 文件裏面,然後把這個Python3的文件保存成 .py 格式,雙擊這個 .py 就可以了。它會把去掉換行符後的內容寫到 dex_x.txt 裏面。

效果:

缺點

    用了一段時間,發現主要有以下缺點:

(1)不能分段,如果多個自然段複製過來,轉換之後是一個自然段文字。

(2)假如換行符前面有標點符號,則依然會換成空格。

(3)點擊操作太複雜:Ctrl+C -> Ctrl+V -> Save -> 雙擊 xxx.py -> 打開 dex_x.txt

歡迎大家修改,完善。

恰好看到原力計劃內測,並不是混稿子的(手動滑稽)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章