如何用python自動編寫《赤壁賦》word文檔

前言

蘇東坡,千古奇才,大家都喜歡他。叔叔也非常喜歡他,畢竟東坡肉外酥裏嫩,肥而不膩,堪稱人間極品。
來一句坡哥的詩!

大江東去,浪淘盡,千古風流人物

再來!

但願人長久,千里共嬋娟

作爲一枚土生土長的海南人,關於海南的詩走起!

我本海南民,寄生西蜀州。忽然跨海去,譬如事遠遊。

坡哥62歲被貶海南儋州,當時的海南還是蠻荒之地,在宋朝這是比滿門抄斬僅輕一等的處罰。
一般人花甲之年遇到這樣的事,已經絕望了,但是坡哥不一樣,到了海南還是樂觀詩意地生活,該喫喫,該喝喝,繼續吟詩作樂。
不僅如此,坡哥還在海南辦起了學堂,自編講義,自講詩書,培養出了海南第一個進士姜唐佐。並且坡哥北歸後,他的弟子連續不斷的考上了功名,“蠻荒之地”慢慢綻放出了文化的曙光!
坡哥詩、詞、文、書、畫,無一不精,有才華也就算了,還有這樣積極向上、隨遇而安的硬核心態,值得我們每個人學習!

不過比起坡哥,叔叔更喜歡王維,爲什麼捏?

  1. 大帥哥。迷倒大唐公主。
  2. 專一。這樣一個大帥哥,在妻子過世後沒有再娶。
  3. 有才華。長得帥專一也就算了,居然寫詩、繪畫、音樂、書法各種會,妥妥的頂級文藝青年。
    這樣一個帥氣專一有才的人,試問誰不喜歡呢?

先跑個題,我們來看看王維關於愛情的名句

紅豆生南國,春來發幾枝。願君多采擷,此物最相思。

沒錯了,是心動的感覺!我們再來欣賞一句

空山新雨後,天氣晚來秋。

再再來一句

大漠孤煙直,長河落日圓

臥槽!牛逼!

然而蘇東坡雖然是千古奇才,也有過“十年生死兩茫茫,不思量,自難忘”這樣的惦念亡妻的名句,但系吧,寫完之後繼續娶妻納妾。

回到正題,下面我們用程序來自動創建蘇總的《赤壁賦》word文檔,並演示提取文字,學會這幾招,以後各種自動化處理word文檔如有神助~

安裝-python-docx

我們需要用到一個python強大的庫:python-dox

我們來安裝一下

pip instal python-docx

注意:不是安裝的docx

簡單介紹下原理:pyhton-docx包創建的文檔是一個Document對象,然後會在文檔上添加各種對象:如段落、行內元素、表格、內容等,文檔層級結構類似下面這樣

文檔-Document
—段落Paragraph
——行內元素Runs
———內容text
———字體font
———顏色color
———字號size
—內容text
—表格tables
——單元格cell
——段落Paragraph

一、自動編寫《赤壁賦》

準備數據

name = "赤壁賦"
author = "蘇軾"
dynasty = "宋"
paragraphs = [
    '''壬戌之秋,七月既望,蘇子與客泛舟遊於赤壁之下。清風徐來,水波不興。舉酒屬客,誦明月之詩,歌窈窕之章。少焉,月出於東山之上,徘徊於斗牛之間。白露橫江,水光接天。縱一葦之所如,凌萬頃之茫然。浩浩乎如馮虛御風,而不知其所止;飄飄乎如遺世獨立,羽化而登仙。''',
    '''於是飲酒樂甚,扣舷而歌之。歌曰:“桂棹兮蘭槳,擊空明兮溯流光。渺渺兮於懷,望美人兮天一方。”客有吹洞簫者,倚歌而和之,其聲嗚嗚然:如怨如慕,如泣如訴;餘音嫋嫋,不絕如縷;舞幽壑之潛蛟,泣孤舟之嫠婦蘇子愀然,正襟危坐,而問客曰:“何爲其然也?”客曰:“月明星稀,烏鵲南飛,此非曹孟德之詩乎?西望夏口,東望武昌。山川相繆,鬱乎蒼蒼;此非孟德之困於周郎者乎?方其破荊州,下江陵,順流而東也,舳艫千里,旌旗蔽空,釃酒臨江,橫槊賦詩;固一世之雄也,而今安在哉?況吾與子漁樵於江渚之上,侶魚蝦而友糜鹿,駕一葉之扁舟,舉匏樽以相屬;寄蜉蝣與天地,渺滄海之一粟。哀吾生之須臾,羨長江之無窮;挾飛仙以遨遊,抱明月而長終;知不可乎驟得,託遺響於悲風。”''',
    '''蘇子曰:“客亦知夫水與月乎?逝者如斯,而未嘗往也;盈虛者如彼,而卒莫消長也。蓋將自其變者而觀之,而天地曾不能一瞬;自其不變者而觀之,則物於我皆無盡也。而又何羨乎?且夫天地之間,物各有主。苟非吾之所有,雖一毫而莫取。惟江上之清風,與山間之明月,耳得之而爲聲,目遇之而成色。取之無禁,用之不竭。是造物者之無盡藏也,而吾與子之所共適。”''',
    '''客喜而笑,洗盞更酌,餚核既盡,杯盤狼藉。相與枕藉乎舟中,不知東方之既白。'''
]

新建文檔

document = Document()
document.styles['Normal'].font.name = u'微軟雅黑'
document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'微軟雅黑')

字裏設置了一下字體

添加標題

heading1 = document.add_heading(name, 0)
heading1.alignment = WD_ALIGN_PARAGRAPH.CENTER

這裏設置成了居中

添加作者

p = document.add_paragraph("【作者】")
p.alignment = WD_ALIGN_PARAGRAPH.CENTER
run = p.add_run(author)
run.italic = True
run.bold = True

字體居中斜體加粗

添加朝代

p.add_run(" 【朝代】")
run = p.add_run(dynasty)
run.italic = True
run.bold = True

字體也是居中斜體加粗

添加圖片

document.add_picture('test.jpeg', width=Inches(2))
last_paragraph = document.paragraphs[-1]
last_paragraph.alignment = WD_ALIGN_PARAGRAPH.CENTER

爲了讓效果更美觀一點,我們整張圖片潤色一下,圖片是這樣的

添加段落

for paragraph in paragraphs:
    p = document.add_paragraph(paragraph) # 創建段落對象
    p.paragraph_format.first_line_indent = Inches(0.25)

設置了下首行縮進

保存word文檔

document.save(''/Users/chenqionghe/Downloads/赤壁賦.docx'')

大功告成,運行一下

python create-poems.py

看到生成了一個赤壁賦.docx,如下

打開如下

天吶!這也太棒棒了吧~~

下面貼出全部代碼

from docx import Document
from docx.shared import Inches
from docx.enum.text import WD_ALIGN_PARAGRAPH
from docx.oxml.ns import qn

titleName = "赤壁賦"
author = "蘇軾"
time = "宋"
paragraphs = [
    '''壬戌之秋,七月既望,蘇子與客泛舟遊於赤壁之下。清風徐來,水波不興。舉酒屬客,誦明月之詩,歌窈窕之章。少焉,月出於東山之上,徘徊於斗牛之間。白露橫江,水光接天。縱一葦之所如,凌萬頃之茫然。浩浩乎如馮虛御風,而不知其所止;飄飄乎如遺世獨立,羽化而登仙。''',
    '''於是飲酒樂甚,扣舷而歌之。歌曰:“桂棹兮蘭槳,擊空明兮溯流光。渺渺兮於懷,望美人兮天一方。”客有吹洞簫者,倚歌而和之,其聲嗚嗚然:如怨如慕,如泣如訴;餘音嫋嫋,不絕如縷;舞幽壑之潛蛟,泣孤舟之嫠婦蘇子愀然,正襟危坐,而問客曰:“何爲其然也?”客曰:“月明星稀,烏鵲南飛,此非曹孟德之詩乎?西望夏口,東望武昌。山川相繆,鬱乎蒼蒼;此非孟德之困於周郎者乎?方其破荊州,下江陵,順流而東也,舳艫千里,旌旗蔽空,釃酒臨江,橫槊賦詩;固一世之雄也,而今安在哉?況吾與子漁樵於江渚之上,侶魚蝦而友糜鹿,駕一葉之扁舟,舉匏樽以相屬;寄蜉蝣與天地,渺滄海之一粟。哀吾生之須臾,羨長江之無窮;挾飛仙以遨遊,抱明月而長終;知不可乎驟得,託遺響於悲風。”''',
    '''蘇子曰:“客亦知夫水與月乎?逝者如斯,而未嘗往也;盈虛者如彼,而卒莫消長也。蓋將自其變者而觀之,而天地曾不能一瞬;自其不變者而觀之,則物於我皆無盡也。而又何羨乎?且夫天地之間,物各有主。苟非吾之所有,雖一毫而莫取。惟江上之清風,與山間之明月,耳得之而爲聲,目遇之而成色。取之無禁,用之不竭。是造物者之無盡藏也,而吾與子之所共適。”''',
    '''客喜而笑,洗盞更酌,餚核既盡,杯盤狼藉。相與枕藉乎舟中,不知東方之既白。'''
]

# 新建文檔
document = Document()
document.styles['Normal'].font.name = u'微軟雅黑'
document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'微軟雅黑')
heading1 = document.add_heading('赤壁賦', 0)
heading1.alignment = WD_ALIGN_PARAGRAPH.CENTER

# 添加作者(居中斜體加粗)
p = document.add_paragraph("【作者】")
p.alignment = WD_ALIGN_PARAGRAPH.CENTER
run = p.add_run(author)
run.italic = True
run.bold = True
# 添加朝代(居中斜體加粗)
p.add_run(" 【朝代】")
run = p.add_run(time)
run.italic = True
run.bold = True

# 添加圖片(居中)
document.add_picture('test.jpeg', width=Inches(2))
last_paragraph = document.paragraphs[-1]
last_paragraph.alignment = WD_ALIGN_PARAGRAPH.CENTER

# 寫下文章(首行縮進)
for paragraph in paragraphs:
    p = document.add_paragraph(paragraph) # 創建段落對象
    p.paragraph_format.first_line_indent = Inches(0.25)

document.save(''/Users/chenqionghe/Downloads/赤壁賦.docx')

二、自動提取《赤壁賦》的文字

既然可以自動編寫word文檔,我們也可以自動提取word文檔。
比如有人給你發了500個文檔,你只是想快速根據文字瞭解一下內容,又不想一個一個打開,這時候就可以用程序自動提取文本啦~

下面演示一下把剛剛生成的文檔內容全部弄出來

from docx import Document

# 指定文檔路徑
docFile = '/Users/chenqionghe/Downloads/赤壁賦.docx'
# 打開文檔爲Document對象
document = Document(docFile)
# 遍歷所有的段落保存到text數組
text = []
for para in document.paragraphs:
    text.append(para.text)
# 打印最終結果
print('\n'.join(text))

我們來運行一下,結果如下

哦豁,我們並沒有打開介過word文檔,但系已經愉快地把詞弄出來遼~

以上內容由chenqionghe提供,是不是超級簡單呀~
有了這兩招,以後想寫用程序寫啥都可以提示準備好,比如自動生成500首唐詩,又比如一個不打開一堆word文檔就把所有的內容提取出來合併成一個文件,
又比自動寫作文或自動提取答案啥的,簡直不要太嗨~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章