doc2vec

NLP筆記 - Word Embedding // doc2vec 之 延禧攻略

學習參考網站

語料庫

下載鏈接:https://pan.baidu.com/s/1Av1q-Y_JbSkZsG4RGVo8Rg
提取碼:d10r
結構圖
|-nlp //新建文件夾
|- doc2vec.py //新建python文件
|- data //新建文件夾
|- yxgltext.txt //下載語料數據放在data文件夾目錄下
|- model //新建文件夾

乾隆六年二月初二,魏瓔珞隨其他待選宮女一道入宮。在從等候殿選的一衆秀女面前經過時,其中一名待選宮女吉祥不小心打翻了水桶,弄髒了秀女烏雅青黛的衣裙。烏雅氏勃然大怒,要重罰吉祥時,瓔珞挺身而出,巧用香粉替烏雅氏的蓮花鞋底添彩,救下吉祥。皇上、皇后和高貴妃三人一道主持殿選。高貴妃對皇后言語不敬,十分僭越,皇后卻渾不在意。隨即,她見皇上眼中只有皇后,對皇后愈加嫉恨。殿選時,高貴妃附和着皇上對衆秀女一起評頭論足。輪到烏雅氏時,她的步步生蓮引起了衆人的注意。就在她得意萬分時,皇上震怒,以妖媚惑主爲由命人將她叉出宮去,甚至將她的家人一併問罪,讓等候的秀女們一陣心驚肉跳。隨即,皇上興致缺缺,在將與烏雅氏一道入宮的納蘭淳雪留用後,匆匆離開。高貴妃也隨之告退,留皇后一人在此主持殿選。與此同時,待選宮女們正被考覈繡工。吉祥因之前被烏雅氏懲罰而傷了手,不小心讓繡繃沾上了血。她向交好的玲瓏求助,卻被玲瓏婉拒。走投無路之時,瓔珞又一次對她伸出援手,將自己未繡完圖樣換給了吉祥,助她渡過難關,兩人也因此結交。
魏瓔珞和其他宮女一起入住宮女所,玲瓏、錦繡等人因她受了吳總管的誇獎而嫉妒,故意生事,瓔珞毫不畏懼,四兩撥千斤,強硬地給了衆人一個教訓,成功立威。隨後,躺在牀榻上的魏瓔珞輾轉難眠,腦子裏全是將自己一手帶大的親姐姐瓔寧躺在棺材中的樣子。事實上,她不顧家人阻攔執意進宮,就是爲了追查曾在宮裏當值的姐姐真正的死因。愉貴人稱病躲避侍寢,交好的怡嬪幫她百般遮掩,被高貴妃看出破綻,帶着太醫趕到愉貴人居住的永和宮,不僅讓太醫幫愉貴人診脈,還特賜了枇杷膏給她治咳疾。怡嬪認定枇杷膏有毒,向皇后告發,可卻沒有驗出毒物反應來。高貴妃見狀一口咬定怡嬪以下犯上,下令重罰。瓔珞等人在幹活的時候,宮女所方姑姑帶人查找她們是否帶了違禁物。她從瓔珞的包袱裏翻出一隻古怪瓷瓶後,責怪瓔珞夾帶宮外物品入宮,瓔珞謊稱思鄉土,避開了方姑姑的懷疑。 隨後,瓔珞向繡坊張嬤嬤打聽姐姐瓔寧,被張嬤嬤一頓斥責,心中深感失望。
瓔珞衝到御花園踢打靈柏泄憤,恰被皇上看到,大發雷霆,要嚴懲傷害靈柏的瓔珞,瓔珞巧言辯解,矇混過關。皇上去給太后請安,太后責他過於寵幸皇后,忽略了其他妃嬪。弘曆不想聽太后嘮叨,藉口離開。在經過御花園靈柏時,皇上回過神來,知道自己是被瓔珞忽悠了,於是命太監總管李玉把瓔珞找出來,然後去長春宮探望皇后。彼時,皇后正因明玉將愉貴人拒之門外一事大發雷霆。見皇上過來了,皇后強抑怒火與皇上說話,皇上看出皇后的疏離之情,有些遺憾地離開了長春宮。皇上聽聞高貴妃爲難愉貴人一事,賜儲秀宮金剛經,命高貴妃抄完一遍佛經,修身養性,高貴妃氣惱萬分。乾清門侍衛慶錫看到瓔珞成爲了宮女,十分震驚。他拉着瓔珞去了一處雜物房說話,要求瓔珞別再追查瓔寧之死,被瓔珞一口回絕。二人碰面一事被玲瓏看到,玲瓏向方姑姑告密,方姑姑試圖捉姦,瓔珞覺察到她的用意,憑藉自己的機智化險爲夷,並趁機教訓了總愛找事的方姑姑一頓。方姑姑傷了腰,一瘸一拐地離開,瓔珞看到她落下的絡子正是她當年親手送給姐姐的,對方姑姑起了疑心。
瓔珞及時趕來阻止錦繡繼續在傅恆面前出醜,錦繡不滿瓔珞破壞自己攀高枝的計劃,對瓔珞懷恨在心,氣咻咻離開。隨後,瓔珞被傅恆所攔,告誡她不要小看宮裏的男子,瓔珞敷衍了他一番後匆匆離開。傅恆去長春宮探望皇后,見皇后因思念已逝的兒子永璉而茶飯不思神情恍惚,又生氣又心疼,與她發生了爭執,提醒她不要忘了自己皇后的身份,皇后惱恨,衝傅恆發了好大一通火氣。兩人不歡而散,傅恆臨走前給皇后留下一隻木匣,叮囑她一定要看,皇后恍若未聞。離開長春宮後,傅恆路遇純妃,他跪請純妃幫忙,以相助皇后重新振作,純妃答應。隨後,純妃去長春宮拜見皇后,借皇后身邊伺候的宮女紅螺到歲數離宮卻因皇后近來精神不濟而無人回稟被耽擱一事提醒皇后,皇后恍然大悟。純妃走後,皇后打開木匣,發現乾隆元年皇上立永璉爲儲君的詔書,方知自己一直都誤會了他,決心重新振作起來,擔負起六宮之主的責任。次日,妃嬪來向皇后請安,高貴妃以爲皇后又抱恙缺席,將與皇后交好的純妃挑剔了一番後剛準備離開,皇后出現,斥責了高貴妃。隨即,她又安撫了愉貴人。
貴妃百般試探無果,以爲瓔珞當真是個傻子,無奈放人。貴妃身邊的嘉嬪卻覺得瓔珞並非真傻,對她存了一絲戒備之心。宮女所裏,見瓔珞久久未歸,吉祥十分擔心,錦繡卻造謠瓔珞是跟人私會去了,吉祥氣急,跟她爭執了起來。這時,瓔珞回來,若有所思地看了衆人一眼,不發一言的徑直躺下休息。次日,瓔珞找上玲瓏,指出是她向高貴妃告的密,玲瓏一口否認,被瓔珞狠狠教訓一頓,內心更加嫉恨。收拾完玲瓏後,瓔珞去找方姑姑,想看看能不能從她那裏查到關於姐姐死因的蛛絲馬跡,誰知卻一無所獲。因爲錦繡造謠瓔珞與乾清門侍衛有染,謠言越來越旺盛,甚至張嬤嬤都找上了瓔珞詢問情況,瓔珞否認後,決心將計就計,徹底從根源杜絕謠言。於是她故意深夜出門被錦繡發現,錦繡告訴了方姑姑,方姑姑因跟瓔珞接二連三的過節對她恨之入骨,因此囑咐錦繡盯緊瓔珞,有消息及時彙報。隨後,錦繡發現瓔珞與侍衛慶錫私相授受,沒過多久,錦繡發現瓔珞不僅聞到魚腥就噁心嘔吐,甚至腰身都粗了一圈。
整理姐姐遺物的時候,瓔珞發現了一枚陌生的玉佩,上面還刻着滿文。瓔珞去找張嬤嬤,經過一番軟磨硬泡後,瓔珞終於從張嬤嬤口中問出當年發生的事,更知道玉佩的所有者竟是皇后的親弟弟富察傅恆。面對張嬤嬤的勸說,瓔珞決心不管是誰,一定要追查到底,還姐姐一個公道。舒貴人納蘭淳雪爲吸引皇上注意,特意在御花園唱歌,誰料反倒惹得皇上動怒,被罰在御花園唱一夜,頓時心灰意冷。與此同時,純妃裝病避寵,被弘曆看破卻不說破,遂了她的心意後離開她的寢宮,轉道長春宮探望皇后。提及純妃,皇后勸皇上多多擔待。隨即,皇后提起宮中奢靡浪費之風,皇上不置可否。明玉暗中提醒皇后要再生一位嫡子,穩固中宮之位,皇后表面斥責,內心深以爲然。然皇上雖與皇后同牀共枕,卻沒有旁的心思,皇后十分失望。眼看皇后千秋將至,各處都要爲皇后獻上壽禮,繡坊也不例外。張嬤嬤選定瓔珞作爲繡者,受到玲瓏嫉妒。隨後,玲瓏設計調走看守孔雀羽線的吉祥,趁機盜走爲皇后壽禮繡的鳳袍所專用的孔雀羽線,要令瓔珞出醜。
在皇后身邊的大宮女爾晴的催促下,瓔珞剛準備掀開遮着鳳袍的紅布,這時,皇上派人送了賀禮過來。皇后見了鳳心大悅,瓔珞鬆了一口氣,隨即拿出繡坊送出的鳳袍。這件鳳袍用鹿尾絨毛作線,暗含不忘滿洲舊俗,追憶祖先英靈之意,受到皇后讚賞,從所有壽禮中脫穎而出。千秋壽宴過後,瓔珞跪在長春宮前,將真相和盤托出。皇后十分喜愛瓔珞的機靈,要調她來長春宮伺候,此舉正合瓔珞心意。瓔珞離開繡坊前,決定先找到當初盜取孔雀羽線的人。見皇后下旨徹查孔雀羽線丟失一事,玲瓏十分惶恐。爲了脫罪,她在吉祥生辰這天故意陷害吉祥,藉口給吉祥藏了一份禮物,讓吉祥去找,吉祥不知有詐,開心極了。就在她挖出玲瓏藏的孔雀羽線時,吳總管出現,吉祥被當成盜賊杖斃,瓔珞憤怒至極。瓔珞幹活接連出錯,玲瓏假惺惺地關心讓瓔珞愈加厭惡她。張嬤嬤帶來了給皇上繡常服的工作,玲瓏主動請纓,申請完成皇帝常服的繡制工作,瓔珞不同意,提出要比試分勝負。玲瓏全力以赴,卻因龍目難繡而落敗。
張嬤嬤知道瓔珞要被調去長春宮,十分擔心她因爲自己倔強的脾氣受苦,瓔珞反過來安撫張嬤嬤。瓔珞進了長春宮後,明玉擺出大宮女的架子,對她各種訓誡。恰好傅恆來看皇后,瓔珞趁機露出那枚玉佩引起了傅恆的注意。傅恆向瓔珞討要玉佩,兩人交談時被明玉撞見。明玉素來傾慕傅恆,因此對瓔珞更加深惡痛絕,百般刁難,甚至還唆使長春宮其他宮女疏遠瓔珞。不僅如此,她還在皇后面前百般中傷瓔珞躲懶,皇后對此將信將疑。次日一早,瓔珞識別前晚有月暈,認定將有大雨,提醒明玉照管好皇后心愛的茉莉花,明玉不以爲意,還將瓔珞好一通訓斥,誰知當夜真的天降大雨,瓔珞搶先一步遮擋茉莉,使得花兒免受風雨摧殘,被皇后看在眼裏,對明玉有些失望,明玉心中越發氣悶不平。高貴妃來給皇后請安時,看到瓔珞在院子裏忙碌,想起之前她裝傻充愣糊弄自己,氣不打一處來,讓人割掉她的舌頭泄憤。瓔珞拼命掙扎,驚動了皇后。皇后態度堅決地護着瓔珞,高貴妃碰了一鼻子灰,訕訕離開。隨後,瓔珞將自己與高貴妃的過節告訴皇后,皇后得知瓔珞竟敢戲弄高貴妃,不禁莞爾。
嫺妃堅持原則,一口拒絕母親的請求,遭到母親掌捆,傷心欲絕。皇后身體不適,請張院判來診治,從張院判口中聽聞愉貴人心思深沉,鬱結於心,原本打算親自探望以安她的心,被爾晴拼力勸阻,於是便派明玉帶着人蔘去探望,誰知明玉轉頭就將差事交給了瓔珞。嫺妃泣涕漣漣地給家裏寫家書,純妃突然來訪,向嫺妃進言,讓她去求皇后替常壽求情,想借機拉攏嫺妃,卻被嫺妃嚴詞拒絕,無奈離開。瓔珞去給愉貴人送人蔘時,撞見有小太監要殺她,忙奮力阻止,並衝出去找人求救,不料撞見高貴妃,她忙躲回永和宮,並反鎖了宮門。高貴妃在外面命人撞門,瓔珞在房間裏呼喚昏迷不醒的愉貴人未果後,急中生智,利用屋子裏的炭火盆造成走水的假象,引來傅恆等侍衛,救下愉貴人,破壞了高貴妃的計謀。面對那個殺人的小太監話裏話外都在指證皇后是幕後主使,瓔珞據理力爭,與高貴妃辯駁,高貴妃啞口無言,向皇后道歉。傅恆見瓔珞受傷,特意給她送來傷藥,卻又礙於男女大防格外拘謹,引來瓔珞發笑。隨後,瓔珞故意提起阿滿,傅恆斷然否認相識。瓔珞若有所思。
瓔珞經由永和宮一事深得皇后賞識,得以在皇后身邊伺候,明玉見狀十分嫉恨瓔珞。恰逢皇后令內務府將庫存舊物發往崇文門清倉變賣,得來的銀錢全部捐給善堂,撫養無家可歸的孤兒,瓔珞聽聞明玉抱怨皇后被衆人誤會中飽私囊,不解皇后爲何不辯解,皇后一番言論讓瓔珞恍然大悟,同時也看到了皇后寬廣的胸襟。提起愉貴人的近況,聽聞皇上近來都沒有去探望,皇后感慨難得有情郎,羨慕董鄂妃得到癡情帝王守護,瓔珞卻對順治帝讓三十宮人爲董鄂妃殉葬一事頗有微詞,被皇上無意聽見,要嚴懲瓔珞,皇后爲瓔珞求情,瓔珞又巧言善辯,僥倖逃脫責罰。皇上認出瓔珞是之前踢打靈柏的宮女,認爲瓔珞汲汲營營,品行不佳,提醒皇后小心,皇后卻替瓔珞辯駁,言語間對她頗爲信任。常壽在獄中染病,嫺妃母親再來求援,嫺妃去內務府提前支取銀兩被拒絕後,決定變賣珠寶,籌措銀兩。瓔珞教傅恆用豬脬裝熱水取暖,被海蘭察中途奪走,海蘭察被突然爆開的豬脬燙傷,傅恆懷疑瓔珞別有用心。瓔珞巧妙應對,傅恆消除了懷疑。海蘭察指瓔珞一定暗戀傅恆,傅恆怦然心動,絕不承認。
皇后邀請愉貴人遊園,正好看到嘉嬪和高貴妃也在。愉貴人怕狗,看到高貴妃的寵物犬雪球瑟瑟發抖,想要提前告退,卻被高貴妃攔下說話。嘉嬪趁機向看護雪球的小太監使了個眼色,小太監放出雪球,驚到了愉貴人,瓔珞見狀挺身而出,趕跑雪球,救下愉貴人。回到儲秀宮後,高貴妃氣惱嘉嬪利用自己爲她的兒子謀福利,嘉嬪巧言令色,稱是爲貴妃着想,先行一步除掉愉貴人免除後患。並說用雪球驚嚇愉貴人只是第一步,後招早已埋下。愉貴人受到驚嚇,瓔珞替皇后送珍珠粉去永和宮給她壓驚,發現愉貴人身邊的宮女芳草被嘉嬪收買,用有毒的貝殼粉調換了愉貴人服用的珍珠粉。愉貴人氣急,要找嘉嬪對質,瓔珞勸說她暫且隱忍,準芳草將功折罪,靜待時機好讓嘉嬪人贓並獲,可芳草卻急於戴罪立功,沒有按照瓔珞的吩咐回稟嘉嬪,露出馬腳被嘉嬪察覺。
瓔珞擺脫嘉嬪的人的糾纏後,發現荔枝樹被毀,深知如果不想辦法,自己只有死路一條,還會連累皇后丟了顏面。她果斷趕去永和宮,勸說愉貴人去參加荔枝宴上,並故意引走了雪球。荔枝宴上,皇后藉由千秋節禮物的賞賜,贈金給嫺妃解困,嫺妃十分感動。隨後,愉貴人的出現讓高貴妃和嘉嬪心下不安。很快,鮮荔枝樹被擡到會場,皇后準備親手採摘,打開紅綢,雪球跳出來,現場一片混亂,並再度驚嚇到了愉貴人。面對愉貴人苦苦向自己求救,又看到荔枝樹被“雪球所毀”,再加上純妃等人的意有所指,弘曆震怒。高貴妃因教唆惡犬傷害愉貴人,毀掉福建歲貢,被罰一年宮份。嘉嬪同樣受到牽連,降爲貴人、禁足三月。皇后在聽罷瓔珞將事情真相的回稟後,喜歡瓔珞能言善辯,聰明果斷,決定從此後教她讀書習字,世間道理。海蘭察奉旨處置雪球,瓔珞向海蘭察討要,聲稱要殺之泄憤,海蘭察樂得不用捲入高貴妃的憤怒當中,開心的交給她,被傅恆看到。傅恆責怪海蘭察奸詐,海蘭察卻不以爲意,反而擔心瓔珞下不去手,傅恆看着瓔珞的背影,篤定瓔珞沒有表面看上去那麼簡單。
傅恆發現瓔珞並沒有殺掉雪球,還把它偷偷養了起來,十分驚訝。見事情敗露,瓔珞坦言雪球是無辜的,自己下不去手,所以纔會拿別的狗皮來應付海蘭察。傅恆被瓔珞的善良所打動,答應幫她把雪球送出宮,併爲它找一個靠譜的主人。是夜,面對張嬤嬤的疑問,瓔珞告訴她自己是故意讓傅恆發現的,她所做的一切都是爲了讓傅恆放下戒心。高貴妃被皇上懲罰後,脾氣愈加暴躁,甚至因沒有喝到常喝的茶而大發雷霆。這時,怡親王密報高貴妃,嫺妃之父那爾布爲了替子脫身,不惜向他行賄。高貴妃請怡親王向弘曆透露此事,弘曆大發雷霆,將那爾佈下獄。面對皇上的指控,嫺妃不肯相信,於是皇上特許她前去探監。去了監獄嫺妃才得知那爾布竟真的行賄,大失所望。從監獄出來後,走到神武門前,嫺妃母親匆匆趕到,求嫺妃向皇帝求情救救那爾布,嫺妃因一時惱火拒絕,誰料常壽病故的消息傳來,絕望又憤怒的嫺妃母親撞死神武門,嫺妃震驚痛苦。
怡親王因勢力大不如前,爲了向高貴妃示好,受了嘉貴人指使,特意去找慶錫交好,並許諾事成之後給他提升地位。慶錫爲了得到晉升,同意跟怡親王合作,陷害魏瓔珞。他們先派長春宮的一個小太監偷了瓔珞的一張習字,並着人模仿她的字跡寫了一封邀約的信件交給了慶錫,隨即,慶錫又約瓔珞見面,被瓔珞拒絕後,他用瓔寧的死作誘餌,瓔珞雖然答應赴約,但因慶錫前後態度迥異,暗中留了心眼。與此同時,傅恆發現慶錫和怡親王來往密切,心中生疑,也暗中盯緊了他們。瓔珞依約來到御花園,慶錫一出現,便被瓔珞早已安排好的太監們痛打一頓,這時怡親王趕來,慶錫指證瓔珞勾引乾清門侍衛,怡親王趁機給瓔珞定罪,想要拖去慎刑司,誰料傅恆約弘曆在御花園下棋,聽到爭執後,將他們帶到聖前,請皇上裁決。慶錫言之鑿鑿,並取出情信作爲證據,瓔珞巧妙指出紙張與字跡的異常,引發弘曆大怒,慶錫爲求脫身,只好將怡親王教唆他冤枉瓔珞一事和盤托出,瓔珞平安過關,慶錫卻被杖責後驅逐出宮。
祭祀分肉之時,怡親王的肉中被查出含有鹽巴,皇上勃然大怒,治了他大不敬之罪,革職查辦關進了宗人府。隨後,侍衛們手裏的肉也接受了檢查,但是沒有查出異常,皇上深感欣慰。瓔珞見傅恆沒被捉到,有些意外。祭祀結束後,傅恆叫住瓔珞,瓔珞坦言是自己告發了怡親王,目的就是爲了給他一個教訓,讓他知道不是每次犯錯都能逃過一劫。傅恆百感交集,猶豫再三後,質問瓔珞給自己鹽包意欲何爲。瓔珞承認自己是爲了給姐姐報仇,並逼問傅恆是否殺害姐姐的兇手,傅恆否認,瓔珞不信,爭執中用匕首刺傷了傅恆。皇后因瓔珞告發怡親王一事召見她,準備敲打敲打她,瓔珞卻誤以爲皇后知道自己傷了傅恆要懲罰她,誰料傅恆根本未將受傷一事告知任何人,只是將發現瓔珞告發怡親王一事告知皇后,讓皇后好生管教。皇后責罰瓔珞抄寫一百遍“寬容”二字,明玉對此十分不滿。受皇后所託,瓔珞帶着蔘湯去探望傅恆。傅恆再次向瓔珞發誓自己絕非傷害瓔寧之人,並答應幫助她一同尋找兇手,瓔珞動容。兩人感情有所進展,氣氛曖昧,海蘭察闖進來,瓔珞有些難爲情,匆匆離開。
嘉答應在冷宮被太監欺辱,此時嫺妃來冷宮看望嘉答應,嘉答應惱羞成怒,一邊傾吐自己內心的不滿與委屈,一邊出言嘲諷嫺妃無能,才導致她自己家破人亡。嫺妃想着自己曾經歷的一切,憤而用長巾勒住了嘉答應的脖子。嘉答應臨死之際,嫺妃方纔透露自己早知四阿哥生病的蹊蹺,故意引純妃發現,目的就是爲了名正言順向皇后靠攏。嫺妃將嘉答應僞裝成自盡的樣子後離開冷宮,在雨中慢慢往承乾宮走去,目光變得更加堅定、冷酷,決心今後爲自己而活,放棄愚蠢的正義與原則。瓔珞沒有按照皇后的執意抄寫一百遍“寬容”二字,而是用“忍”字替代。皇后指出她心中並沒有真正認識到自己的錯誤,悉心教導。這時,爾晴來勸說皇后將四阿哥接到長春宮撫養,皇后拒絕,爾晴又苦勸皇后早日生下嫡子好保重自己的地位,皇后氣惱離開。夜深人靜時,瓔珞發現皇后身患寒疾,並不欲任何人知道。隨後,皇后揮退左右並向純妃求援。之後,純妃屢次出入長春宮,停留的時間越來越長。高貴妃得知此事後,故意放出風聲,說皇后與純妃之間關係不正常,頓時宮中衆人議論紛紛。
瓔珞去查看姐姐出事那天宮中進出人員的名冊,被傅恆阻止。見瓔珞依舊執着於尋找殺害姐姐的真相,傅恆苦勸無果,只好決定暗中相助。月圓之夜,皇后在庭院裏思念逝去的兒子,愁眉不展,瓔珞想法子逗皇后開心,跟明玉追鬧時,皇上駕到,斥責瓔珞不懂規矩大呼小叫行爲無狀。皇后忙替瓔珞辯解,並揮退瓔珞和明玉,將皇上迎進殿內。皇后受弘曆所託,將愉貴人接入長春宮待產,明玉爾晴強烈反對,瓔珞也苦勸皇后,皇后卻將自己的想法告訴瓔珞。看着皇后溫文爾雅賢良淑德的樣子,瓔珞想起了自己的姐姐,潸然淚下。皇后隨太后去禮佛,留明玉瓔珞照看長春宮。明玉排擠瓔珞,不讓她插手宮中事宜。瓔珞見狀,也不欲與她多爭辯,只是盡心做好自己的分內之事。深夜,愉貴人突然臨產,驚了長春宮衆人。明玉守在愉貴人身邊,不讓瓔珞靠近。隨即,愉貴人生下一個渾身金黃的男嬰,衆人皆驚。
嫺妃提議讓從江南請來的名醫葉天士爲五阿哥醫治,皇上應允。葉天士肯定五阿哥患了黃疸,並保證用退黃方就可治好,弘曆鬆了口氣。高貴妃見風使舵,向皇上告罪,皇上表示諒解。這時,純妃帶人擡了此前照料愉貴人飲食的一名蒙古廚師的屍體上來。瞭解過愉貴人孕期的飲食習慣後,葉天士稟報弘曆,嬰兒瞳孔金黃的怪病,多因母體溼熱、膽汁淤積而生,孕婦應當注意飲食,不過分食用甜食燙食、腥羶之物。瓔珞意有所指是高貴妃想對付愉貴人和五阿哥,高貴妃辯駁,純妃卻呈上證據,是廚師死前留下的一封指認高貴妃的血書,弘曆大爲惱火,軟禁了高貴妃。皇上準備離開時,明玉攔住皇上,告發瓔珞盜用皇后金印,瓔珞打開匣子,裏面只是一塊硯臺,明玉因誣告而受罰。隨後,瓔珞攔住純妃與她說話,指出廚師自盡留下血書一事是她策劃,純妃提醒瓔珞別站錯了隊。
高貴妃巧妙利用這次機會對皇上訴說衷腸,贏得弘曆諒解。與此同時,皇后在長春宮門口苦等弘曆不至,深感失望。次日,瓔珞在御花園發泄心中對皇上辜負了皇后的不滿,遇到傅恆,瓔珞向他替皇后鳴不平,出言不遜,被傅恆勸阻。隨即,瓔珞因百般查探姐姐死因卻一無所獲,越發焦躁。弘曆深夜批閱奏章,身體不適,召太醫前來診治,發現他患了疥瘡。皇后不顧傳染危險,執意要搬入養心殿親自照料弘曆,原本她讓明玉隨行,可明玉卻將此差推給了瓔珞。瓔珞爲了調查皇上身邊的親信,查探姐姐的真正死因,於是同意跟明玉調換差事,跟隨皇后一道搬去了養心殿。瓔珞替皇上上藥,皇上十分反感,拒絕了瓔珞。可李玉粗手笨腳弄痛了皇上,皇上惱怒,瓔珞告訴皇上養心殿伺候的多半都是太監,如果他堅持,那麼只好請皇后來替他上藥了。皇上無奈,只好讓瓔珞繼續。皇上塗了藥之後依然燥熱瘙癢難耐,皇后衣不解帶地照顧了他整整一晚上,瓔珞見狀,十分動容。瓔珞試探李玉,詢問乾清宮夜宴當晚曾經離席的宗室,可惜一無所獲。 
傅恆得知瓔珞生病,偷偷前來照料,瓔珞對此若有所覺。葉天士來探望瓔珞,他知道瓔珞並不是被染上疥瘡,而是服用花生過敏引起出疹,於是問瓔珞爲什麼這麼做,瓔珞解釋說爲了保命,並感謝葉天士幫忙隱瞞,葉天士恍然大悟。弘曆病情痊癒,要找瓔珞算總賬,得知瓔珞已經康復回到長春宮,弘曆回過神來,氣惱她裝病欺騙自己,於是要去長春宮興師問罪。行至一半,聽聞宮中議論瓔珞捨身救主一事,不禁進退兩難,氣憤不已。瓔珞去感謝傅恆的照料,傅恆卻不承認,這時,海蘭察出現說漏了嘴,瓔珞氣惱傅恆騙自己,傅恆向瓔珞解釋自己也是爲了她的清譽着想,瓔珞諒解了他,兩人的感情越加親密。納蘭氏和陸晚晚來長春宮拜見皇后,意圖討好投靠,被心情不佳的明玉拒之門外,懷恨在心,轉投高貴妃門下,被高貴妃奚落也在所不惜。瓔珞見皇后思念二阿哥傷感失落,決心幫助皇后。弘曆壽辰,皇后獻上親自畫的山水圖。高貴妃別出心裁,在納蘭氏的建議下組建了一支西洋樂隊,討得弘曆歡心。納蘭氏隨即又借花獻佛,呈上一尊琉璃佛塔,塔內藏着一顆佛之蓮,請皇上代她獻給太后。

學習代碼

# -*- coding:utf-8 -*-
# author:chenqian time:2019/3/30

import os
os.chdir("C:/Users/Administrator.PC-20170407LSUI/Desktop/文本語義/NLP(Python)") # nlp文件夾的路徑

import jieba  # 中文分詞工具
import sys
import gensim
import sklearn
import numpy as np
from gensim.models.doc2vec import Doc2Vec, LabeledSentence #從gensim導入doc2vec
TaggededDocument = gensim.models.doc2vec.TaggedDocument

# 虛詞,可以隨意添加刪除
stoplist = ['的','了','被','。',',','、','她','自己','他','並','和','都','去','\n']


# 進行中文分詞
def cut_files():
    filePath = 'data/yxgltext.txt'
    fr = open(filePath, 'rb')
    fvideo = open('data/yxglCut.txt', "w")

    for line in fr.readlines():
        curLine = ' '.join(list(jieba.cut(line)))
        fvideo.writelines(curLine)


# 讀取分詞後的數據並打標記,放到x_train供後續索引,佔用很大內存(供小數據量使用)
def get_datasest():
    with open("data/yxglCut.txt", 'r') as cf:
        docs = cf.readlines()

        # 刪除常用詞,放入docs二維數組中,下標爲段數
        for idx in list(range(0, len(docs))):
            docs[idx] = ' '.join([word for word in docs[idx].split() if word not in stoplist])
        docs = [doc for doc in docs if len(doc) > 0]
        print(len(docs))

    x_train = []
    for i, text in enumerate(docs):  # 返回相應的下標和元素
        word_list = text.split(' ')  # 返回一個數組
        l = len(word_list)
        word_list[l - 1] = word_list[l - 1].strip()  # 去掉最後一個詞的回車符
        document = TaggededDocument(word_list, tags=[i])  # 詞袋+標籤,詞袋爲[],標籤爲[i]
        x_train.append(document)  # 數組裏面爲一個元素爲TaggededDocument類型
        # print(document)

    return x_train


# 模型訓練
def train(x_train, size=100, epoch_num=1):  # size=200 意味着 每個詞向量是200維的
    # 使用 Doc2Vec 建模
    model_dm = Doc2Vec(x_train, min_count=1, window=3, size=size, sample=1e-3, negative=5, workers=4)
    # model_dm.train(x_train, total_examples=model_dm.corpus_count, epochs=70)
    model_dm.save('model/model_dm_doc2vec')

    return model_dm


# 實例
def test():
    #    model_dm = Doc2Vec.load("model/model_dm_doc2vec")
    test_text = ['我', '喜歡', '傅恆']
    inferred_vector_dm = model_dm.infer_vector(test_text)

    # 選取相關度最高的10個詞
    sims = model_dm.docvecs.most_similar([inferred_vector_dm], topn=10)
    return sims

cut_files()
x_train=get_datasest()
model_dm = train(x_train)
sims = test()
for count, sim in sims:
    sentence = x_train[count]
    words = ''
    for word in sentence[0]:
        words = words + word + ' '
    # print(words, sim, len(sentence[0]))
# 輸出’瓔珞’的100維詞向量:
# print(model_dm.wv['瓔珞'])
# 可以用句向量模型直接根據詞向量查詢相似度
print(model_dm.wv.most_similar('瓔珞'))
print(model_dm.similarity('瓔珞', '傅恆'))
# 查詢字典的樣子,輸入:
print(model_dm.wv.vocab)
# 查詢字典大小:
print(len(model_dm.wv.vocab))

Doc2Vec函數參數說明
· size:是指特徵向量的維度,默認爲100。
· alpha: 是初始的學習速率,在訓練過程中會線性地遞減到min_alpha。
· window:窗口大小,表示當前詞與預測詞在一個句子中的最大距離是多少。
· min_count: 可以對字典做截斷. 詞頻少於min_count次數的單詞會被丟棄掉, 默認值爲5。
· max_vocab_size: 設置詞向量構建期間的RAM限制,設置成None則沒有限制。
· sample: 高頻詞彙的隨機降採樣的配置閾值,默認爲1e-3,官網給的解釋 1e-5效果比較好。設置爲0時是詞最少的時候!不進行降採樣,結果詞少,當設置1e-5,相應的詞展現更豐富!
· seed:用於隨機數發生器。與初始化詞向量有關。
· workers:用於控制訓練的並行數。
· min_alpha:學習率的最小值。
· sg: 用於設置訓練算法,默認爲0,對應CBOW算法;sg=1則採用skip-gram算法。
· hs: 如果爲1則會採用hierarchica·softmax技巧。如果設置爲0(默認),則使用negative sampling。
· negative: 如果>0,則會採用negativesampling,用於設置多少個noise words(一般是5-20)。
· cbow_mean: 如果爲0,則採用上下文詞向量的和,如果爲1(default)則採用均值,只有使用CBOW的時候才起作用。
· hashfxn: hash函數來初始化權重,默認使用python的hash函數。
· iter: 迭代次數,默認爲5。
· trim_rule: 用於設置詞彙表的整理規則,指定那些單詞要留下,哪些要被刪除。可以設置爲None(min_count會被使用)。
· sorted_vocab: 如果爲1(默認),則在分配word index 的時候會先對單詞基於頻率降序排序。
· batch_words:每一批的傳遞給線程的單詞的數量,默認爲10000。
一些參數的選擇與對比:
1.skip-gram (訓練速度慢,對罕見字有效),CBOW(訓練速度快)。一般選擇Skip-gram模型;
2.訓練方法:Hierarchical Softmax(對罕見字有利),Negative Sampling(對常見字和低維向量有利);
3.欠採樣頻繁詞可以提高結果的準確性和速度(1e-3~1e-5)

總結

用到的Doc2vec的功能主要有三個:

1.TaggedDocument語料預處理
2.train訓練模型,save 和 load 加載訓練好的模型
3.docvecs.most_similar 計算相似度

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章