標題黨文章生成器

 

標題黨文章生成器

今天推文寫點啥的發生,到底需要如何做到,不今天推文寫點啥的發生,又會如何產生。 瞭解清楚今天推文寫點啥到底是一種怎麼樣的存在,是解決一切問題的關鍵。 一般來講,我們都必須務必慎重的考慮考慮。 今天推文寫點啥的發生,到底需要如何做到,不今天推文寫點啥的發生,又會如何產生。 本人也是經過了深思熟慮,在每個日日夜夜思考這個問題。 一般來講,我們都必須務必慎重的考慮考慮。 經過上述討論, 那麼, 在這種困難的抉擇下,本人思來想去,寢食難安。 一般來講,我們都必須務必慎重的考慮考慮。

——狗屁不通文章生成器

 

上述一段文字不是人寫的。

雖然這句話聽起來好像是在罵人,但它的確不是人撰寫的,而是一個有趣的程序生成的。這便是“狗屁不通文章生成器”(在線版地址見文末)

網頁版文章生成器

起初,知乎上有這樣一個問題“學生會退會申請六千字怎麼寫?”。然後,就被我們討厭形式主義熱心網友KE meng看見了。再然後,就有了這個“狗屁不通文章生成器”

 

這個“狗屁不通文章生成器”可以生成任意長度的文章,而且第一眼看起來,還挺像回事,就如本文開頭的那一段話。還有人感嘆程序生成的文章比一些人寫的文章要好多了。

 

也正因如此,該項目在知乎和github上大獲好評。

狗屁不通文章生成器廣受歡迎

 

作爲一名NLP領域愛好者,起初我看到該項目的時候,我以爲是使用中文版的GPT-2模型(一個神經網絡模型,運行起來需要的計算量超大)實現的,

GPT-2模型生成的小說

 

上圖是有GPT-2生成的小說。輸入一段文字,該模型可以接着這句話接着寫下去。(更多內容見後記,在線版地址見文末)

該模型的效果十分驚豔,但同時也需要相當大的計算資源。因此,在得知有在線版的狗屁不通文章生成器的時候,我還納悶這個在線版文章生成器得需要多少塊GPU才能實現大量用戶同時使用。

結果事實上,該文章生成器一點AI的算法也沒有用!

 

狗屁不通文章生成器作者申明 和AI無關

 

既然不用AI,那該程序是如何實現的呢?

方法很簡單:不斷重複預先寫好的內容

 

語料庫裏預先寫好的語句

 

“狗屁不通文章生成器”通過採用不斷隨機重複已有語料庫中的句子,並時不時插入關鍵詞從而達到狗屁不通卻又緊貼文章主題的效果。

說到這,我突然想起了一個段子——如何用5行代碼實現人工智能聊天機器人

 

5行代碼實現聊天機器人

 

給看不懂的讀者稍微解釋一下,上圖中所謂的“智能”回答,只是重複提問中的一部分內容,然後再在結尾加上一個感嘆號

無論是上面的5行代碼聊天機器人還是文章生成器,我想它們能讓人發笑的部分原因在於,其使用十分笨拙的方法嘗試解決某個複雜的問題,實現效果還挺有趣的。

說迴文章生成器,不僅其生成的內容有趣,更有意思的是,其代碼實現的方法也讓人不禁發笑。因爲……

 

狗屁不通文章生成器部分代碼

 

整個程序是由中文寫的!準確一點說,是程序的變量名是中文,程序的文件也是中文名。

 

不得不說,“狗屁不通文章生成器”從其形式到實現方式上都充滿了喜感

一般來說,推文到此就應該結束了。再然後就是讀者看到推文底部的微信廣告,我從而獲得廣告瀏覽的收益了。

但是!作爲一個曾經用AI和騙子“鬥智鬥勇”的程序段子手

往期文章:如何用AI調戲騙子

我決定自己要站在“狗屁不通文章生成器”的肩膀上,繼承其精神,寫出一個改進版的文章生成器(當然,也是用中文編程)

思來想去,我決定把目標定在了“標題黨”上。

我一直特別痛恨“標題黨”文章,此類文章標題除了吸引眼球外什麼信息都沒給,而點進去的文章內容又純屬廢話

一個典型的例子如下:“爲什麼西瓜不能用勺子挖着吃?不知道原因就危險了,你知道嗎?”

標題黨文章

 

啥!西瓜不能用勺子吃?爲啥?

出於好奇,你點開文章,在前後邏輯不同的文字和各種莫名其妙的配圖的摧殘下,終於找到了答案:

 

原因竟然是容易吃多,導致胃難受。

 

爲了編寫“標題黨文章生成器”,我先拜讀了大量標題文章(我現在的心靈飽受摧殘),並找到了我心目中標題黨文章的幾個特點

  1. 文章內容基於一個大廢話(或者是謠言)而胡扯

  2. 經常會有“專家”說了什麼

  3. 配有幾張很隨意的圖片

下面,我們會講述該“標題黨文章生成器”的主要思路和有趣的模塊(由python實現)。至於編程細節,有興趣的讀者可訪問:

github.com/DrMofu/BTDgenerator

首先,我們需要輸入一句大廢話作爲文章的中心思想。

 

在下面的例子中,我們的大廢話是“小明是一個學生”

現在,讓我們先生成一個引人入勝的標題

標題的實現很簡單。我們預先寫好標題的開頭和標題的末尾內容。

我們的標題 = 開頭 + 大廢話 + 末尾

 

 

比如開頭可以是:"震驚!","驚訝!", "喪心病狂!","X天瞭解……","X%的人都不知道的事情!"(這裏的X可以隨機生成)

而末尾可以是:"不轉不是中國人!", "男人看了會沉默,女人看了會流淚",  "真相竟出乎意料"

自動生成的標題舉例:

  • 38小時解決小明是一個學生。原來是這樣

  • 45天之內完全弄懂小明是一個學生。不轉不是中國人!

  • 震驚!小明是一個學生。真相竟出乎意料

接着,是文章內容生成

文章內容也可以按着這個大思路來實現。我們依舊是提前寫好一堆廢話:"很顯然,A在大部人看起來是一件簡單的事情,可是,實事真的如此嗎?", "A看起來很簡單?"(A代表大廢話)我們不斷地重複這些廢話就好了。

於是,標題黨文章的第一個特徵:“文章內容基於一個大廢話(或者是謠言)而胡扯”我們就已經實現了。

緊接着,是第二個特徵:經常會有“專家”說了什麼”

我們先自動生成專家的姓名提前寫好可能的姓和名,然後從“姓”裏面抽取一個字,從“名”裏面抽取一或兩個字

 

接着,在正文的廢話中插入類似:"R專家一再表示,A一定要重視,否則會有很嚴重的後果", "R教授表示,A遠沒有看起來那樣簡單。"(A代表大廢話,R代表專家的姓名)

 

綜合上面的步驟,我們的標題黨文章生成器可以生成如下內容

奚理品專家一再表示,小明是一個學生一定要重視,否則會有很嚴重的後果!奚理品教授表示,小明是一個學生遠沒有看起來那樣簡單。小明是一個學生看起來很簡單?很多人都有一個誤區,認爲小明是一個學生是一件再平常不過的事情。很顯然,小明是一個學生在大部人看起來是一件簡單的事情,可是,實事真的如此嗎?小明是一個學生到底有多危險?

結束了嗎?並沒有!

標題黨文章還有第三個特點:“配有幾張很隨意的圖片”

這裏,我是調用了“爬蟲”,直接去搜索引擎搜索我們的大廢話然後爬取前幾張圖片的地址。(這裏用的是搜狗,因爲百度搜圖有驗證,不易直接爬取)

 

不過不得不吐槽一下,搜狗的相關搜索總是莫名其妙的。

 

最後,我們再畫龍點睛,在文章末尾加上一句“狗屁結論”如:"總而言之,A其實是沒有問題的。", "經過上面的分析,我們可以看到,A很正常,大家不用擔心。"(A代表大廢話)

最終,我們寫一個網頁模板,把之前生成的標題、文章和爬取的圖片都放進去,並另存爲一個新的網頁。

 

於是乎,一篇標題黨文章就誕生了!

 

 

雖然網頁的排版比較簡易,但文章整體上看上去,還覺得挺像那麼一回事的。

 

現在,這個“標題黨文章生成器”只有一個python程序版:

github.com/DrMofu/BTDgenerator

讀者想要運行文章生成器,必須要將程序下載到本地並用python來執行。其實我一直想寫一個網頁版的,這樣大家都能輕鬆體驗。但我個人精力實在有限,暫時無法完成。網頁版過幾天一定補上

 

後記

用GPT-2模型(AI模型)生成的文章還挺有意思的。這裏用的是網友“imcaspar”在Github上開源的GPT2-ML項目

 

 

只要輸入一句話,模型就可以接着這句話生成新的內容。

 

比如輸入“99%員工都不知道的祕密!速看!” 。模型生成的比較有趣的幾段內容如下:

 

99%員工都不知道的祕密!速看!勞務公司合規小知識千萬不要長期租賃公司不要長期出借公司的一切物品,包括包包、電腦、手機、冰箱、空調、電視、機 頂盒等物品!禁止長期租賃公司設立有固定公司,設立之後便沒有管理與維護人員,長期處於公司的小規模運轉!寧可辛苦一兩年,也絕不找長期租賃公司來借 錢!大家要知道!公司可是休假的地方,公司員工上班就像上墳一樣!公司有絕對的自由度,可以組織大家旅遊,還有超級舒適的會所,想想還是挺刺激的~

 

99%員工都不知道的祕密!速看!58同城和趕集網的貓膩,其實就在這5只鬼!網傳58經常把58趕集網招聘去騙,明明58趕集網出奇招,然後雙方公 司各種沒商量,結果搞得58趕集的人和趕集的人都不滿意,結果公司因爲一個電話從那邊派一批人過來一氣之下,把58趕集的惡狠狠坑了一把!同城和趕集 現在合作搞的不順。裏面有貓膩,58趕集經常收兼職,然後千方百計刷單。

 

又或者“爲什麼西瓜不能用勺子挖着吃?”

 

爲什麼西瓜不能用勺子挖着吃?因爲西瓜是有生命的(死亡率。。。)美國軍人因爲明顯的語言障礙執法問題導致無法執行任務,在特別的文化環境和執法條例 下非要讓一個年輕美國軍人出來,結果被拒絕,已經超出他們的能力範圍,最後被判了無期徒刑,還非要讓他們再出來!如果想增強西瓜的生命力,那就可以讓 他們挖,讓他們用勺子挖。

 

爲什麼西瓜不能用勺子挖着吃?我吃西瓜的時候不會這樣想。我知道西瓜有苦味,能吃,就像我肯定不會被苦味影響,但我不知道上面的誰是苦的。您覺得呢? 這麼多答案有幾個人能解決題主的疑惑,還能把從出生以來的經歷都表達出來。那些多餘的扯淡就是閒的。相信我,這樣不好。所有覺得是哲學範疇的都應該點 反對沒有幫助。

 

看由AI生成的文章感覺比標題黨文章要有趣多了

 

標題黨文章生成器項目地址(本項目):

github.com/DrMofu/BTDgenerator

狗屁不通文章生成器項目地址:

github.com/menzi11/BullshitGenerator

狗屁不通文章生成器在線版:

suulnnka.github.io/BullshitGenerator

GPT-2文章生成器項目地址:

github.com/imcaspar/gpt2-ml

GPT-2文章生成器在線版:(需翻牆)

colab.research.google.com/github/imcaspar/gpt2-ml/blob/master/pretrained_model_demo.ipynb

 

本文由“標題黨文章生成器”生成(玩笑)

 

發佈了18 篇原創文章 · 獲贊 14 · 訪問量 6456
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章