當AI學會了咪蒙的文風之後……

不小心訓練了一個AI學習了咪蒙的文章風格,獲取了她的世界觀,本文演示下此AI的能力。

1

預測

可以預測2個內容。一個是基於咪蒙以往對各種事物/人的描述,提煉出其對事對人的態度/看法,用於預測。

另一個應用是針對全網熱門事件(通過爬蟲監測提取),取一個有咪蒙風格的標題。

1.1 針對人/事,咪蒙是如何看待的?

這裏針對:

離婚、男朋友、女朋友、開學、滴滴、延禧攻略

從數據上,挖掘下咪蒙是如何看待這些人或事的。

說明:

後面的數字是每個答案的準確率,準確越高,結果越可信;

基於公衆號文章的歷史數據的預測,並非本文作者的主觀看法。

咪蒙覺得 離婚 :
1 好 0.6432416439056396
2 重要 0.5582666993141174
3 窮 0.532257080078125
4 成功 0.47986114025115967
5 胖 0.4722142815589905

這裏讓AI稍微多透露一些內容:

咪蒙覺得 離婚 對下面的人/事影響最大:
1 父母 0.6931270956993103
2 孩子 0.6799288392066956
3 愛情 0.6668329238891602

繼續其他預測:

咪蒙覺得 男朋友 :
1 好 0.9179385900497437
2 有趣 0.7728292346000671
3 小 0.7394572496414185
4 成功 0.7342433929443359
5 重要 0.7158277034759521
咪蒙覺得 女朋友 :
1 好 0.5734760165214539
2 有趣 0.5382117033004761
3 最大 0.4727887511253357
4 成功 0.44332340359687805
5 貧窮 0.44006460905075073
咪蒙覺得 開學 :
1 最苦 0.3340543508529663
2 均勻 0.3158642053604126
3 顯赫 0.31271547079086304
4 輕鬆 0.31070709228515625
5 和諧 0.29741978645324707
咪蒙覺得 滴滴 :
1 好用 0.4044570326805115
2 強韌 0.37111154198646545
3 不愧 0.3322722911834717
4 拗神餒 0.3318832516670227
5 意外 0.3258388042449951
咪蒙覺得 延禧攻略 :
1 愚蠢 0.42433181405067444
2 很嫩 0.3688957393169403
3 很重 0.35487544536590576
4 具體 0.34537771344184875
5 赤貧 0.3256300091743469

1.2 如何爲熱點事件,取一個有咪蒙風格的標題?

針對最近幾天的全網熱點事件:

軍訓後走路都不自然了

mh370寫給2014的一封信

曬被大軍五點起牀佔位

微信交學費搖一搖免單

不想上幼兒園用袋子背去

一生都離不開的調味料

個人稅後月薪一萬在上海是什麼樣的體驗?

員工是否要對公司忠誠?

自如甲醛房數據

預測咪蒙會如何取文章的標題。

說明:

後面的數字是每個答案的準確率,準確越高,結果越可信

基於公衆號文章的歷史數據的預測,並非本文作者的主觀看法。

咪蒙對熱點《 軍訓後走路都不自然了 》,會這麼取標題:
1 捱了兩刀後 我媽都不認識我了
0.9960410125402304
2 一年一度的虐狗節 我卻笑了一整夜 
0.994565437928774
3 你減肥失敗的9條原因 被我找到了  
0.9941999835387336
4 男朋友睡着了 我發現驚天祕密  
0.9903317725409249
5 深夜 男友收到了兄弟的曖昧消息  
0.9873264754027148
咪蒙對熱點《 mh370寫給2014的一封信 》,會這麼取標題:
1 選擇屬於你的好時光  
0.9880194391798749
2 我受過最大的傷 就是看見你的自拍  
0.9870251718257081
3 多希望當初的你 能遇到現在的我 
0.9864768062876318
4 100萬對你不算什麼 夠我一天生活費了  
0.9864741666916997
5 因爲我高考失敗 我的下屬纔是清華的  
0.9862017510367604
6 你減肥失敗的9條原因 被我找到了  
0.9860994891322602
7 深夜 男友收到了兄弟的曖昧消息  
0.980533180615231
咪蒙對熱點《 曬被大軍五點起牀佔位 》,會這麼取標題:
1 女人到底想要什麼樣的驚喜  
0.925551525228115
2 人是被自己的學習和經歷所塑造的  
0.9221484994625054
3  沒有人告訴過我 被摸胸就要報警  
0.9212221807729991
4 什麼時候最自卑 身邊人被誇的時候  
0.9209637281842609
咪蒙對熱點《 微信交學費搖一搖免單 》,會這麼取標題:
1 爲什麼微信只能點贊 不能點呸  
0.3683953390826499
2 愣着幹嗎 玩啊  
0.31701523463969544
3 新型父母 熱愛工作 佛系養娃  
0.3085720502552626
4 顏值這種事 和體重毫 無 關 系  
0.30741803751788505
5 人生最緊張的時刻 對方正在輸入  
0.30529733299885387
6 男女之間有純友誼 笑skr人  
0.29669763892851436
咪蒙對熱點《 不想上幼兒園用袋子背去 》,會這麼取標題:
1 如果可以 我希望那天沒讓兒子去上幼兒園  
0.9496883811698567
2 有一種好看 叫前任看了想複合
0.9412041099447421
3 畢業那天 我老闆 做了這種事...... 
0.9391465899523104
咪蒙對熱點《 一生都離不開的調味料 》,會這麼取標題:
1 我的一生 是被父母嫌棄的一生 
0.9931509518871393
2 不在乎的才謙讓 喜歡的都去搶  
0.9930373915537687
3 你的每次逃避 都要雙倍償還 
0.9917651679020135
4 去年的衣服配不上我了 去年的老公也是 
0.9916948849512304
咪蒙對熱點《 個人稅後月薪一萬在上海是什麼樣的體驗? 》,會這麼取標題:
1 一個地方就能看清 你是在生活 還是在湊合 
0.9921539472114738
2 我聽過的最大謊言是 你還年輕 
0.9913330316026332
咪蒙對熱點《 員工是否要對公司忠誠? 》,會這麼取標題:
1 我無數次想刪掉那段傻逼回憶 
0.9707440035338921
2 我對所有人都很好 唯獨想對你使壞
0.9706181356680429
3 我不僅臉皮厚 我還不知道天高地厚
0.9689343925191874
咪蒙對熱點《 自如甲醛房數據 》,會這麼取標題:
1 我暴瘦30斤的祕籍 今日大公開海量照片 慎入
0.3413323852521377
2 我們欺騙自己的時候 不擇手段
0.281670669272558
3 這三個字 勝過自由 勝過生命 勝過甜言蜜語...... 
0.24869003831935418
4 這個刺激的問題 你敢問男友嗎
0.24810450875665513
5 太刺激了 你租過房 那你租過牀嗎
0.2475747827252351

2

技術原理

本文的AI是如何訓練的?先了解下核心的技術原理:

點擊下圖get知識卡片

技能要求:機器學習、python、分詞

3

AI訓練目標:

符合全網用戶閱讀喜好

提取咪蒙文風中所使用的形容性的短句

爲了達成這個目標,對評論數高的文章提高其權重

4

AI訓練步驟:

4.1 數據收集

爬取868篇公衆號文章,包括標題+簡介+正文。

4.2 數據處理與提取

從數據中根據詞性、常用的短句、常用的形容詞等,提取出屬於咪蒙文風的詞典。

4.3 詞向量的訓練

利用word2vec進行詞向量的訓練,並對評論數高的文章提高權重

以上爲全文,再次強調,本文是AI基於大數據預測出來的結果,僅供參考。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章