不小心訓練了一個AI學習了咪蒙的文章風格,獲取了她的世界觀,本文演示下此AI的能力。
1
預測
可以預測2個內容。一個是基於咪蒙以往對各種事物/人的描述,提煉出其對事對人的態度/看法,用於預測。
另一個應用是針對全網熱門事件(通過爬蟲監測提取),取一個有咪蒙風格的標題。
1.1 針對人/事,咪蒙是如何看待的?
這裏針對:
離婚、男朋友、女朋友、開學、滴滴、延禧攻略
從數據上,挖掘下咪蒙是如何看待這些人或事的。
說明:
後面的數字是每個答案的準確率,準確越高,結果越可信;
基於公衆號文章的歷史數據的預測,並非本文作者的主觀看法。
咪蒙覺得 離婚 :
1 好 0.6432416439056396
2 重要 0.5582666993141174
3 窮 0.532257080078125
4 成功 0.47986114025115967
5 胖 0.4722142815589905
這裏讓AI稍微多透露一些內容:
咪蒙覺得 離婚 對下面的人/事影響最大:
1 父母 0.6931270956993103
2 孩子 0.6799288392066956
3 愛情 0.6668329238891602
繼續其他預測:
咪蒙覺得 男朋友 :
1 好 0.9179385900497437
2 有趣 0.7728292346000671
3 小 0.7394572496414185
4 成功 0.7342433929443359
5 重要 0.7158277034759521
咪蒙覺得 女朋友 :
1 好 0.5734760165214539
2 有趣 0.5382117033004761
3 最大 0.4727887511253357
4 成功 0.44332340359687805
5 貧窮 0.44006460905075073
咪蒙覺得 開學 :
1 最苦 0.3340543508529663
2 均勻 0.3158642053604126
3 顯赫 0.31271547079086304
4 輕鬆 0.31070709228515625
5 和諧 0.29741978645324707
咪蒙覺得 滴滴 :
1 好用 0.4044570326805115
2 強韌 0.37111154198646545
3 不愧 0.3322722911834717
4 拗神餒 0.3318832516670227
5 意外 0.3258388042449951
咪蒙覺得 延禧攻略 :
1 愚蠢 0.42433181405067444
2 很嫩 0.3688957393169403
3 很重 0.35487544536590576
4 具體 0.34537771344184875
5 赤貧 0.3256300091743469
1.2 如何爲熱點事件,取一個有咪蒙風格的標題?
針對最近幾天的全網熱點事件:
軍訓後走路都不自然了
mh370寫給2014的一封信
曬被大軍五點起牀佔位
微信交學費搖一搖免單
不想上幼兒園用袋子背去
一生都離不開的調味料
個人稅後月薪一萬在上海是什麼樣的體驗?
員工是否要對公司忠誠?
自如甲醛房數據
預測咪蒙會如何取文章的標題。
說明:
後面的數字是每個答案的準確率,準確越高,結果越可信;
基於公衆號文章的歷史數據的預測,並非本文作者的主觀看法。
咪蒙對熱點《 軍訓後走路都不自然了 》,會這麼取標題:
1 捱了兩刀後 我媽都不認識我了 0.9960410125402304
2 一年一度的虐狗節 我卻笑了一整夜 0.994565437928774
3 你減肥失敗的9條原因 被我找到了 0.9941999835387336
4 男朋友睡着了 我發現驚天祕密 0.9903317725409249
5 深夜 男友收到了兄弟的曖昧消息 0.9873264754027148
咪蒙對熱點《 mh370寫給2014的一封信 》,會這麼取標題:
1 選擇屬於你的好時光 0.9880194391798749
2 我受過最大的傷 就是看見你的自拍 0.9870251718257081
3 多希望當初的你 能遇到現在的我 0.9864768062876318
4 100萬對你不算什麼 夠我一天生活費了 0.9864741666916997
5 因爲我高考失敗 我的下屬纔是清華的 0.9862017510367604
6 你減肥失敗的9條原因 被我找到了 0.9860994891322602
7 深夜 男友收到了兄弟的曖昧消息 0.980533180615231
咪蒙對熱點《 曬被大軍五點起牀佔位 》,會這麼取標題:
1 女人到底想要什麼樣的驚喜 0.925551525228115
2 人是被自己的學習和經歷所塑造的 0.9221484994625054
3 沒有人告訴過我 被摸胸就要報警 0.9212221807729991
4 什麼時候最自卑 身邊人被誇的時候 0.9209637281842609
咪蒙對熱點《 微信交學費搖一搖免單 》,會這麼取標題:
1 爲什麼微信只能點贊 不能點呸 0.3683953390826499
2 愣着幹嗎 玩啊 0.31701523463969544
3 新型父母 熱愛工作 佛系養娃 0.3085720502552626
4 顏值這種事 和體重毫 無 關 系 0.30741803751788505
5 人生最緊張的時刻 對方正在輸入 0.30529733299885387
6 男女之間有純友誼 笑skr人 0.29669763892851436
咪蒙對熱點《 不想上幼兒園用袋子背去 》,會這麼取標題:
1 如果可以 我希望那天沒讓兒子去上幼兒園 0.9496883811698567
2 有一種好看 叫前任看了想複合 0.9412041099447421
3 畢業那天 我老闆 做了這種事...... 0.9391465899523104
咪蒙對熱點《 一生都離不開的調味料 》,會這麼取標題:
1 我的一生 是被父母嫌棄的一生 0.9931509518871393
2 不在乎的才謙讓 喜歡的都去搶 0.9930373915537687
3 你的每次逃避 都要雙倍償還 0.9917651679020135
4 去年的衣服配不上我了 去年的老公也是 0.9916948849512304
咪蒙對熱點《 個人稅後月薪一萬在上海是什麼樣的體驗? 》,會這麼取標題:
1 一個地方就能看清 你是在生活 還是在湊合 0.9921539472114738
2 我聽過的最大謊言是 你還年輕 0.9913330316026332
咪蒙對熱點《 員工是否要對公司忠誠? 》,會這麼取標題:
1 我無數次想刪掉那段傻逼回憶 0.9707440035338921
2 我對所有人都很好 唯獨想對你使壞 0.9706181356680429
3 我不僅臉皮厚 我還不知道天高地厚 0.9689343925191874
咪蒙對熱點《 自如甲醛房數據 》,會這麼取標題:
1 我暴瘦30斤的祕籍 今日大公開海量照片 慎入 0.3413323852521377
2 我們欺騙自己的時候 不擇手段 0.281670669272558
3 這三個字 勝過自由 勝過生命 勝過甜言蜜語...... 0.24869003831935418
4 這個刺激的問題 你敢問男友嗎 0.24810450875665513
5 太刺激了 你租過房 那你租過牀嗎 0.2475747827252351
2
技術原理
本文的AI是如何訓練的?先了解下核心的技術原理:
點擊下圖get知識卡片
技能要求:機器學習、python、分詞
3
AI訓練目標:
符合全網用戶閱讀喜好
提取咪蒙文風中所使用的形容性的短句
爲了達成這個目標,對評論數高的文章提高其權重。
4
AI訓練步驟:
4.1 數據收集
爬取868篇公衆號文章,包括標題+簡介+正文。
4.2 數據處理與提取
從數據中根據詞性、常用的短句、常用的形容詞等,提取出屬於咪蒙文風的詞典。
4.3 詞向量的訓練
利用word2vec進行詞向量的訓練,並對評論數高的文章提高權重
以上爲全文,再次強調,本文是AI基於大數據預測出來的結果,僅供參考。