原创 ¥99招聘首席運動監督合夥人(第三期)

活動內容每期99元大紅包誠摯邀請小夥伴們監督或者加入我們的每週運動自律計劃。作爲監督回報,如果我第一週計劃失敗,參與活動的小夥伴私聊我發¥6.6紅包。如果上一次失敗小夥伴拿到我的紅包,並且第二次我又失敗私聊我發¥13.2的紅包,依次遞推

原创 總會用到的系列4:關鍵時刻能救家庭的保險

摘要:本篇重點分享了保險相關的知識。首先講保險是幹啥的,引入保險的作用和意義,還講了一些保險的知識點;然後分別根據作用、產品類型和時間對保險進行劃分;接着講了保險的購買途徑和購買步驟。購買途徑主要包括線上網絡購買和線下代理經紀人購買;最

原创 關鍵詞提取技術

python自然語言處理實戰 第五章  關鍵詞提取算法 中管方法分析: 1.有監督方法及語料庫技術 將關鍵詞抽取任務轉化爲分類問題或標註問題。 有監督機器學習的分類方法主要藉助決策樹、樸素貝葉斯、支持向量機、最大熵模型、隱馬爾可夫模型、條

原创 廣告行業中那些趣事系列13:NLP中超實用的樣本增強技術

摘要:本文主要解決在樣本數量較少、樣本不均衡或者需要提高模型的魯棒性的場景下通過樣本增強技術提升模型的泛化能力的問題。主要講了近幾年常用的樣本增強技術,其中包括回譯技術、詞彙替換技術、隨機噪聲引入技術和生成式的方法等等。通過這些技術我們

原创 python 實現 hive中類似 lateral view explode 的功能

背景:加入現在有這樣的數據,可能一條ocr代表兩個label,並且label通過","分隔。我們想把數據轉換成下面的。 原始數據: label ocr 日常行車服務,汽車資訊 去加油站,加完油後直接離開?最開心的可能是加油站的工作人員 社

原创 總會用到的系列3:成功的路上你可能需要一個微信公衆號

微信公衆號:數據拾光者。願結交更多的小夥伴,一同走人生路。 摘要:如何快速的成長?創建一個微信公衆號可能是一個不錯的建議。微信公衆號可能是一張專屬於你的名片,也能幫助我們從一個螺絲釘向中央CPU蛻變,更是我們知識積累沉澱的一個很好的平臺

原创 7個Python特殊技巧,助力你的數據分析工作之路

https://zhuanlan.zhihu.com/p/88809176 7個Python特殊技巧,助力你的數據分析工作之路 1. Pandas Profiling df.sample(5) df.describe() Pandas P

原创 廣告行業中那些趣事系列5:BERT實戰多標籤標註模型(附github源碼)

微信公衆號:數據拾光者。願結交更多的小夥伴,一同走人生路。 摘要:之前廣告行業中那些趣事系列2:BERT實戰NLP文本分類任務(附github源碼),我們通過BERT構建了二分類器。這裏根據實際項目需要使用BERT構建多標籤標註模型,可

原创 自然語言處理三大特徵抽取器(CNN/RNN/TF)比較

轉載https://zhuanlan.zhihu.com/p/54743941 放棄幻想,全面擁抱Transformer:自然語言處理三大特徵抽取器(CNN/RNN/TF)比較 一個是Bert這種兩階段的模式(預訓練+Finetuning

原创 廣告行業中那些趣事系列7:實戰騰訊開源的文本分類項目NeuralClassifier

微信公衆號:數據拾光者。願結交更多的小夥伴,一同走人生路。 摘要:本篇主要分享騰訊開源的文本分類項目NeuralClassifier。雖然實際項目中使用BERT進行文本分類,但是在不同的場景下我們可能還需要使用其他的文本分類算法,比如T

原创 百度paddle ernie 實戰

背景:最近百度 paddle ernie非常火,而且公司打算使用paddle作爲機器學習的框架,所以研究ernie用於文本識別,主要用於文本分類任務,根據資訊的title來做成很多二分類器,比如判定這個資訊是不是XXX標籤。 下面是實戰的

原创 廣告行業中那些趣事系列12:推薦系統中融合注意力機制的DIN模型

本篇一共5432個字摘要:本文主要介紹阿里的深度興趣網絡DIN模型。爲了解決推薦領域中用戶歷史行爲包含大量用戶興趣信息,但只有一小部分用戶興趣信息會最終影響用戶點擊行爲的問題,阿里引入Attention機制提升相關商品的權重同時降低非相

原创 ¥99招聘首席運動監督合夥人(第二期)

活動內容每期99元大紅包誠摯邀請小夥伴們監督或者加入我們的每週運動自律計劃。作爲監督回報,如果我第一週計劃失敗,參與活動的小夥伴私聊我發¥6.6紅包。如果上一次失敗小夥伴拿到我的紅包,並且第二次我又失敗私聊我發¥13.2的紅包,依次遞推

原创 ¥99招聘首席運動監督合夥人(第二期第二週)

活動內容每期99元大紅包誠摯邀請小夥伴們監督或者加入我們的每週運動自律計劃。作爲監督回報,如果我第一週計劃失敗,參與活動的小夥伴私聊我發¥6.6紅包。如果上一次失敗小夥伴拿到我的紅包,並且第二次我又失敗私聊我發¥13.2的紅包,依次遞推

原创 廣告行業中那些趣事系列11:推薦系統領域必學的Graph Embedding

摘要:推薦系統領域最近大火的Graph Embedding可以很好的解決傳統的Sequence Embedding無法解決現實世界中諸如社交關係等圖結構的問題。本文重點講解了Graph Embedding中具有代表性的DeepWalk、