原创 用戶畫像應用中的常見誤區

前言 之前對用戶畫像已經有兩篇博客輸出,分別是一步一步認識用戶畫像和用戶畫像如何驗證正確性,這兩篇更多的是講解用戶畫像的過程性問題,在實際業務應用中可能遇到的誤區是本篇博客主要的內容。 用戶畫像誤區 1.畫像與業務場景關聯度不高

原创 錯誤記錄 - 訓練深度學習模型loss爲nan的原因

前言 最近師弟在實際業務中訓練深度學習模型時遇到個問題:在大樣本訓練模型時候的loss爲nan,嘗試了各種方法也沒有什麼起色,最終一起分析了一番擬確定了原因,這邊就分享下可能的原因可供分析調整~ 原因 1.模型問題 網絡結構設

原创 用戶畫像如何驗證正確性?

前言 最近在用戶畫像任務中有個迷茫點,通過從用戶行爲或者用戶數據中爲用戶量身定製的標籤到底準不準確呢?之前對用戶畫像的初步瞭解寫過一篇博客,其中對畫像的驗證主要基於模型的線上線下評估。然而,在實際的業務中大多數是依靠業務人員或者分

原创 SQL優化系列 - MySQL表設計時要注意什麼?

前言 今天是5月的最後一天了,一邊聽着五月天的線上演唱會,一邊整理下學過SQL相關的內容,之前有篇是針對SQL的知識點:https://blog.csdn.net/Totoro1745/article/details/106036

原创 數據分析進階-分析思維(1)

前言 最近在人人都是產品經理看到一篇數據分析思維相關的文章,裏面所提出的5個要點對於數據分析的過程有所用處,讀完之後也對其構建思維導圖~ 5個要點 參考資料:http://www.woshipm.com/data-analysi

原创 NLPCC2019 - User-Characteristic Enhanced Model for Fake News Detection in Social Media

前言 在大四上學期的一門課上研讀了一篇關於虛假新聞檢測的頂會論文,後對這個領域產生了濃厚興趣,在畢業論文選擇了社交媒體上的虛假新聞檢測來作爲題目,最終論文成果有幸被NLPCC2019會議所收錄,算是科研菜雞的一個小小進步吧。如有不

原创 數據分析進階 - 分析方法論

前言 由於在工作中經常需要對業務數據進行分析並提供相應的結論和建議,數據分析的能力是一個目前我認爲比較重要的點,但在實際操作中總覺得理論體系或者經驗不足,接下來會不斷地去充實自己,同時也會整理所學到博客之中,望共同學習~ 業務數據

原创 數據分析進階 - pandas在數據分析中的應用

前言 記得在去年的時候寫過一篇關於pandas包的簡單使用,具體可見鏈接,但是經過這段時間的學習或者工作,覺得有點低估了pandas能夠在分析中發揮的作用,所以這篇博客將對數據分析整個流程中pandas的使用做一個梳理(不會特別全

原创 Codewars實戰(二)

題10 Regex validate PIN code ATM machines allow 4 or 6 digit PIN codes and PIN codes cannot contain anything but exa

原创 Python之獲取上月的第一天以及最後一天

from datetime import datetime, date from dateutil.relativedelta import relativedelta this_month = date.today() las

原创 分析思維鍛鍊 - 次日留存率下降怎麼分析?

前言 個人覺得數據分析重要的在於思維層面,奈何在這方面的訓練不是很多。因此,後續將多多鍛鍊並整理成博客分享(內容僅爲個人思考,會不斷進行修正) 分析思路 明確問題 # 在實際工作中通過溝通進行確定 問題:次日留存率下降怎麼分析

原创 數據分析進階-阿里雲服務器部署superset與初步使用

前言 Superset 是 Airbnb開源的數據探查與可視化平臺,是個輕量級的BI工具,開發者可以在其開源代碼上根據需要進行二次開發。最近在探索數據分析平臺的應用,就來試一試,然而superset更新迭代的速度太快,裏面也有太多

原创 SQLZOO附加題練習 - Window functions

前言 SQLZOO裏面的題還是比較適合初學者的,這裏僅僅作爲鞏固基礎,同時因爲這道題目前搜不到相應的答案,所以做個小小的分享~ PS:非小白玩家可以去LeetCode、牛客網、CodeWars上刷題更佳 題目 General El

原创 錯誤記錄 - ValueError unsupported format character Y (0x59) at index 53

前言 發現很多時候遇到挺多報錯記錄的,覺得可以弄個錯誤記錄特輯來整理下遇到的問題以及相應的解決方法~ 錯誤複述 代碼環境:Python3 代碼用途:執行SQL語句 錯誤代碼: # 僅爲實例 sql = "select date_f

原创 數據分析特輯-如何推進與業務方的溝通?

前言 作爲數據分析師或者參與到數據分析項目中的朋友,應該少不了與業務方打交道。最近在這個方面上頗有感觸,結合自己爲數不多的項目經驗以及網上相關文章的點撥,在此做一點點的思考分享,以下均爲個人想法,也希望有類似經驗的朋友們可以分享自