原创 泊松分佈知識總結及例子

泊松分佈知識總結及例子 泊松分佈經常出現在IT類技術面試中,雖然工作中我還沒遇到需要用泊松分佈解決的問題,但我想深入理解泊松分佈對於服務器處理訪問請求,以及對各種小概率事件的估計預測都有重要作用,所以花時間整理了下資料

原创 數據統計分析時常用sql語句 (split , row_number , group by, max 等 )

統計分析及建表過程中通常會遇到這樣的需求,比如: 1. 統計以逗號分隔的標籤數,哪個最受歡迎,以及作爲內容推薦的數據來源 2. 分組排序url的pv, 取topN的列表 3. 經常會有名字重複的url記錄,取pv最大

原创 音樂推薦系統比較調研(2)之場景推薦

幾個月前,我在 《音樂推薦系統比較》中針對協同過濾中的item-based相關推薦,粗略對比了下不同音樂產品推薦系統的效果。最近聽蝦米音樂比較多,被裏面一些場景推薦的小心思驚喜了,於是專門截了屛,收集了些他們的推薦策略分享出來,希

原创 音樂推薦系統比較調研

音樂推薦系統比較 前言 最近想把吉他撿起來,唱唱陳奕迅的歌,碰巧聽到他的《任我行》特別有感觸,於是就在各種網站上找音頻,mv, 歌曲背景,歌詞解讀的文章去聽去看; 正好我又在做推薦系統,就比較了一下各種網站的推薦結

原创 關於大數據的一些個人理解

前幾天商學院的校友問了我幾個關於大數據的問題,一看都是非常專業且典型的問題, 相信大家聽這個詞聽得太多了也有很多疑問,於是我總結了下自己的理解,分享出來大家一起討論。 1. 現在大數據很時髦,多大的數才能叫大數據? 一般網站大概幾TB

原创 關於朋友圈加廣告的這件事

這篇文章發表於微信朋友圈第一次推送廣告的時候,現在已經過去兩個多禮拜了,直到今天收到第三條凱迪拉克的廣告, phd師兄Z在我朋友圈下面興奮地評tiao論xi說,“能不能給我推個加速器的廣告” 另一個金融師兄X一唱一和地呼hu應you到,“

原创 帆船駕駛技術的物理學原理

如果你一開始對帆船如何能夠逆風行駛感到不可思議, 也許下面這個類比可以讓你更容易地理解。 你坐飛機的時候有沒有想過爲什麼飛機能飛起來呢? 原因是初中物理學裏的一個原理,它叫貝努利原理(不能怪你,如果初中物理老師能像我現在這樣舉個具體栗子