原创 《推薦系統實踐》——基於物品的協同過濾算法(代碼實現)

一、基礎算法 基於物品的協同過濾算法(簡稱ItemCF)給用戶推薦那些和他們之前喜歡的物品相似的物品。不過ItemCF不是利用物品的內容計算物品之間相似度,而是利用用戶的行爲記錄。 該算法認爲,物品A和物品B具有很大的相似度是因爲喜歡物品

原创 統計學5

參數估計 統計推斷的基本問題可以分爲兩大類,一類是參數估計問題,另一類是假設檢驗問題。下面講的是總體參數的點估計和區間估計。 1、點估計 最大似然估計法是一種常用的構造估計量的方法。 2、區間估計 置信

原创 指針的概念

1、數組與指針 2、多維數組與指針 3、指向多維數組元素的指針變量 4、字符串與指針 形參用字符指針變量 *b放入常量存儲區,不可引用和更改。

原创 統計學2

隨機變量 我們熟悉的變量是比如y=2x+3,x y是變量,該變量可以變化,可以取特定值,可以求出值。而隨機變量雖然也可以取很多值,但這些變量無法求解。隨機變量用大寫字母X Y Z表示,這和可以求解的傳統變量分開。隨機變量其實是一種函數,

原创 統計學8

線性迴歸中的平方誤差 假設座標平面內有n點,想找到一條直線,最小化這些點到該直線的平方誤差。我們需要求出m和b的值。 定義下誤差的概念 e1=y1−(mx1+b) . . en=yn−(mxn+b) 平方誤差 SE=

原创 統計學10

方差分析 1、計算總平方和SST SST也就是這些數據點離均值的距離的平方之和,將其考慮爲計算方差時的分子部分。 總平均值X¯ =(3+2+1+5+3+4+5+6+7)/9=4,它等於每個數據集的均值的均值。X1¯ =2,X2¯

原创 統計學9

卡方分佈介紹 從概率密度圖中看出,如果只從標準正態分佈中抽樣一次,n=1,得到接近0的可能性非常大,接近0的數再平方後會更接近0,所以得到小數值的概率非常高。隨着n增加,小數值的平方和會增大,曲線會向右偏移。凸起部分越往右,某種程度

原创 統計學6

假設檢驗 統計推斷的基本問題可以分爲兩大類,一類是參數估計問題,另一類是假設檢驗問題。 精神學家用老鼠測試一種藥物的反應時間的效果,已知沒有注射藥物的老鼠平均反應時間是1.2秒,100只注射了藥物的老鼠平均反應時間是1.05秒,樣本標準

原创 全概率公式和貝葉斯公式

例題: 有10枚硬幣,其中9枚是正常硬幣(正反兩面),1枚特殊硬幣(兩個這正面)。選擇一枚硬幣,拋5次得到5次正面的概率是多少?如果得到5次正面,那麼選中特殊硬幣的概率是多少? 設B爲得到5次正面,A1 爲選擇正常硬幣,A2 爲選擇特殊

原创 統計學1

樣本和總體 統計學關心的是對樣本進行描述性統計,然後推斷出總體的情況。對樣本進行統計分析,一般能幫助估計總體的參數。 μ 代表總體均值,X¯ 表示樣本均值。公式:μ=∑Ni=1xiN ,X¯=∑ni=1xin ,其中,總體的個數N,樣本(

原创 C語言—共用體

共用體概念 等同 函數名稱和函數名稱的地址等同。類似於數組名a等同於&a。

原创 假設淘寶網上某商品A在任一時刻t內若有人瀏覽,則該商品在下一時刻t+1內無人瀏覽的概率爲0.35(即下一時刻的瀏覽情況僅與當前時段相關)

假設淘寶網上某商品A在任一時刻t內若有人瀏覽,則該商品在下一時刻t+1內無人瀏覽的概率爲0.35(即下一時刻的瀏覽情況僅與當前時段相關),定義此條件概率爲 P(O_{t+1}=0|O_t=1)=0.35(即用“1”代表有人瀏覽的事件,用“