原创 可汗學院:統計學第四次學習

統計學第四次學習 線性迴歸 在統計學中,線性迴歸(Linear Regression)是利用稱爲線性迴歸方程的最小平方函數對一個或多個自變量和因變量之間關係進行建模的一種迴歸分析。這種函數是一個或多個稱爲迴歸係數的模型參數的線性組

原创 可汗學院:統計學第三次學習

統計學第三次學習 假設檢驗 假設檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗中基本上不會發生。反證法思想是先提出假設(檢驗假設H0),再用適當的統計方法確定假設成立的可能性大小

原创 Python爬蟲第四次任務

任務預覽(2天) 4.1實戰大項目:模擬登錄丁香園,並抓取論壇頁面所有的人員基本信息與回覆帖子內容。 注:丁香園論壇:http://www.dxy.cn/bbs/thread/626626#626626 我們可以通過查找<div

原创 可汗學院:統計學第二次學習

統計學第二次學習 中心極限定理: 中心極限定理是指概率論中討論隨機變量序列部分和分佈漸近於正態分佈的一類定理。這組定理是數理統計學和誤差分析的理論基礎,指出了大量隨機變量近似服從正態分佈的條件。它是概率論中最重要的一類定理,有廣泛

原创 Python爬蟲第二次任務

任務預覽(兩天) 2.1 學習beautifulsoup 1.學習beautifulsoup,並使用beautifulsoup提取內容。 2.使用beautifulsoup提取丁香園論壇的回覆內容。 注:丁香園直通點:http:/

原创 Python爬蟲第一次任務

任務預覽(2天) 1. 學習get與post請求,嘗試使用requests或者是urllib用get方法向https://www.baidu.com/發出一個請求,並將其返回結果輸出。 # 此代碼是使用requests庫向百度發出

原创 Python爬蟲第三次任務

任務預覽(2天) 3.1 安裝selenium並學習 3.1.1安裝selenium並學習。 3.1.2使用selenium模擬登陸163郵箱。 注:163郵箱直通點:https://mail.163.com/ 。 3.2 學習I

原创 可汗學院:統計學第一次學習

統計學第一次學習 樣本與總體: 均值:mean 衡量集中趨勢的方法。 中位數:median 考慮集中趨勢的另一種方式。 衆數:mode 也就是出現頻率最高的數字。 極差:range數字越大表示數據之間越分散、越小表示越緊密,用來衡