原创 DataWhale 組隊學習數據挖掘實踐 任務一

任務1 - 數據分析(2天) 數據集下載 這是我們本次實踐數據的下載地址  https://pan.baidu.com/s/1wO9qJRjnrm8uhaSP67K0lw 說明:這份數據集是金融數據(非原始數據,已經處理過了),我們要做的

原创 利用Python進行數據分析(十二) - pandas高級應用

注:本文根據《利用Python進行數據分析》總結而來,內容版權歸原作者所有。  

原创 DataWhale 組隊學習MySQL 任務一

任務一: 創建一個新的數據庫: create database DataWhale; use DataWhale; 項目一: 創建一個新表email create table email( id int not null prima

原创 利用Python進行數據分析(十三) - Python建模庫介紹

注:本文根據《利用Python進行數據分析》總結而來,內容版權歸原作者所有。 Patsy創建模型描述這一節雲裏霧裏,看不明白。

原创 數據挖掘實踐學習一 數據集處理 未完待續

前言 8月份參加的DataWhale組織的組隊學習活動,自以爲是地報了MySQL,數據挖掘和爬蟲,結果只有MySQL完成得還可以了,數據挖掘不厚道地隨便搞了一下,矇混過關,爬蟲搞了一半最後被請出了羣聊。 雖然沒有完成,但好處保留了這些資料

原创 利用Python進行數據分析(十) - 數據聚合與分組運算

注:本文根據《利用Python進行數據分析》總結而來,內容版權歸原作者所有。

原创 產品需求文檔PRD的相關內容

    本文根據北風網產品經理培訓課程整理而成的思維導圖,包括了產品需求文檔的內容、產品需求文檔的評估點。 內容版權屬北風網所有,本文作爲學習記錄及傳播知識用,不作商業用途。好好學習,天天向上。^_^ By Eason 2019-11-

原创 利用Python進行數據分析(六) - 數據加載、存儲和文件格式

注:本文根據《利用Python進行數據分析》總結而來,內容版權歸原作者所有。

原创 互聯網數據分析指標體系(待完善!)

互聯網行業有各種各樣的指標,我嘗試着將他們歸納到一個思維導圖裏面,但有些指標可能同時屬於多種類型,比如說,跳出率,可以是用戶行爲的指標,也可以網站運營的指標。 下面的圖參考了一些文章,做了一個初步的歸納,慢慢再完善。  

原创 DataWhale 組隊學習MySQL 任務四 已完成於2019-09-05

  項目十六 分數排名 (難度:中等) 依然是昨天的分數表,實現排名功能,但是排名需要是非連續的,如下: +-------+------+ | Score | Rank | +-------+------+ | 4.00 | 1 | |

原创 Hacker house blues: My life with 12 programmers, 2 rooms and one 21st-century dream

(曾經在阮一峯的博客上看到的一篇文章,心中有一些感慨,對於走過不少彎路的自己來講,如今也面臨着困境,不再年輕了,這種種,是外界環境的作用,也是選擇與堅持的結果) I came to San Francisco to change my l

原创 Seaborn總結思維導圖

發現這個思維導圖原來是18年10月份做的,學過的東西忘得差不多了。。。

原创 DataWhale 組隊學習數據挖掘實踐 任務三 和 四

任務3 - 建模 用邏輯迴歸、svm和決策樹;隨機森林和XGBoost進行模型構建,評分方式任意,如準確率等。(不需要考慮模型調參) 一、 使用邏輯迴歸 from sklearn.linear_model import SGDClass

原创 Matplotlib總結思維導圖

也是去年10月做的。

原创 DataWhale 組隊學習爬蟲 Task3

Task3 安裝selenium並學習和學習IP相關知識 3.1 安裝selenium並學習 安裝selenium並學習。 使用selenium模擬登陸163郵箱。 163郵箱直通點:https://mail.163.com/ 。 參考資