台部落humashanshao

6、缺失數據缺失觀測及其類型：瞭解缺失信息、三種缺失符號、Nullable類型與NA符號、NA的特性、convert_dtypes方法缺失數據的運算與分組：加號與乘號規則、groupby方法中的缺失值填充與剔除：fillna方法

2020-06-30 05:06:07

01隨機事件與隨機變量關鍵詞：隨機現象、隨機試驗、E、相同條件重複進行、樣本空間、樣本點、隨機事件、必然事件、不可能事件 02數理統計與描述性分析 03常見分佈與假設檢驗 04方差分析

2020-06-22 17:24:06

2020-06-22 01:25:42

“2019未來杯高校AI挑戰賽 > 城市-房產租金預測” 目錄 “2019未來杯高校AI挑戰賽 > 城市-房產租金預測” 一、賽題概述賽題說明線上比賽數據發放與結果提交

2020-06-22 01:25:42

以下將從本次學習的六個環節進行總結：賽題分析此部分學習了EDA描述性統計分析。學習並掌握了缺失值分析、單調特徵列分析。數據分析的初步流程：查看標籤info——>具體分析標籤特徵（單調性、出現頻次、缺失率、分佈情況）——> 分析訓

2020-06-22 01:25:42

1線性迴歸模型：線性迴歸對於特徵的要求；處理長尾分佈；理解線性迴歸模型； 2模型性能驗證：評價函數與目標函數；交叉驗證方法；留一驗證方法；針對時間序列問題的驗證；繪製學習率曲線；繪製驗證曲線； 3嵌入式特徵選擇： Las

2020-06-22 01:25:42

由於task2打卡失誤，僅包含賽題理解，所以在task3中做一個補充~~ task2補充 EDA中使用到的基本方法： data.shape()查看數據行列總數 data.head().append(data.tail())查看首尾五行 d

2020-06-22 01:25:42

簡單加權融合: 迴歸（分類概率）：算術平均融合（Arithmetic mean），幾何平均融合（Geometric mean）；分類：投票（Voting) 綜合：排序融合(Rank averaging)，log融合 stacking/b

2020-06-22 01:25:42

Stacking !pip install mlxtend import warnings warnings.filterwarnings('ignore') import itertools import numpy as np i

2020-06-22 01:25:42

注：本文是學習+整理的筆記學習資料及學習團隊組織均爲DataWhale提供目錄一、基礎部分篩選數據 Series數據結構 DataFrame數據結構 apply函數索引分組變形合併一、基礎部分 im

2020-06-22 01:25:42

此次賽題內容爲二手車價格預測，本節主要理解字段及賽題要求。數據字段 SaleID - 銷售樣本ID name - 汽車編碼 regDate - 汽車註冊時間 model - 車型編碼 brand - 品牌 bodyType - 車身類型

2020-06-22 01:25:42

之前做的部分筆記，未完善。以後用到會再補充框架內容。

2020-05-12 07:30:52

環境使用：虛擬機VMware，Linux系統爲Ubuntu18.04，Hadoop最新版下載鏈接：VMware Ubuntu Hadoop 下載SecureCRT用於本地與Linux進行文件傳輸，點擊下載安裝指南未完

2020-05-07 15:34:03

使用環境：Anaconda3,Chorme 一個網絡爬蟲程序最普遍的過程：訪問站點；定位所需的信息；得到並處理信息。示例1：爬python官網的“python之禪” import requests url = 'https://

2020-04-23 09:06:43

注：本文是學習+整理的原創喔基礎部分 import pandas as pd import numpy as np 設置行列最大數 pd.set_option('max_column',8,'max_rows',10) 文件

2020-04-20 06:16:37