原创 統計學:統計基本概念

1.統計學含義 統計學,是一門關於數據收集、處理、分析、解釋,並從數據中得出結論的科學。 數據收集:取得數據 數據處理:用圖形等形式展示數據 數據分析:利用統計方法分析數據,並從數據中提取有用信息得出結論 數據解釋:對分析結果的

原创 SQL:認識數據庫

一、DBMS種類 二、DB結構 (一)RDBMS常見系統結構 RDBMS常見的系統結構爲:客戶端/服務器(C/S類型)。 (二)表的結構 表,管理數據的二維表,存儲在RDBMS管理的數據庫中。一個數據庫可以存儲多張表。 表的

原创 統計學:描述性統計分析

本文是對《Excel統計分析與應用》第3章的內容梳理,後續將會在此基礎上進行知識應用拓展的補充。 1.概述 拿到一份數據,怎樣去把握這份數據的分佈特徵呢?首先需要知道有哪些統計指標可以反映數據的分佈特徵。 因此,可以從以下3個方面

原创 Python:文件

一、文件 python.org:讀寫文件 本地文件路徑 # 本地文件的界定:指向一個本地存儲的文件,是一個鏈接或者一個映射 path1 = 'C:/Users/asus-1/Desktop/text.txt' # 單個

原创 Python:條件判斷與循環控制

一、語句 每一行代碼,都是一條語句。 語句分類: 最基本的語句:賦值語句,函數/方法。 條件語句:if。 循環語句:for/while。 函數語句:def等。 模塊語句:import。 # 函數 print(1) # 方法

原创 Python:序列

一、序列 python.org:序列類型 序列,是python最基本的數據結構。例如,X=[1,2,3],其中每一個元素都被分配了一個序號,即索引(元素的位置)。索引默認從0開始。 序列分類: 可變索引,列表List。 不可變索

原创 Python:模塊與包

一、模塊與包 python.org:模塊 python.org:包 python的概念層級: 表達式,創建、處理對象。 語句,包含表達式。 邏輯單元,函數/類,由語句組成。 模塊,.py文件。 包,定義一組有關係的文件或模塊(包

原创 Python:變量與數值類型

一、註釋 單行註釋 在python中,單行註釋以#開頭。 # 單行註釋 多行註釋 在python中,多行註釋有以下兩種表示方式: 1.使用3個單引號'''括起來; 2.使用3個雙引號"""括起來。 ''' 多行註釋寫法1 '''

原创 MySQL:2016年天貓雙11化妝品銷量數據分析

一、案例數據 數據來源 Kesci:Tmall_makeup 理解數據 數據集包括27599條記錄和7個特徵變量,數據字典如下: 字段 含義 update_time 交易時間 id 產品編號 title 產品

原创 Excel:TITANIC號乘客倖存特徵分析

一、案例背景 1912年4月10日,泰坦尼克號從英國南安普敦出發,途經法國盧森堡以及愛爾蘭昆士敦,駛向美國紐約。在4月14日深夜到4月15日凌晨,泰坦尼克號與冰山相撞後沉沒。由於船上沒有足夠的救生艇供所有人使用,導致2224名船員

原创 Python:解釋器

2.使用Pyhton解釋器 一、調用解釋器 -- 調用命令 python3.x -- 退出命令 -- Windows Ctrl + Z quit() 命令行 傳入參數 python -c 'command' [arg] ...

原创 MySQL:命令行導入數據報錯

使用MySQL命令行嘗試導入數據時,報瞭如下兩個錯誤。 一、錯誤1 錯誤原因:使用MySQL本地的客戶端加載數據到數據庫中時,需要得到服務器的允許。 解決方案如下:設置全局變量,並重啓客戶端。 (1)在命令行輸入set glob

原创 SQL:GROUPING運算符

MySQL:GROUPING 一、ROLLUP同時得出合計和小計 -- 使用GROUP BY無法得到合計行 SELECT product_type, SUM(sale_price) FROM Product GROUP BY

原创 SQL:窗口函數

一、窗口函數 窗口函數,即OLAP函數,用於對數據庫數據進行實時分析處理。 窗口函數分類: 1.能夠作爲窗口函數的聚合函數(SUM、AVG、COUNT、MAX、MIN) 2.RANK、DENSE_RANK、ROW_NUMBER 等

原创 Excel:數據處理

一、數據處理的內容 數據處理的內容主要有以下兩項: 1.數據清洗。將多餘重複的數據篩選出來,並剔除;將缺失的數據補足,將錯誤的數據糾正或刪除。 2.數據加工。對清洗過後的數據進行字段的信息提取、計算、分組、轉換等處理。 二、數據清