原创 《利用Python進行數據分析》第8章 繪圖和可視化筆記

matplotlib繪圖和可視化 matplotlib是一個用於創建出版質量圖表的桌面繪圖包(主要是2D方面)。繪圖是數據分析工作中最重要的任務之一,是探索過程的一部分。 import matplotlib.pyplot as p

原创 《利用Python進行數據分析》第7章 軸連接與數據轉換

軸連接 另一種數據合併運算也被稱作連接(concatenation)、綁定(binding)或堆疊(stacking)。NumPy有一個用於合併原始NumPy數組的concatenation函數。 In [2]: import p

原创 python安裝 numpy、matplotlib 和scipy

先安裝好成功python方可安裝其他第三方庫 1.安裝numpy 下載地址:https://pypi.python.org/pypi/numpy 選擇python安裝的版本,例如window上安裝的是python3.6版本的,

原创 pandas入門練習-數據結構

pandas 是python的一個數據分析包,是基於NumPy 的一種工具,該工具是爲了解決數據分析任務而創建的。提供了高效地操作大型數據集所需的工具,使得數據分析工作變着簡單高效。 pandas數據結構介紹 Series是一種類

原创 Matplotlib繪製折線圖

matplotlib包是目前繪製2D圖像最常用的python包,是一個數學繪圖庫,我們將使用它來製作簡單的圖表,如折線圖和散點圖等。數據可視化指的是通過可視化表示來探索數據。接下來開始學習簡單的繪圖知識。 使用matplotlib

原创 學習python,你要做的事情

人生苦短,要做正確的事情,積累自己 這個社會變化太快了,每天都在變,唯有不斷的學習纔不會落後。開始學習,做正確的事情吧! 現在開始學習python語言,通過每次學習來記錄自己所學的內容,作爲自己的學習筆記。離開學校工作之後不久,讓

原创 銀行貸款預測分析(Loan Prediction)

貸款數據的預測分析,通過使用python來分析申請人哪些條件對貸款有影響,並預測哪些客戶更容易獲得銀行貸款。 數據來源 Loan Prediction:https://datahack.analyticsvidhya.com/cont

原创 玩轉可視化繪圖 matplotlib簡單繪圖

matolotlib 基本圖形繪製 from pandas import Series,DataFrame import matplotlib.pyplot as plt import numpy as np import pandas

原创 《利用Python進行數據分析》第四章-numpy基礎

Numpy數組函數和數組數據處理 1.通用函數:快速的元素級數組函數 通用函數(即ufunc)是一種對ndarray中的數據執行元素級運算的函數。你可以將其看做簡單函數(接受一個或多個標量值,併產生一個或多個標量值)的矢量化包裝器。許多u

原创 《利用Python進行數據分析》第9章 分組級運算和轉換筆記

分組級運算和轉換 聚合是分組運算的其中一種。它是數據轉換的一個特例,它接受能夠將一維數組簡化爲標量值的函數。 接下來將介紹transform和apply方法,它們能夠執行更多其他的分組運算。 如果要爲一個DataFrame添加一個用於存放

原创 《利用Python進行數據分析》第9章 groupby技術和數據聚合筆記

groupby技術和數據聚合 對數據集進行分組並對各組應用一個函數(無論是聚合還是轉換),這是數據分析工作中的重要環節。在將數據集準備好之後,通常的任務就是計算分組統計或生成透視表 在本章中,你將會學到: - 根據一個或多個鍵(可以是函

原创 《利用Python進行數據分析》第7章 合併數據集

合併數據集 數據分析和建模方面的大量編程工作都是用在數據準備上的:加載、清理、轉換以及重塑。有時候,存放在文件或數據庫中的數據並不能滿足你的數據處理應用的要求。pandas對象中的數據可以通過一些內置的方式進行合併: pandas.me

原创 《利用Python進行數據分析》第10章 時間序列、日期和時間數據類型筆記

時間序列 日期和時間數據類型及工具 Python標準庫包含用於日期(date)和時間(time)數據的數據類型,還有日曆方面的功能。主要會用到datetime、time以及calendar模塊。datetime.datetime(也可以簡

原创 《利用Python進行數據分析》第五章 pandas的基本功能

介紹操作Series和DataFrame中的數據的基本功能 重新索引 pandas對象的一個重要方法是reindex,其作用是創建一個適應新索引的新對象。以之前的一個簡單示例來說 In [1]: from pandas import S

原创 統計學的假設檢驗

1.什麼是假設檢驗? 假設檢驗是一種規則,它根據數據樣本所提供的證據,指定是肯定還是否定有關總體的聲明。基本原理是先對總體的特徵作出某種假設,然後通過抽樣研究的統計推理,對此假設應該被拒絕還是接受作出推斷。 2.假設檢驗的基本思想 假