原创 python數據分析實戰---秦璐

講解: 一份數據分析報告 #既包含代碼又包含數據分析結果的PDF形式 Markdown寫法 :說明 code import pandas as pd 快捷切換 esc+m 變爲Markdown/esc+m 變爲code 圖形化呈

原创 APP Store評分案例

#調用基本包 import pandas as pd #數據讀取 app=pd.read_csv('w1_applestore.csv') #數據的基本信息 app.info() <class 'pandas.core.fr

原创 2.列表,字典,元組

列表 list1 = [1,2,3,4,5] #創建列表 list1 [1, 2, 3, 4, 5] list2 = ['a','b','c','d'] #列表中的數據類型可以是相同的 list2 ['a', 'b',

原创 sklearn案例

# 從sklearn.datasets 導入 iris數據加載器。 from sklearn.datasets import load_iris # 使用加載器讀取數據並且存入變量iris。 iris = load_iris()

原创 matplotlib數據可視化--折線圖

折線圖主要是看內容隨時間變化的趨勢情況 # 導入模塊 import pandas as pd import matplotlib.pyplot as plt # 設置中文編碼和負號的正常顯示 plt.rcParams['font

原创 優衣庫銷售數據分析

#1.加載工具包 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline #加載優衣庫文件 UN

原创 SQL積累

第一題 思路: 1.新建表Ta和Tb,統計出不同平臺間品牌A和品牌B的銷售額 2.連接表Ta和Tb,計算出銷售差距 3.這裏的英文表中引用了中文字段名,不確定這樣寫有問題沒有? select '平臺',(Tb.B1 - Ta

原创 matplotlib數據可視化--直方圖

直方圖主要反映一維數據分佈情況 import pandas as pd import matplotlib.pyplot as plt df = pd.read_excel(r'house_data.xlsx') df.hea

原创 matplotlib數據可視化--箱線圖

箱線圖一般用來展現數據的分佈(如上下四分位值、中位數等),同時,也可以用箱線圖來反映數據的異常情況。 boxplot函數的參數解讀 繪圖之前,我們先來講解一下matplotlib包中boxplot函數的參數含義及使用方法: plt

原创 EXCEL做數據分析-VLOOKUP

例一:病例信息 表格1,待匹配表格(一般包含大量的數據) 表格2,篩表格(數據包含於表格1) 表格3,篩選結果 函數VLOOKUP VLOOKUP(lookup_value,table_array,col_index_n

原创 基於 Python 的 11 種經典數據降維算法|ISOMAP

Isomap 即等度量映射算法,該算法可以很好地解決 MDS 算法在非線性結構數據集上的弊端。 MDS 算法是保持降維後的樣本間距離不變,Isomap 算法則引進了鄰域圖,樣本只與其相鄰的樣本連接,計算出近鄰點之間的距離,然後在此

原创 基於 Python 的 11 種經典數據降維算法|MDS(multidimensional scaling)降維算法

MDS(multidimensional scaling) MDS 即多維標度分析,它是一種通過直觀空間圖表示研究對象的感知和偏好的傳統降維方法。該方法會計算任意兩個樣本點之間的距離,使得投影到低維空間之後能夠保持這種相對距離從而

原创 基於 Python 的 11 種經典數據降維算法|線性-LDA(Linear Discriminant Analysis)降維算法

線性- LDA(Linear Discriminant Analysis)降維算法 LDA 是一種可作爲特徵抽取的技術,其目標是向最大化類間差異,最小化類內差異的方向投影,以利於分類等任務即將不同類的樣本有效的分開。LDA 可以提

原创 基於 Python 的 11 種經典數據降維算法---數據挖掘

基於 Python 的 11 種經典數據降維算法—數據挖掘 通常,我們會發現大部分數據集的維度都會高達成百乃至上千,而經典的 MNIST, 其維度都是 64。我們所用到的有用信息卻並不需要那麼高的維度,而且每增加一維 所需的樣本

原创 Python學習線路

python學習 1.python的基本知識 2.python做數據分析的基本庫:sklearn,Statsmodels,numpy,scipy,pandas 3.數據分析相關:數據抽取,清洗,轉換,建模,分析,展示 4.完善還需