原创 【MYSQL】簡介

在數據分析師看來,MYSQL就是一個簡單而又必不可少的工具。只要能精準按業務需求在數據庫裏存數據、提取數據,爲業務數據分析提供源數據就足矣!什麼是數據庫在認識MYSQL之前,必須瞭解數據庫是什麼?答案是肯定的。我們平時說的數據庫表達的意思是

原创 【算法8】BP神經網絡

單層感知機多重感知機BP神經網絡注意自定義BP代碼importnumpyasnpimportmatplotlib.pyplotaspltdefsigmoid(x):return1/(1+np.exp(-x))defbpnet(X=None,

原创 【Pyton】支持向量機(SVM):對天氣的預測準確率很高嗎?

關於支持向量機,其原理講解不是本次博文記錄的主題,後面會用一篇文章專門記錄SVM的相關問題。這裏主要是對於天氣預測的問題,要怎樣處理數據,選取什麼核函數或模型,以及模型的調優和評估展開。這裏先貼一個 Notebook的筆記鏈接,在看完文章後

原创 【R】基於Logistic迴歸的初始信用評級

前言邏輯迴歸的因變量常爲二元分類變量(可爲多元),自變量可以是分類變量也可以是連續變量。他早就成爲各行業廣泛運用的分類模型之一。邏輯迴歸除了和其他模型一樣喜歡乾淨數據外,還特別喜歡因變量爲二分類變量的數據(多次重複,賊重要)。也就是當你的因

原创 【Spark】簡介

最近學習了spark大數據技術,這裏開始分享本階段的學習心得。作爲個人的【spark】系列,包含了spark的《簡介》,《RDD》,《DataFrame》,《GraphFrame》等板塊。下面進入第一個板塊——《簡介》。部分內容整理自辛立偉

原创 【EXCEL】在數據分析中的使用二

EXCEL之Index+Match+Offset+Countif+Vlookup函數首先必須對EXCEL的幾個函數進行深入理解:函數功能INDEX(C1, C2, C3)C1數組的行列隨意,函數返回C1中C2行C2列處的值Match(C1,