原创 泛統計理論初探——因子分析方法簡介

統計學習-初探因子分析方法 初探因子分析 在之前的文章裏,我們聊了主成分分析方法,這種方法廣泛應用於各種實際統計問題,可以被用來進行降維處理,減少了變量數目,並且新變量之間沒有相關性。今天我們來了解一下因子分析,因子分析從本質上來

原创 泛統計理論初探——數據清洗常見技巧

統計學習-數據清洗常見技巧 數據清洗的常見技巧探究 在本文中,將會介紹數據清洗中的常見技巧,主要是針對在真實場景中的數據處理,比如數據競賽、數據報告、商業分析等。數據清洗是在獲取到數據後的重要步驟,通常經過清洗後的數據是可以被用於

原创 泛統計理論初探——主成分分析方法簡介

統計學習-主成分分析方法介紹 探究主成分分析 今天我們來聊聊這個主成分分析方法,主成分分析方法是一種將統計問題中的自變量進行組合,組合成新的變量後,按照使用者需求,提取出最主要的變量的一種方法。主成分分析方法是一種比較常見的統計學

原创 LeetCode刷題——最長共同前綴

最長共同前綴題目的思路探討與源碼 該題的題目如下圖,核心是通過尋找字符串列表裏的所有字符串的最長共同前綴。 本人在看到該題目後,認爲問題的核心是尋找尋找最短的字符串,同時在這個基礎上去將最短的字符串進行分解,逐個字符地和其他字符

原创 泛統計理論初探——高階描述統計指標

統計學習-高階統計指標 再談描述性統計指標 在上一篇文章中,我們探討了一些最常見的統計指標:比如中位數,平均數,衆數等指標。其實上一篇文章討論的都是一階的統計指標,即根據當前的數據能夠直接計算或觀察得到的指標,這種一階指標不需要再

原创 泛統計理論初探——BP神經網絡初探

神經網絡學習-初探BP神經網絡 理解BP神經網絡 衆所周知,從上世紀80年代開始,有關神經網絡的研究就早已開始。而BP神經網絡作爲經典的神經網絡代表,是經常被各個領域的學科所使用的,比如預測股票、預測房價等。BP神經網絡其實應該被

原创 泛統計理論初探——淺談基本統計指標

統計學習-基本統計指標 淺談描述性統計指標 在我們對統計最早的認知中,描述性統計是我們最早接觸的概念,甚至有些概念在小學就有學到。常見的統計描述指標比如:平均數、衆數、中位數、方差、標準差、變異係數、偏度、峯度。理解這些指標對於初

原创 泛統計理論初探——文本挖掘中的詞袋模型

數據挖掘-初探文本挖掘 文本挖掘之詞袋模型 在我們開始接觸文本挖掘的時候,一般都會有疑問,什麼是文本挖掘,作者認爲可以通過文本挖掘來得出文章的主題、特徵等,也可以通過當前的詞義、語義、語境等上下文信息進行預測,文本挖掘的用處十分廣

原创 泛統計理論初探——Logistic模型探討

數據挖掘-Logistic模型探討 淺談Logistic迴歸 在經典的線性迴歸基礎上,我們知道,經典的線性迴歸是解決因變量是連續的變量的問題。而在現實生活中,因變量是離散變量更爲常見一些。爲了解決因變量是離散的問題,即分類問題,線