SPSS數據分析方法不知道如何選擇


一提到數學,高等數學,線性代數,概率論與數理統計,數值分析,空間解析幾何這些數學課程,頭疼呀。作爲文科生,遇見這些課程時,通常都是各種尋求幫助,班上有位宅男數學很厲害,各種被女生‘圍觀’,這數學爲什麼這麼難,學了有啥用呀。

有用的,當做數據分析的時候,使用到SPSS,在線SPSS分析的時候就知道用處了,在寫論文的時候會用到SPSS數據分析,工作的時候也會用到SPSS數據分析。此時才知道原來數學很重要。我的數學不好腫麼辦?聽我一 一道來。

1. 數據類型

學過數學的童鞋都知道,數學裏面分了兩類數據,離散和連續數據,聽上去文縐縐的,不懂。那我問男人和女人知道不,知道,對了這種就是離散數據。身高體重知道不,知道,這種就是連續數據。離散數據可以理解爲分類,類別,數個數;而連續數據理解爲算平均值,度量,比如平均身高,平均年齡,但不能說成是平均性別。離散和連續數據是數學上文縐縐的稱呼。如果我們是做數據分析,通常又換成另外一種稱呼,定類和定量數據。定類就是離散數據,定量就是連續數據。這點get到後,數據分析方法啥都不在話下,讓智能化軟件SPSSAU【備註:在線網頁版SPSS】這些去解決就好,默認出來智能化文字分析結果。

2. X和Y

除了數據類型外,數學上老是有一些符號,比如X,Y,Z, α, β,γ,還有好多拉丁符號,看着都頭疼,而且更糟糕的是發音還那麼奇怪。這些都是數學用詞,如果是數據分析,只需要知道X和Y就可以。爲什麼這麼簡單呢?數據分析通常是用於業務場景,讓所有人都會所有人都能懂的。而數學符號是專業性名詞,一小部分學習數學專業的人羣才懂。

而X,Y基本所有人都懂,平面二維式思維,如果加上Y就變成空間三維思維。這種會變得複雜難懂,而數據分析出來結果是讓人理解讓人懂的,越簡單易懂越有意義越有用的結論越受歡迎。因此從數據分析角度來看,只需要懂X,Y這兩個符號就OK。別小看X,Y這兩個符號,加上上述的數據類型,它們可以產生非常多的組合,也稱作分析方法。

有了X,Y,我們可以研究X和Y之間的關係情況,比如X對於Y的影響關係,X對於Y的差異關係等。下面一一講述。

3. X和Y的組合方法

再講組合之前,先單獨講下不區分X和Y的分析方法,如下表格:


當不需要區分不區分X和Y時,比如我只研究性別1個數據,或者只研究身高,體重情況如何等。並不需要研究關聯關係,所以並不涉及X和Y的關聯關係。這種都可統稱爲數據基本描述統計,當然數據類型不一樣時,方法不同。比如性別爲定類數據,這時用頻數分析;身高體重是定量數據,這時用描述分析。數據的基本描述統計是最基礎的數據分析方法,而且通常都需要做這類分析方法,因爲了解了基本情況是非常必要的。

接下來將下X和Y之間的關聯關係時,會使用到的數據研究方法;如下表格:


從上表可以看到,通常會涉及到差異關係,相關關係和影響關係共三類。比如不同性別的興趣愛好是否有差異,性別爲定類數據,興趣愛好也是定類數據;此時就應該使用交叉卡方分析方法。比如研究性別人羣體重是否有差異,性別爲定類數據,體重爲定量數據,此時就需要使用T檢驗;除此之外,如果想研究不同專業(理科、工科、文科)的體重差異時,此時應該使用方差分析。當X是定類數據,Y是定量數據,研究X對於Y的差異時,可以使用T檢驗和方差分析;區分在哪裏呢?如果X的類別個數(比如男和女)只有2個時,通常使用T檢驗;如果X的類別個數超過2個(比如理科、工科和文科)時,只能使用方差分析。差異關係就只能有3種,接下來繼續相關關係。

相關關係是研究X和Y的關係情況,比如身高和體重之間有沒有關係;X和Y均是定量數據;此時應該使用相關關係,再具體一點應該叫Pearson相關關係(相關關係的數學公式是Pearson這人發明的)。

最後一類是影響關係;X對於Y的影響;影響關係的分析方法區分,完全是根據Y的類別而定;比如Y是定量數據,我們則應該使用線性迴歸分析;如果Y爲定類數據,此時我們應該使用Logit迴歸分析,而具體再細分,Logit迴歸可以有:二元Logit迴歸,多分類Logit迴歸,區分在於Y,舉例如下表:


如果X影響Y時,Y只分爲兩類,購買和不購買,願意和不願意,是和否等,這時候就需要使用二元Logit迴歸分析;如果Y分爲n類(n>2)時,則需要使用多分類Logit迴歸。

數據類型,X和Y;這兩點搞明白後,絕大多數的數據研究方法都可以搞定,而這也是當前數學研究的核心思想。也是分析軟件的設計理念,網頁在線版本的SPSS即SPSSAU軟件平臺,它的設計核心理念就是這樣,只需要會區分數據類型,知道X和Y;就可以自己進行數據分析,其它的全部都可以直接由SPSSAU生成智能化文字結果;當然,分析方法還有很多的,比如因子分析,聚類分析等,這些方法不是研究X和Y的關聯性,而是別有用處。

4. 其它研究方法

除開X與Y的關聯關係研究,其實還有一些其它的研究方法;比如對於很多個X同時進行分析應該使用什麼方法呢?此時可能會結合分析用處而對應不同的方法;常見有因子分析和聚類分析兩種,如下表:


如果說了30句話,現在想把30句話概括濃縮成5個關鍵詞,這種就叫濃縮;此時需要使用因子分析;如果有300個人想進行分類,分成3類人羣,此時可使用聚類分析(常見是K-means聚類方法)。

除了濃縮和聚類,事實還有非常多其它的研究方法,比如信度研究,多因素方差,非參數檢驗,正態性檢驗,配對T檢驗等等。後續慢慢再談,更多知識也可使用網頁版SPSS即SPSSAU【備註:在線網頁版SPSS】進行學習,裏面智能化分析結果一目瞭然,‘拖拽點一下’完成分析得到智能化結果,更多研究方法的詳述也可直接查到。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章