1 數據的預處理
數據審覈:檢查數據中是否有錯誤,主要從完整性和準確性兩個方面。對二手數據,則着重適用性和時效性。
數據篩選:根據需要找出符合特定條件的某類數據。
數據排序:按一定順序將數據排列
數據透視表
2 品質數據的整理與展示
對品質數據主要做分類整理,對數值型數據主要做分組整理。
1 分類數據的整理與展示
頻數與頻數分佈
分類數據的圖示
條形圖
帕累託圖:按各類別數據出現的頻數多少排序後繪製的條形圖
餅圖
環形圖:餅圖的擴展,去掉中間的“洞”
2 順序數據的整理與展示
以上方法也可使用
累計頻率和累計頻率
3 數值型數據的整理與展示
分類數據和順序數據的方法均可使用
數據分組:單變量分組和組距分組。分組原則“上組限不在內”——直方圖
原始數據——莖葉圖、箱線圖
時間序列數據——線圖
多變量數據:散點圖、氣泡圖、雷達圖
莖葉圖:由莖和葉組成,將數字分爲兩部分,高位數值作爲樹莖,而葉上只保留最後一個數字。
箱線圖:五數概括
氣泡圖:可用於展示三個變量之間的關係。一個放在橫軸,一個放在縱軸,第三個則用氣泡的大小表示。
雷達圖:也稱蜘蛛圖,是顯示多個變量的常用圖示方法。每個變量值的大小由半徑上的點到圓心的距離表示,再將同一樣本的值在P個座標上的點連線。n多邊形。