數據清洗|JSON格式

日拱一卒|數據挖掘004

格式、類型與編碼(二)

一、文件格式

2.常見的文本文件格式

(2)JSON格式

JSON被稱爲半結構化數據,雖然名字裏含有JavaScript字樣,但並非只限於在JavaScript中使用。名字只是陳述了該類型被設計用於序列化JavaScript對象這個事實。

半結構化數據集的特點是數據的值都有其相應的屬性標識,而且順序無關緊要,有時甚至可以缺失某些屬性。

JSON語法規則

JSON 語法是 JavaScript 語法的子集。

  • 數據在名稱/值對中
  • 數據由逗號分隔
  • 花括號保存對象
  • 方括號保存數組

JSON對象

對象是一個無序的“‘名稱/值’對”集合。

  • 以“{” 開始,“}” 結束
  • 每個“名稱”後跟一個“:”
  • “‘名稱/值’ 對”之間使用“,”分隔

JSON數組

數組是值(value)的有序集合。

  • 以“[”開始,“]”結束
  • 值間使用“,”分隔

JSON值

值(value)可以是雙引號括起來的字符串(string)、數值(number)、true、false、 null、對象(object)或者數組(array)。這些結構可以嵌套。

在線代碼格式轉化工具

對於JSON需要注意的有:

  • 字符串值必須使用雙引號進行封閉處理,因此,字符串內部的雙引號也都必須用反斜線轉義。
  • 逗號不可以出現在數字類型的數據中,除非這個值被當作字符串使用並用引號封閉

參考資料:
1.《乾淨的數據——數據清洗入門與實踐》
2.JSON 語法
3.介紹JSON

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章