【python&爬虫】快速入门JSON和JSONPath

一.JSON基本介绍

JSON(JavaScript Object notation)是一种轻量级的数据交换格式,更加易于阅读和编写,同时也方便了机器进行解析和生成。JSON适用于数据交互场景,如网站前台和后台之间的数据交互。JSONPath是一种信息抽取类库,用于从JSON文档中抽取指定信息

1.语法规则

JSON是比XML更简单的一种数据交换格式,它采用完全独立于编程语言的文本格式来存储和表示数据,其语法规则如下:

(1)使用键值对(key:value)表示对象属性和值
(2)使用逗号 , 分隔多条数据
(3)使用花括号 {} 包含对象
(4)使用方括号 [] 表示数组

2.JSON的取值

数字 字符串 逻辑值 数组 对象

3.JSON与XML比较

JSON和XML都是文本格式语言,它们经常用于数据交换和网络传输。JSON语法格式简单,层次结构清晰,比XML更易于阅读。并且它占用的字符量少,在网络数据传输时,能够节约带宽,提高传输效率

二.JSON模块介绍

1.基本介绍

从Python2.6开始加入了json模块,使用import json即可导入。json模块提供了Python对象的序列化和反序列化功能
(1)序列化(encoding):将一个python对象编码转换为JSON字符串的过程
(2)反序列化(decoding):将JSON字符串解码转换为Python对象的过程

2.json模块的基本应用

json模块提供了4个方法:dumps() dump() loads() load()
(1)dumps()用于将python类型编码为JSON字符串
(2)loads()用于把JSON字符串解码成python对象
(3)dump()将python类型序列化为JSON对象后写入文件
(4)load()读取文件中JSON形式的字符串元素,转换成python类型

3.JSON类型和Python类型对比

JSON Python
JSON Python
object dict
array list
string unicode
number(int) int,long
number(real) float
true True
false FALSE
null None

三.JSONPath基本介绍
JSONPath是一种信息抽取库,是从JSON文档中抽取指定信息的工具,提供了多种语言实现,包括JavaScript,Python,PHP和Java
安装JSONPath

pip install jsonpath

三.JSONPath语法

1.JSONPath语法基本了解

JSON结构清晰,可读性高,复杂度低,非常容易匹配。JSONPath的语法与Xpath类似

JSONPath 描述
$ 根节点
@ 现行节点,当前节点
.or[] 取子节点
不管什么位置,选择所有符合条件的节点
* 匹配所有元素
[] 迭代器标识,如数组下标
[,] 支持迭代器多选
?() 支持过滤操作
() 支持表达式计算

2.jsonpath入门案例

以下数据来自与肯德基官网,长沙市部分肯德基店信息

{
  "store": {
    "Table": [
      {
        "rownum": 1,
        "storeName": "银盆路",
        "addressDetail": "湖南银双路奥克斯广场一楼餐厅",
        "pro": "Wi-Fi,点唱机,礼品卡,生日餐会",
        "provinceName": "湖南省",
        "cityName": "长沙市"
      },
      {
        "rownum": 2,
        "storeName": "桐梓坡",
        "addressDetail": "湖南桐梓坡路星电光城一层",
        "provinceName": "湖南省",
        "cityName": "长沙市"
      },
      {
        "rownum": 3,
        "storeName": "国庆",
        "addressDetail": "湖南人民东路1号",
        "pro": "24小时,Wi-Fi,点唱机,礼品卡,生日餐会",
        "provinceName": "湖南省",
        "cityName": "郴州市"
      }
    ]
  }
}

1.导入相关包,读取json文件

在这里插入图片描述
2.相关操作
在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章