Python网络爬虫(二十三)——Redis

概述

redis 是一种支持分布式的非关系型数据库,数据是保存在内存中,同时 redis 可以定时把内存数据同步到磁盘,即可以将数据持久化,并且 Redis 比 memcached 支持更多的数据结构。

redis 和 memcached

  memcached redis
类型 纯内存数据库 内存磁盘同步数据库
数据类型 在定义 value 时就要固定数据类型 不需要
虚拟内存 不支持 支持
过期策略 支持 支持
存储数据安全 不支持 可以将数据同步到dump.db中
灾难恢复 不支持 可以将磁盘中的数据恢复到内存中
分布式 支持 主从同步
订阅与发布 不支持 支持

redis 在 ubuntu 系统中的安装与启动

  • 安装:
 sudo apt-get install redis-server
  •  卸载:
 sudo apt-get purge --auto-remove redis-server
  • 启动:redis 安装后,默认会自动启动,可以通过以下命令查看:
 ps aux|grep redis
  • 可以通过以下命令进行手动启动:
 sudo service redis-server start
  • 停止:
 sudo service redis-server stop

redis 在 windows 系统中的安装与启动

  • 下载:redis 官方是不支持 windows。而微软的开源部门将 redis 移植到了 windows 上。下载地址为 github 
  • 安装
  • 运行:终端定位到 Redis 的安装目录,
redis-server.exe redis.windows.conf
  • 连接:redis 和 mysql 以及 mongo 是一样的,都提供了一个客户端进行连接。输入命令 redis-cli (前提是 redis 安装路径已经加入到环境变量中了)就可以连接到 redis 服务器了

其他机器访问本机 redis 服务器

想要让其他机器访问本机的 redis 服务器。那么要修改 redis.conf 的配置文件,将 bind 改成 bind [自己的ip地址或者 0.0.0.0],其他机器才能访问。
注意:bind 绑定的是本机网卡的 ip 地址,而不是想让其它机器连接的 ip 地址。如果有多块网卡,那么可以绑定多个网卡的 ip 地址。如果绑定到额是 0.0.0.0,那么意味着其他机器可以通过本机所有的 ip 地址进行访问。

redis 常见操作

对 redis 的操作可以用两种方式,第一种方式采用 redis-cli,第二种方式采用编程语言,比如 Python、PHP 和 JAVA 等。

  • 启动 redis:
  sudo service redis-server start
  • 连接上 redis-server:
  redis-cli -h [ip] -p [端口]
  • 添加:
  set key value
  如:
  set username xiaotuo

将字符串值 value 关联到 key。如果 key 已经持有其他值,set 命令就覆写旧值,无视其类型。并且默认的过期时间是永久,即永远不会过期。

  • 删除:

del key
  • 设置过期时间:

  expire key timeout(单位为秒)

也可以在设置值的时候,一同指定过期时间:

set key value EX timeout
  • 查看过期时间:

ttl key
  • 查看当前 redis 中的所有 key:

  keys *

列表操作:

  • 在列表左边添加元素:
  lpush key value

将值 value 插入到列表 key 的表头。如果 key 不存在,一个空列表会被创建并执行 lpush 操作。当 key 存在但不是列表类型时,将返回一个错误。

  • 在列表右边添加元素:
  rpush key value

将值 value 插入到列表 key 的表尾。如果 key 不存在,一个空列表会被创建并执行 RPUSH 操作。当 key 存在但不是列表类型时,返回一个错误。

  • 查看列表中的元素:

  lrange key start stop

返回列表 key 中指定区间内的元素,区间以偏移量 start 和 stop 指定,如果要左边的第一个到最后的一个 lrange key 0 -1。

  • 移除并返回列表 key 的头元素:

  lpop key
  • 移除并返回列表的尾元素:
rpop key
  • 移除并返回列表 key 的中间元素:

  lrem key count value

将删除 key 这个列表中,count 个值为 value 的元素。

  • 指定返回第几个元素:

  lindex key index

将返回 key 这个列表中,索引为 index 的这个元素。

  • 获取列表中的元素个数:

      llen key
    
  • 删除指定的元素:

      lrem key count value
    

    根据参数 count 的值,移除列表中与参数 value 相等的元素。count的值可以是以下几种:

    • count > 0:从表头开始向表尾搜索,移除与 value 相等的元素,数量为 count
    • count < 0:从表尾开始向表头搜索,移除与 value 相等的元素,数量为 count 的绝对值
    • count = 0:移除表中所有与 value 相等的值。

set 集合操作

  • 添加元素:
  sadd set value1 value2....
  • 查看元素:
  smembers set
  • 移除元素:
  srem set member...
  • 查看集合中的元素个数:
  scard set
  • 获取多个集合的交集:
  sinter set1 set2
  • 获取多个集合的并集:
  sunion set1 set2
  • 获取多个集合的差集:
sdiff set1 set2

hash 哈希操作

  • 添加一个新值:

  hset key field value

将哈希表 key 中的域 field 的值设为 value。
如果 key 不存在,一个新的哈希表被创建并进行 HSET 操作。如果域 field 已经存在于哈希表中,旧值将被覆盖。

  • 获取哈希中的 field 对应的值:

  hget key field
  • 删除 field 中的某个 field:

  hdel key field
  • 获取某个哈希中所有的 field 和 value:

  hgetall key
  • 获取某个哈希中所有的 field:

  hkeys key
  • 获取某个哈希中所有的值:

hvals key
  • 判断哈希中是否存在某个 field:

hexists key field
  • 获取哈希中总共的键值对:

hlen field

事务操作

  • Redis 事务可以一次执行多个命令,事务具有以下特征:

  • 隔离操作:事务中的所有命令都会序列化、按顺序地执行,不会被其他命令打扰。
  • 原子操作:事务中的命令要么全部被执行,要么全部都不执行。
  • 开启一个事务:
  multi

以后执行的所有命令,都在这个事务中执行的。

  • 执行事务:

  exec

会将在 multi 和 exec 中的操作一并提交。

  • 取消事务:

  discard

会将 multi 后的所有命令取消。

  • 监视一个或者多个 key:

  watch key...

监视一个(或多个) key,如果在事务执行之前这个(或这些) key被其他命令所改动,那么事务将被打断。

  • 取消所有 key 的监视

  unwatch

发布/订阅操作:

  • 给某个频道发布消息:
  publish channel message
  • 订阅某个频道的消息:
  subscribe channel
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章