在巨大的数据量的情况下,做查找符合某种规则的Key的信息,这里就有两种方式:
keys命令:简单粗暴,但是由于Redis是单线程,keys命令是以阻塞的方式执行的,keys是以遍历的方式实现的复杂度是 O(n),Redis库中的key越多,查找实现代价越大,产生的阻塞时间越长。
scan命令: 以非阻塞的方式实现key值的查找,绝大多数情况下是可以替代keys命令的,可选性更强
1. scan相关命令
都是用于增量迭代集合元素。
SCAN 命令用于迭代当前数据库中的数据库键。
SSCAN 命令用于迭代集合键中的元素。
HSCAN 命令用于迭代哈希键中的键值对。
ZSCAN 命令用于迭代有序集合中的元素(包括元素成员和元素分值)。
之后的例子会以sscan为例
2. 命令参数
redis 127.0.0.1:6379> SSCAN key cursor [MATCH pattern] [COUNT count]
Key:查询的相关集合名称
cursor: 游标值,第一次迭代使用 0 作为游标,表示开始一次新的迭代
[MATCH pattern] : 模糊匹配
[COUNT count] :每次的查询条数,默认值为 10
2.1 创建数组
在上面这个例子中,
第一次迭代使用 0 作为游标,表示开始一次新的迭代。
第一次迭代使用 0 作为游标,表示开始一次新的迭代。
第二次迭代使用的是第一次迭代时返回的游标, 也即是命令回复第一个元素的值 —— 3 。
以 0 作为游标开始一次新的迭代, 一直调用 SCAN 命令, 直到命令返回游标 0 , 我们称这个过程为一次完整遍历(full iteration)。
在同一时间, 可以有任意多个客户端对同一数据集进行迭代, 客户端每次执行迭代都需要传入一个游标, 并在迭代执行之后获得一个新的游标, 而这个游标就包含了迭代的所有状态, 因此, 服务器无须为迭代记录任何状态,同样也不会阻塞线程
2.2 解读match
match: 通过提供一个 glob 风格的模式参数,让命令只返回和给定模式相匹配的元素。
前方高能预警:match的底层操作是在从数据集中取出元素之后,向客户端返回元素之前的这段时间内进行的, 如果返回的结果集中没有匹配,那么可能会在多次执行中都不返回任何元素。
所以单次返回的结果是空的并不意味着遍历结束,而要看返回的游标值是否为零;
2.3 解读count
count:可以控制每次返回结果的最大条数,count只是一个 hint,返回的结果可多可少.
注意
返回的结果可能会有重复,需要客户端去重复,这点非常重要;
遍历的过程中如果有数据修改,改动后的数据能不能遍历到是不确定的;