分布式锁详细讲解——（具体业务场景的使用）小白酌情阅读，内容枯燥，附有详细代码讲解实现

技术2022-07-21 76

1.知识准备

必须的前置知识包括： Redis的基本命令 ** Spring的Java配置方式 JDK中的线程同步方式，例如synchronize关键字，Lock 等 ** 下列知识如果也会，会更轻松： SpringBoot基本使用 SpringDataRedis的基本使用 zookeeper的使用

2.什么是分布式锁

在讨论分布式锁前，我们先假设一个业务场景：

2.1.业务场景

我们假设一个这样的业务场景：在电商中，用户购买商品需要扣减商品库存，一般有两种扣减库存方式：下单减库存优点：用户体验好，下单成功，库存直接扣除，用户支付不会出现库存不足情况缺点：用户一直不付款，这个商品的库存就会被占用，其他人就无法购买了。支付减库存优点：不会导致库存被恶意锁定，对商家有利缺点：用户体验不好，用户支付时可能商品库存不足了，会导致用户交易失败那么，我们一般为了用户体验，会采用下单减库存。但是为了解决下单减库存的缺陷，会创建一个定时任务，定时去清理超时未支付的订单。在这个定时任务中，需要完成的业务步骤主要包括：

查询超时未支付订单，获取订单中商品信息修改这些未支付订单的状态，为已关闭恢复订单中商品扣减的库存如图：但是，如果我们给订单服务搭建一个100台服务节点的集群，那么就会在同一时刻有100个定时任务触发并执行，设想一下这样的场景：订单服务A执行了步骤1，但还没有执行步骤B 订单服务B执行了步骤1，于是查询到了与订单服务A查询到的一样的数据订单服务A执行步骤2和3，此时订单中对应商品的库存已经恢复了订单服务B也执行了步骤2和步骤3，此时订单中对应商品的库存再次被增加库存被错误的恢复了多次，事实上只需要执行一次就可以了。就像这样：因为任务的并发执行，出现了线程安全问题，商品库存被错误的增加了多次，你能想到解决办法吗

2.2.为什么需要分布式锁

对于线程安全问题，我们都很熟悉了，传统的解决方案就是对线程操作资源的代码加锁。如图：理想状态下，加了锁以后，在当前订单服务执行时，其它订单服务需要等待当前订单服务完成业务后才能执行，这样就避免了线程安全问题的发生。但是，这样真的能解决问题吗？答案时否定的，为什么？

2.2.1.线程锁

我们通常使用的synchronized或者Lock都是线程锁，对同一个JVM进程内的多个线程有效。因为锁的本质是内存中存放一个标记，记录获取锁的线程时谁，这个标记对每个线程都可见。获取锁：就是判断标记中是否已经有线程存在，如果有，则获取锁失败，如果没有，在标记中记录当前线程释放锁：就是删除标记中保存的线程，并唤醒等待队列中的其它线程因此，锁生效的前提是：互斥：锁的标记只有一个线程可以获取共享：标记对所有线程可见然而我们启动的多个订单服务，就是多个JVM，内存中的锁显然是不共享的，每个JVM进程都有自己的锁，自然无法保证线程的互斥了，如图：要解决这个问题，就必须保证各个订单服务能够共享内存中的锁标记，此时，分布式锁就闪亮登场了！

2.2.2.分布式锁

线程锁时一个多线程可见的内存标记，保证同一个任务，同一时刻只能被多线程中的某一个执行。但是这样的锁在分布式系统中，多进程环境下，就达不到预期的效果了。而如果我们将这个标记变成多进程可见，保证这个任务同一时刻只能被多个进程中的某一个执行，那这样的锁就是分布式锁了。

分布式锁实现有多种方式，其原理都基本类似，只要满足下列要求即可：多进程可见：多进程可见，否则就无法实现分布式效果

互斥（）：同一时刻，只能有一个进程获得锁，执行任务后释放锁可重入（可选）：同一个任务再次获取改锁不会被死锁阻塞锁（可选）：获取失败时，具备重试机制，尝试再次获取锁性能好（可选）：效率高，应对高并发场景高可用：避免锁服务宕机或处理好宕机的补救措施常见的分布式锁实现方案包括：基于数据库实现、基于缓存实现、基于zookeeper 等。

3.Redis实现分布式锁

按照上面的分析，实现分布是锁要满足五点：多进程可见，互斥，可重入，阻塞，高性能，高可用等。我们来看看Redis如何满足这些需求。

3.1.版本1-基本实现

第一次尝试，我们先关注其中必须满足的2个条件： 1、多进程可见 2、互斥，锁可释放 1）多进程可见首先Redis本身就是基于JVM之外的，因此满足多进程可见的要求。 2）互斥互斥就是说只能有一个进程获取锁标记，这个我们可以基于Redis的setnx指令来实现。setnx是set when not exits的意思。当多次执行setnx命令时，只有第一次执行的才会成功并返回1，其它情况返回0：多个进程来对同一个key执行setnx操作，肯定只有一个能执行成功，其它一定会失败，满足了互斥的需求。 3）释放锁释放锁其实只需要把锁的key删除即可，使用del xxx指令。不过，仔细思考，如果在我们执行del之前，服务突然宕机，那么锁岂不是永远无法删除了？！为了避免因服务宕机引起锁无法释放问题，我们可以在获取锁的时候，给锁加一个有效时间，当时间超出时，就会自动释放锁，这样就不会死锁了。但时setnx指令没有设置时间的功能，我们要借助于set指令，然后结合set的 NX和PX参数来完成。其中可以指定这样几个参数：因此，获取和释放锁的基本流程如图：步骤如下： 1、通过set命令设置锁 2、判断返回结果是否是OK 1） Nil，获取失败，结束或重试（自旋锁） 2） OK，获取锁成功执行业务释放锁，DEL 删除key即可 3、异常情况，服务宕机。超时时间EX结束，会自动释放锁

3.2.版本2-互斥性

刚才的初级版本中，会有一定的安全问题。大家思考一下，释放锁就是用DEL语句把锁对应的key给删除，有没有这么一种可能性：

3个进程：A和B和C，在执行任务，并争抢锁，此时A获取了锁，并设置自动过期时间为10sA开始执行业务，因为某种原因，业务阻塞，耗时超过了10秒，此时锁自动释放了B恰好此时开始尝试获取锁，因为锁已经自动释放，成功获取锁A此时业务执行完毕，执行释放锁逻辑（删除key），于是B的锁被释放了，而B其实还在执行业务此时进程C尝试获取锁，也成功了，因为A把B的锁删除了。问题出现了：B和C同时获取了锁，违反了互斥性！如何解决这个问题呢？我们应该在删除锁之前，判断这个锁是否是自己设置的锁，如果不是（例如自己的锁已经超时释放），那么就不要删除了。

那么问题来了：如何得知当前获取锁的是不是自己呢？我们可以在set 锁时，存入当前线程的唯一标识！删除锁前，判断下里面的值是不是与自己标识释放一致，如果不一致，说明不是自己的锁，就不要删除了。流程如图：

3.3.版本3-重入性

接下来我们来看看分布式锁的第三个特性，重入性。如果我们在获取锁以后，执行代码的过程中，再次尝试获取锁，执行setnx肯定会失败，因为锁已经存在了。这样有可能导致死锁，这样的锁就是不可重入的。如何解决呢？当然是想办法改造成可重入锁。

3.4.1.重入锁

什么叫做可重入锁呢？可重入锁，也叫做递归锁，指的是在同一线程内，外层函数获得锁之后，内层递归函数仍然可以获取到该锁。换一种说法：同一个线程再次进入同步代码时，可以使用自己已获取到的锁。

可重入锁可以避免因同一线程中多次获取锁而导致死锁发生。那么，如何实现可重入锁呢？获取锁：首先尝试获取锁，如果获取失败，判断这个锁是否是自己的，如果是则允许再次获取，而且必须记录重复获取锁的次数。释放锁：释放锁不能直接删除了，因为锁是可重入的，如果锁进入了多次，在内层直接删除锁，导致外部的业务在没有锁的情况下执行，会有安全问题。因此必须获取锁时累计重入的次数，释放时则减去重入次数，如果减到0，则可以删除锁. 因此，存储在锁中的信息就必须包含：key、线程标识、重入次数。不能再使用简单的key-value结构，这里推荐使用hash结构： key：lock hashKey：线程信息 hashValue：重入次数，默认1

3.4.2.流程图

需要用到的一些Redis命令包括： EXISTS key：判断一个Key是否存在 HEXISTS key field：判断一个hash的field是否存在 HSET key field value ：给一个hash的field设置一个值 HINCRBY key field increment：给一个hash的field值增加指定数值 EXPIRE key seconds：给一个key设置过期时间 DEL key：删除指定key 具体流程如图：下面我们假设锁的key为lock，hashkey为当前的id，threadId，锁自动释放的时间为：20。获取锁的步骤： 1、判断lock是否存在 EXISTS lock 存在，说明有人获取锁了，下面判断是不是自己的锁判断当前线程id作为hashKey是否存在： HEXISTS lock threadId 不存在，说明锁已经有了，且不是自己获取的，锁获取失败，end 存在，说明是自己获取的锁，重入次数+1： HINCRBY lock threadId 1 ，去到步骤3 2、不存在，说明可以获取锁， HSET key threadId 1 3、设置锁自动释放时间， EXPIRE lock 20 释放锁的步骤：

1、判断当前线程id作为hashKey是否存在： HEXISTS lock threadId 不存在，说明锁已经失效，不用管了存在，说明锁还在，重入次数减1： HINCRBY lock threadId -1 ，获取新的重入次数 2、判断重入次数是否为0：为0，说明锁全部释放，删除key： DEL lock 大于0，说明锁还在使用，重置有效时间： EXPIRE lock 20

3.4.Lua脚本

上面探讨的Redis锁实现方案都忽略了一个非常重要的问题：原子性问题。无论是获取锁，还是释放锁的过程，都是有多行Redis指令来完成的，如果不能保证这些Redis命令执行的原子性，则整个过程都是不安全的。而Redis中支持以Lua脚本来运行多行命令，并且保证整个脚本运行的原子性。接下来，我们分几块来学习Lua脚本的使用： Redis中如何执行Lua脚本 Lua脚本的基本语法编写上述分布式锁对应的Lua脚本

3.4.1.Redis中如何执行Lua脚本与操作Lua相关的命令如下：

命令及描述 1 、EVAL script numkeys key [key …] arg [arg …] 执行 Lua 脚本。

2、 EVALSHA sha1 numkeys key [key …] arg [arg …] 执行 Lua 脚本。

3、 SCRIPT EXISTS script [script …] 查看指定的脚本是否已经被保存在缓存当中。

4 、SCRIPT FLUSH 从脚本缓存中移除所有脚本。

5、 SCRIPT KILL 杀死当前正在运行的 Lua 脚本。

6、 SCRIPT LOAD script 将脚本 script 添加到脚本缓存中，但并不立即执行这个脚本。其中我们会用到的几个： EVAL命令：直接执行一段脚本，参数包括： script：脚本内容，或者脚本地址 numkeys：脚本中用到的key的数量，接下来的numkeys个参数会作为key参数，剩下的作为arg参数 key：作为key的参数，会被存入脚本环境中的KEYS数组，角标从1开始 arg：其它参数，会被存入脚本环境中的ARGV数组，角标从1开始

示例： EVAL "return 'hello world!'" 0 ，其中： "return 'hello world!'" ：就是脚本的内容，直接返回字符串，没有别的命令 0 ：就是说没有用key参数，直接返回效果：

SCRIPT LOAD命令：将一段脚本编译并缓存起来，生成一个SHA1值并返回，作为脚本字典的key，方便下次使用。参数script就是脚本内容或地址。

以之前案例中的的脚本为例：此处返回的ada0bc9efe2392bdcc0083f7f8deaca2da7f32ec就是脚本缓存后得到的sha值。在脚本字典中，每一个这样的sha1值，对应一段解析好的脚本： EVALSHA 命令：与EVAL类似，执行一段脚本，区别是通过脚本的sha1值，去脚本缓存中查找，然后执行，参数： sha1：就是脚本对应的sha1值我们用刚刚缓存的脚本为例：

3.4.2.Lua脚本的基本语法

Lua的详细语法大家可以参考网站上的一些教学，例如：Lua菜鸟教程，任何语言都是从基本的如：变量、数据类型、循环、逻辑判断、运算、数组等入手。相信熟悉java的你应该可以快速上手Lua。我们的分布式锁脚本中，主要用到的是对Redis指令的调用，还有 if … else 这样的逻辑判断，再加上一些变量声明等。因此我们从这几块入手，看一些简单命令即可： 1）变量声明声明一个局部变量，用local关键字即可：

local a= 23

2）打印结果

print "hello word"

3）条件控制

if (布尔表达式1) then --(在布尔表达式1为ture时执行该语句块) elself(布尔表达式2) then --(在布尔表达式2为ture时执行该语句块) else --（如果以上表达式都不为ture时执行该语句块） end

4）循环语句：

while(ture) do print("循环永远执行下去") end

注意，使用break可以跳出循环。大家能否利用上述语法编写一个猜数字的小游戏？

提示： io.read("*num") 可以用来读取一个用户输入的数字

代码示例：

while (ture) do print ("请输入一个数字"); local a = io.read("*num") if (a > 100) then print ("太大了") elself(a < 100) then print("太小了") else print("猜对了") break end end

5）Lua调用Redis指令当我们再Redis中允许Lua脚本时，有一个内置变量redis，并且具备两个函数： redis.call("命令名称", 参数1，参数2 ...) : 执行指定的redis命令，执行遇到错误会直接返回错误 redis.pcall("命令名称", 参数1，参数2 ...) : 执行指定的redis命令，执行遇到错误会错误以Lua表的形式返回例如：

redis.call (SET'num''123')

这行lua脚本的含义就是执行Redis的命令：set num 123 不过，我们编写脚本时并不希望把set后面的key和value写死，而是可以由调用脚本的人来指定，把key 和value作为参数传入脚本中执行。还记得redis中的EVAL命令吗？

EVAL script numkeys key [key ...] arg [arg ...]

EVAL执行脚本时可以接受参数，key和arg，并且会用两个内置变量（数组格式）来接受用户传入的key和 arg参数： KEYS：用来存放key参数 ARGV：用来存放除Key以外的参数我们在脚本中，可以从数组中根据角标（Lua中数组角标时从1开始）取出用户传入的参数，像这样：

redis.call SET('KEYS' ARGV[1])

而后，我们在执行脚本时可以动态指定key及需要存放的value值：

EVAL "return redis.call('SET', KEYS[1], ARGV[1])" 1 num 666

3.4.3.编写分布式锁的Lua脚本接下来，我们就可以将上面的分布式锁思路用Lua脚本来实现了。 1）普通互斥锁先看版本的实现获取锁：直接使用客户端的 set nx ex命令即可，无需脚本释放锁：因为要判断锁中的标识是否时自己的，因此需要脚本，如下：

--判断锁是否是自己的 if（redis.call('GET' KEYS[1])==ARGV[1]） then --是否删除锁 return redis.call('DEL' KEYS[1]) end --不是直接返回 return 0;

参数的含义说明： KEYS[1]：就是锁的key，比如"lock" ARGV[1]：就是线程的唯一标识，可以时随机字符串

2）可重入锁：首先是获取锁：

local key = KEYS[1]; -- 锁的key local threadld = ARGV[1]; --线程唯一标识 local releaseTime = ARGV[2]; --锁的自动释放时间 if( redis. call('exists', key) == 0) then --判断是否存在 redis.call('hset', key, threadId, '1'); -- 不存在, 获取锁 redis.call('expire', key, releaseTime); -- 设置有效期 return 1; -- 返回结果 end; if(redis.call('hexists', key, threadId) == 1) then -- 锁已经存在，判断threadId是否是自己 redis.call('hincrby', key, threadId, '1'); -- 不存在, 获取锁，重入次数+1 redis.call('expire', key, releaseTime); -- 设置有效期 return 1; -- 返回结果 end； return 0; -- 代码走到这里,说明获取锁的不是自己，获取锁失败然后是释放锁： local key = KEYS[1]; --锁的key local threadld = ARGV[1]; --线程唯-标识 local releaseTime = ARGV[2]; --锁的自动释放时间 if (redis.call('HEXISTS; key, threadld) = 0) then --判断当前锁是否还是被自己持有 return nil; --如果已经不是自己，则直接返回 end; local count = redis.callC'HINCRBY", key. threadld, 1); --是自己的锁，则重入次数1 if (count> 0) then --判断是否重入次数是否已经为 redis.call('EXPIRE, key, releaseTime); -- 大于说明不能释放锁，重置有效期然后返回 return nil; else redis.call('DEL', key);- - 等于说明可以释放锁，直接删除 return nil; end;

3.5.Redis客户端调用Lua

脚本编写完成，还需要通过客户端来调用lua脚本，封装一个获取和释放锁的工具。首先我们创建一个工程：填写信息：选择依赖：在配置文件中引入Redis的地址信息：

spring.redis.host =192.168.150.101

3.5.1.锁接口首先定义一个锁接口，定义锁中的方法

” package cn itcast. demolocki public interface RedisLock { /** 获取锁 @param releaseTime ”@return **/ boolen tryLock(long releaseTime); /** 释放锁 */ void unlock(); }

3.5.2.实现类

我们通过Spring提供的RedisTemplate来操作lua脚本， RedisTemplate 中提供了一个方法，用来执行Lua 脚本：

@override public<T>T execute(RedisScript<T>script,List<K>keys,object...args) { return scriptExecutor .execute(script, keys, args) ; }

包含3个参数： RedisScript script ：封装了Lua脚本的对象 List keys ：脚本中的key的值 Object … args ：脚本中的参数的值因此，要执行Lua脚本，我们需要先把脚本封装到 RedisScript 对象中，有两种方式来构建 RedisScript 对象： 1）通过RedisScript中的静态方法：

static <T> RedisScript of(String script, Class<T>resultType) { Assert.notNull (script, message: "Script must not be null!") ; Assert .notNull (resultType, message: "ResultType must not be null!") ; return new De faultRedisSqript(script, resultType);

这个方法接受两个参数： String script ：Lua脚本 Class resultType ：返回值类型需要把脚本内容写到代码中，作为参数传递，不够优雅。 2)自己创建DefaultRedisScript 另-种方式，就是自己去创处Rdiscipet 的实现类Deuedisript的对象:

//创建脚本对象 DefaultRedisScript<Long> script = new DefaultRedisScript<>(); //没置脚本数据源， Mclasspath 读取 script . setScriptSource (new ResourceScriptSource (new ClassPathResource("lock.lua"))); //设置返回值类型 script . setResultType(Long.class);

可以把脚本文件写到lasspath下的某个位置，然后通过加载这个文件来获取脚本内容,并设置给DefaultRedisScript实例。此处我们选择方式二，方便后期对脚本文件的维护。首先在classpath中编写两个Lua脚本文件: 然后编写一个新的RedisLock实现：ReentrantRedisLock，利用静态代码块来加载脚本并初始化：中,加载脚本文件的代码如下:

public class ReentrantRedisLock { //获取锁的脚本 private static final DefaultRedisScriptLong> LOCK SCRIPT; /释放锁的脚本 private static final DefaultRedisScriptObject> UNLOCK SCRIPE static /加载获取锁的脚本 LOCK_ SCRIPT = new DefaultRedisScript>(); LOCK_ SCRIPT.setScriptSource new ResourceScriptSource( new ClassPathResource("lock.lua"))); LOCK SCRIPT. setResultType( Long. class) ; //加载释放锁的脚本 UNLOCK_ SCRIPT= new DefaultRedisScript>( ); UNLOCK_ SCRIPTsetScriptS ource new ResourceScriptSource new ClassPathResource("unlock.lua'))); /其它代码略 }

然后实现RedisLock接口,实现其中的抽象方法，完整代码如下:

package cn . itcast . demo.lock; import org . springframework core . io. ClassPathResource; import org . springframework data . redis . core . StringRedis Template ; import org . springframework data . redis. core . script. DefaultRedisScript import org . springframework scripting . support . ResourceScriptSource ; import java. util Collections import java. util.UUID; public class ReentrantRedisL ock implements RedisLock { private StringRedisTemplate redisTemplate ; /** 设定好锁对应的key */ private String key; /** *存入的线程信息的前缀，防止与其它JVM中线程信息冲突 */ private final String ID_ PREFIX = UID. randomUUID() . toString(); public Reentr antRedisLock(Str ingRedisTemplate redisTemplate， String key) { this. redisTemplate = redisTemplate; this.key = key; private static final DefaultRedisScript<Long> LOCK_ SCRIPT; private static final DefaultRedisScript<Object> UNLOCK_ SCRIPT; static { //加载释放锁的脚本 LOCK_ SCRIPT = new DefaultRedisScript<>(); LOCK_ SCRIPT. setScriptSource( new ResourceScr iptSource( new ClassPathResource("lock .1ua"))); LOCK SCRIPT. setResultType(Long.class); //加载释放锁的脚本 UNL0CK_ SCRIPT = new DefaultRedisScript<>(); UNLOCK_ SCRIPT. setScriptSource( new ResourceScr iptSource( new ClassPathResource("unlock.1ua"))); //锁释放时间 private String releaseTime; @Override public boolean tryLock(long releaseTime) { //记录释放时间 this. releaseTime = String . value0f( releaseTime); //执行脚本 Long result = redisTemplate . execute( LOCK_ SCRIPT , Collections . singletonList(key), ID_ PREFIX + Thread . currentThread() . getId()，this. releaseTime); //判断结果 return result != nu1l && result . intValue() == 1; } @Override public void unlock() { //执行脚本 redisTemplate . execute( UNLOCK_ SCRIPT, Collections . singletonList(key)， ID_ PREFIX + Thread . currentThread() . getId()，this. releaseTime); }

3.5.3.获取锁的工厂

定义一个工厂，用来生成锁对象： package cn . itcast . demo. lock; import org . springframework beans . fa ctory- annotation . Autowired ; import org . springframework data . redis. core . StringRedis Template ; import org . springframework stereotype . Component ; @Component public cla ss RedisL ockFactory { @Autowired private StringRedisTemplate redisTemplate ; public RedisLock getReentrantLock(String key){ return new ReentrantRedisL ock(redisTemplate, key);

3.5.4.测试

我们定义一个定时任务，模拟清理订单的任务： package cn. itcast . demo. task; import cn. itca st . demo. lock. RedisLock; import cn. itcast . demo. lock. RedisL ockFactory; import lombok . extern. slf4j . SIf4j; import org . springframework beans . fa ctory. annotation . Autowired ; import org . springframework scheduling . annotation . Scheduled; import org . springframework stereotype . Component ; @SIf4j @Component public class ClearOrderTask { @Autowired private RedisL ockFactory redisL ockFactory; @Scheduled(cron = "0/10 * * ? * *) public synchronized void clearOrderTask () throws InterruptedException { /执行任务 clearOrder (); private void clearOrder() throws InterruptedException { log.info("开始清理未支付订单"); Thread . sleep(500); log- info("恢复数据库库存!"); }

接下来，我们给任务加锁：

@SIf4j @Component public class ClearOrderTask { @Autowired private RedisLockFactory redisL ockFactory; @Scheduled(cron =“0/10 pubic synchronized void clearorderask() throws IneruptedException ( //获取锁对象 RedisLock lock= redislockfactory. getReentrantLock("lock"); //尝试加锁 boolean isLock = lock.tryLock<50); /判断是否成功 if( !isLock){ //获取锁失败，结束任务 log. error“获取锁失败，任务终止!"); return : try { log. info(“获取锁成功，开始执行任务); //执行任务 clearOrder(); finally { /释放锁 log. warn("任务结束，释放锁); lock. unlock(); private void clearOrder() throws InterruptedException { log. info("开始清理未支付订单"); Thread . sleep(500) ; log- info("恢复数据库库存!");

将启动项复制2份（或多分），测试锁是否能生效：修改第二个启动项的端口，避免冲突：同时启动2个启动项，查看日志：第一个服务：第二个服务：可以看到：在13:39:50秒时，8081服务获取锁失败，而8082服务获取锁成功在13:40:00秒时，8082服务获取锁失败，而8081服务获取锁成功

3.6.Redis锁的其它特性

在一开始介绍分布式锁时，我们聊到分布式锁要满足的一些特性：多进程可见：多进程可见，否则就无法实现分布式效果。互斥：同一时刻，只能有一个进程获得锁，执行任务后释放锁可（可选）：同一个任务再次获取改锁不会被死锁阻塞锁（可选）：获取失败时，具备重试机制，尝试再次获取锁性能好（可选）：效率高，应对高并发场景。高可用：避免锁服务宕机或处理好宕机的补救措施目前在Redis中我们已经实现了：多进程可见互斥可重入剩下的几个特性也并非不能满足，例如：我们现在的代码中获取锁失败就立即结束，可以修改代码为失败后不断重试，直到某个指定的超时时间后才结束。

// 订阅频道，等待锁被释放通知 countdownlauch while(true){ // 获取锁，如果超过一定时间， break; } pubsub 发布订阅，

2）性能好 Redis一向以出色的读写并发能力著称，因此这一点没有问题 3）高可用单点的redis无法保证高可用，因此一般我们都会给redis搭建主从集群。但是，主从集群无法保证分布式锁的高可用特性。在Redis官网上，也对这种单点故障做了说明：在这种场景（主从结构）中存在明显的竞态:

客户端A从master获取到锁在master将锁同步到slave之前，master宕掉了。slave节点被晋级为master节点客户端B取得了同一个资源被客户端A已经获取到的另外一个锁。安全失效！有时候程序就是这么巧，比如说正好一个节点挂掉的时候，多个客户端同时取到了锁。如果你可以接受这种小概率错误，那用这个基于复制的方案就完全没有问题因此，Redis的作者又给出了一种新的算法来解决整个高可用问题，即Redlock算法，摘抄了算法的介绍如下：在Redis的分布式环境中，我们假设有5个Redis master。这些节点完全互相独立，不存在主从复制或者其他集群协调机制。我们确保将在每个实例上使用之前介绍过的方法获取和释放锁，这样就能保证他们不会同时都宕掉。实现高可用。为了取到锁，客户端应该执行以下操作:获取当前Unix时间，以毫秒为单位。依次尝试从N个实例，使用相同的key和随机值获取锁。在步骤2，当向Redis设置锁时,客户端应该设置一个网络连接和响应超时时间，这个超时时间应该小于锁的失效时间。例如你的锁自动失效时间为10秒，则超时时间应该在5-50毫秒之间。这样可以避免服务器端Redis已经挂掉的情况下，客户端还在死死地等待响应结果。如果服务器端没有在规定时间内响应，客户端应该尽快尝试另外一个Redis实例。客户端使用当前时间减去开始获取锁时间（步骤1记录的时间）就得到获取锁使用的时间。当且仅当从大多数（这里是3个节点）的Redis节点都取到锁，并且使用的时间小于锁失效时间时，锁才算获取成功。如果取到了锁，key的真正有效时间等于有效时间减去获取锁所使用的时间（步骤3计算的结果）。如果因为某些原因，获取锁失败（没有在至少N/2+1个Redis实例取到锁或者取锁时间已经超过了有效时间），客户端应该在所有的Redis实例上进行解锁（即便某些Redis实例根本就没有加锁成功）。不过，这种方式并不能完全保证锁的安全性，因为我们给锁设置了自动释放时间，因此某些极端特例下，依然会导致锁的失败，例如下面的情况： .如果Client 在持有锁的时候，发生了一一次很长时间的6C超过了锁的过期时间。锁就被释放了。这个时候Client2又获得了一把锁, 提交数据。 .这个时候Client 以FGC中苏醒过来了,又-一次提交数据。冲突发生了还有一种情况也是因为锁的超时释放问题，例如: :Client1从A. B. D、E五个节点中,获取了A. B. c三个节点获取到锁,我们认为他持有了锁这个时候，于B的系统时间比别的系统走得快，B就会先于其他两个节点优先释放锁。 Clinet 2 可以从 B、D、E三个节点获取到锁。在整个分布式系统就造成两个 Client 同时持有锁了。不过，这种因为时钟偏移造成的问题，我们可以通过延续超时时间、调整系统时间减少时间偏移等方式来解决。Redis作者也对超时问题给出了自己的意见：在工作进行的过程中，当发现锁剩下的有效时间很短时，可以再次向redis的所有实例发送一个Lua脚本，让key的有效时间延长一点（前提还是key存在并且value是之前设置的value)。客户端扩展TTL时必须像首次取得锁一样在大多数实例上扩展成功才算再次取到锁，并且是在有效时间内再次取到锁（算法和获取锁是非常相似的）。简单来说就是在获取锁成功后，监视锁的失效时间，如果即将到期，可以再次去申请续约，延长锁的有效期。我们可以采用看门狗（watch dog)解决锁超时问题，/开启一个任务，这个任务在获取锁之后10秒后，重新向redis发起请求，重置有效期，重新执行expire 。

3.7.Redission

如果按照Redlock算法来实现分布式锁，加上各种安全控制，代码会比较复杂。而开源的Redission框架就帮我们实现了各种基于Redis的分布式锁，包括Redlock锁。

Redisson是一个在Redis的基础上实现的Java驻内存数据网格（In-Memory Data Grid）。它不仅提供了一系列的分布式的Java常用对象，还提供了许多分布式服务。其中包括( BitSet , Set , Multimap , SortedSet , Map , List , Queue , BlockingQueue , Deque , BlockingDeque , Semaphore , Lock , AtomicLong , CountDownLatch , Publish / Subscribe , Bloom filter , Remote service , Spring cache , Executor service , Live Object service , Scheduler service ) Redisson提供了使用Redis的简单和便捷的方法。Redisson的宗旨是促进使用者对Redis的关注分离（Separation of Concern），从而让使用者能够将精力更集中地放在处理业务逻辑上。官网地址：https://redisson.org/ GitHub地址：https://github.com/redisson/redisson 看看Redission能实现的功能：

3.8.1.快速入门

1）依赖使用起来非常方便，首先引入依赖：

<dependency> <groupld>org.redisson/groupld> o <a rtifa ctl d>redisson</a rtifa ctld> <versiorp3.1O.6</versiorp </dependency>

2）配置然后通过Java配置的方式，设置Redis的地址，构建RedissionClient客户端：

@Configuration public class RedisConfig { @Bean public RedissonClient redissonClient) { //配置类 Config config = new Config (); //添加redis地址，这里添加了单点的地址，也可以使用onfig. useClusterServers(添加集群地址 config- useSingleServer() setAddress("redis://192. 168.150.101:6379'); //创建客户端 return Redisson. create ( config) ; j

3）常用API介绍： RedissClient中定义了常见的锁：

//创建锁对象，并制定锁的名称 RLock lock = redissonClientgetLock("taskLock');

获取锁对象后，可以通过tryLock()方法获取锁。有3个重载的方法，可以控制锁是否需要重试来获取：三个参数：获取锁，设置锁等待时间 waitTime 、释放时间 leaseTime ，时间单位 unit 。如果获取锁失败后，会在 waitTime 减去获取锁用时的剩余时间段内继续尝试获取锁，如果依然获取失败，则认为获取锁失败；获取锁后，如果超过 leaseTime 未释放，为避免死锁会自动释放。两个参数：获取锁，设置锁等待时间 time 、时间单位 unit 。释放时间 leaseTime 按照默认的30s 空参：获取锁， waitTime 默认0s，即获取锁失败不重试， leaseTime 默认30s

任务执行完毕，使用 unlock() 方法释放锁： 4）完整案例使用Redission来代替我们之前自定义锁的测试案例：代码如下：

@SIf4j @Component public class ClearOrderTask2 @Autowired private RedissonClient redissonClient @Scheduled(cron =“0/10 * * ? * *) public synchronized void clearOrderTask () throws InterruptedException //获取锁对象 RLock lock = redissonClient getL ock("lock"); //尝试加锁 boolean isLock = lock. tryLock(); /判断是否成功 if(!isLock){ /获取锁失败，结束任务 log- error("获取锁失败，任务终止!"): return ; try { log. info("获取锁成功，开始执行任务"); //执行任务 clearOrder(); finally { /释放锁 log. war("任务结束，释放锁); lock . unlock(); private void clearOrder() throws InterruptedException { log.info("开始清理未支付订单"); Thread . sleep(500); log.info("恢复数据库库存! "); }

3.7.2.Redisson实现细节

首先看空参获取lock的方法：

// RedissonLock类 @Override public boolean tryLock) { return get(tryl ockAsync()); } @Override public RFuture<Boolean> tryLockAsync() { return tryL ockAsync(Thread . currentThread(). getld()); } @Override public RFuture<Boolean> tryL ockAsync (long threadld) { return tryAcquireOnceAsynd-1, null, threadld ); private RFuture<Boolean> tryAcquireOnceAsync(long leaseTime, TimeUnit unit, long threadld) { if (leaseTime !=-1){ return tryLockInnerAsync(leaseTime, unit, threadld, RedisCommands.EVAL_ NULL_ _BOOLEAN); } //尝试获取锁，返回RFuture(带结果的异步任务) RFuture<Boolean> ttlRemainingFuture = tryLockInnerAsync(commandExecutor.getConnectionManager().getCfg().getLockWatchdogTimeo ut(), TimeUnit.MILLISECONDS, threadld, RedisCommands.EVAL NULL BOOLEAN); //如果成功 ttlRemainingFuture.onComple(ttlRemaining, e)-> { if(e != null) { return ; // lock acquired if (ttlRemaining) { //尝试自动续期(看门狗vatch dog) scheduleExpirationRe newal( threadld); }); return ttlRemainingFuture ; }

这里的核心有两部分：一个是获取锁的方法：tryLockInnerAsync 一个是自动续期（看门狗）的方法：scheduleExpirationRenewal

1）获取锁：首先看tryLockInnerAsync，这个方法是获取锁的方法：

<T> RFuture<T> tryLockInnerAsync(long leaseTime, TimeUnit unit, long threadld, RedisStrictCommand<T> command) { internalLockLeaseTime = unit.toMillis(leaseTime); return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, command, "if reiscallexists',KEYS[1])=0)then"+"rediscall('hset',KEYS[1], ARGV[2],1);"+"rediscal'pexpire',KEYS[1],ARGV[1]);"+"returnnil;"+"end;"+"if(rediscal(hexists',KEYS[1],ARGV[2])==1)then"+"rediscal'hincrby',KEYS[1],ARGV[2],1);"+"redis.call'pexpire', KEYS[1], ARGV[1]); "+ "return nil; " + "end;”+" return risall'tt', KEYS[1]);", Collections. <Objec>singletonList(getName(),internalLockLeaseTime,getLockName(threadld); }

这里的核心就是这段Lua脚本，看看与我们写的是不是基本类似呢，区别是后返回了这个key的剩余有效期。 2）锁的自动续期锁如果在执行任务时自动过期，就会引起各种问题，因此我们需要在锁过期前自动申请续期，这个被称为watch dog，看门狗。

private void scheduleExpirationRe newal(long threadld) { //创建entry, 记录线程d,因为需要知道对哪个线程的锁刷新 Expiration Entryentry = new ExpirationEntry); Expiration EntryoldEntry = EXPIRATION_ RENEWAL .MAP putIfAbsent (getEntryName (), entry); if (oldEntry != null) { oldEntry . addThreadld(threadld ); )else { entry . addThreadld threadld ); /刷新过期时间 renewExpiration(); }

刷新时间的代码：

private void renewExpiration() { ExpirationEntry ee = EXPIRATION RENEWAL MAR.get(getEntryName(); if (ee == null) { return; } //设置一个延迟刷新的任务，并且设置超时时间为总过期时间的1/3，例如总时间时30秒，则每隔10秒重试一次 Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() { @Override public void run(Timeout timeout) throws Exception { ExpirationEntry ent = EXPIRATION RENEWAL_ MAP.get(getEntryNamel); if (ent == nul) { return; } Long threadld = ent.getFirstThreadld(); if (threadld == nul) { return; } //异步发送更新过期时间的请求 RFuture<Boolean> future = renewExpirationAsync(threadld); //更新成功后的任务 future. onComplete((res,e)-> { if(e != nul) { logerror("Can't update lock" + getName() +”expiration",e); return; //再次调用自己 renewExpiration(); }); } } internalLockLeaseTime / 3, TimeUnit.MILLISECONDS); ee.setTimeout(task); }

刷新过期时间的代码:

protected RFuture<Boolean> renewExpirationAsyncllong threadld) { returm commandExecutor.evalWriteAsync(getName(), LongCode.INSTANCE, RedisCommands.EVAL_ BOOLEAN, "if (ediscall'hexists', KEYS[1], ARGV[2])==1)then"+"redis.call'pexpire', KEYS[1], ARGV[1]); "+ "return 1;" +"end;"+"return 0;", Clleltions<objec>singletonList(getName), internalLockLeaseTime, getLockName(threadld); }

3）带阻塞的获取锁阻塞获取锁，会在获取失败以后重试，不过会设置失败超时时间。 public boolean tryLock(long waitTime, long leaseTime, TimeUnit unit) waitTime：获取锁重试的大超时时间，默认为0 leaseTime：释放锁的大时间，默认时30秒 unit：时间单位代码如下：

@Override public boolean tryLock(long waitTime, long leaseTime, TimeUnit unit) throws InterruptedException { //获取锁的重试时长 long time = unit.toMillis(waitTime); long current = Sytem.crerntTimeMilis(); long threadld = Thread.currentThread)-getld(); //尝试获取锁，并获取有效时间 Long tl = tryAcqurel(leaseTimne, unit, threadld); if(t=null){ //获取锁成功，直接返回 return true; //计算获取锁的耗时是否超过了最大重时间 time -= System.currentTimeMilli() - current; if (time <=0){ //如果超时则认为获取锁失败，不再重试，直接返回 acquireFailed(threadld); return false; } //虽然失败，但是没有超过最大等待时间，继卖获取锁 current = System.currentTimeMilli(); //订阅锁释放的消息 RFuture<RedissonLockEntry> subscribeFuture = subscribe(threadld); //此处会阻塞,等待消息。如果超时，则认为获取锁失败 if (!await(subscribeFuture, time, TimeUnit.MILLISECONDS)) { if (!subscribeFuturecancel(false)) { subscribeFuture.onCompletel(res, e)-> { if(e== null) { unsubscribe(subscribeFuture, threadld); } }); } acquireFailed( threadId) ; return false; } //如果获取到订阅消息，说明锁已经释放，可以重试 try { time -= System. currentTimeMillis()一current; if (time <= 0) { acquireFailed( threadId) ; return false; } //循环重试获取锁 while (true) { long currentTime = System . currentTimeMillis(); ttl = tryAcquire(leaseTime, unit， threadId); // lock acquired if (ttl == null) { return true; } time -= System. currentTimeMillis()一currentTime; if (time <= 0) { acquireFailed( threadId); return false; } // waiting for message currentTime = System. cur rentTimeMillis(); if(ttl>=0&&ttl<time){ getEntry( threadId) . getLatch() . tryAcquire(tt1, TimeUnit . MILLISECONDS) ; } else { getEntry( threadId) . getLatch() . tryAcquire( time, TimeUnit . MILLISECONDS); time -= System. currentTimeMillis() - currentTime ; if (time <= 0) { acquireFailed( threadId) ; return false; } finally { unsubscribe( subscribeFuture, threadId); } }

获取锁失败，会通过Redis的pubsub功能订阅一个频道，如果释放锁会通知自己，然后再重试获取锁。 4）释放锁释放锁代码基本一致：

public void unlock() { try { get(unlockAsync(Thread. currentThread(). getld())); ]atch (RedisException e) { if (e . getCause() instanceof IllegalMonitorStateExceptio {throw (llegalMonitorStateException e . getCause(); else {throw e;

下面跟到unlockAsync方法：

@Override public RFuture<Void> unlockAsync(long threadld) { RPromise <Void> result = new RedissonPromise<Void>(); //释放锁 RFuture<Boolean> future = unlockInnerAsync threadld); //回调 future. onComplete( (opStatus, e) -> { if(e!=nul){ //出现异常的情况，取消自动续期任务 cancelExpirationRe newal(threadld); result. tryFailure(e); return ; //说明锁是自动释放，已经不是自己的了 if (opStatus == null) llegalMonitorStateExceptioncause = new IllegalMonitorStateExceptiof'attempt to unlock lock， not locked by current thread by node id: "+ id+ " thread-id:“+ threadld); result. tryFailure cause); return ; /1取消自动续期任务 cancelExpirationRe newal(threadld); result. trySuccess (nulI); }); return result; }

然后关键是释放锁的代码：

protected RFuture<Boolean> unlockInnerAsyn(long threadld) { return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_ BOOLEAN, "if (edis.call'hexists', KEYS[1], ARGV[3])== 0) then”+ "return nil;"+ "end;" + "local counter = rediscall(hincrby', KEYS[1], ARGV[3], -1); "+ "if (counter> 0) then " + "rediscal'pexpire', KEYS[1], ARGV[2]); "+ "return 0; '+ "else "rediscall'el', KEYS[1]); " + "rediscall('publish', KEYS[2], ARGV[1]); " + "return 1; "+ "end;"+ "return nil;", Arrays.cobject>aslist(getName(), getChannelName(), LockPubSub.UNLOCK_ MESSAGE, internalLockLeaseTime, getLockName(threadld)); }

代码基本一致，就是再后释放成功后，通过 redis.call('publish', KEYS[2], ARGV[1]); 发布了一条消息，通知锁已经释放，那些再等待的其它线程，就可以获取锁了。

3.8.总结

总结来看，Redis实现分布式锁，具备下列优缺点：优点：实现简单，性能好，并发能力强，如果对并发能力有要求，推荐使用缺点：可靠性有争议，极端情况会出现锁失效问题，如果对安全要求较高，不建议使用

4.zookeeper实现分布式锁

Zookeeper是一种提供配置管理、分布式协同以及命名的中心化服务。 zk的模型是这样的：zk包含一系列的节点，叫做znode，就好像文件系统一样每个znode表示一个目录，然后znode有一些特性：有序节点：假如当前有一个父节点为 /lock ，我们可以在这个父节点下面创建子节点； zookeeper提供了一个可选的有序特性，例如我们可以创建子节点“/lock/node-”并且指明有序，那么zookeeper在生成子节点时会根据当前的子节点数量自动添加整数序号也就是说，如果是第一个创建的子节点，那么生成的子节点为 /lock/node-0000000000 ，下一个节点则为 /lock/node-0000000001 ，依次类推。临时节点：客户端可以建立一个临时节点，在会话结束或者会话超时后，zookeeper会自动删除该节点。

事件监听：在读取数据时，我们可以同时对节点设置事件监听，当节点数据或结构变化时， zookeeper会通知客户端。当前zookeeper有如下四种事件：节点创建节点删除节点数据修改子节点变更

基于以上的一些zk的特性，我们很容易得出使用zk实现分布式锁的落地方案：

使用zk的临时节点和有序节点，每个线程获取锁就是在zk创建一个临时有序的节点，比如在/lock/ 目录下。创建节点成功后，获取/lock目录下的所有临时节点，再判断当前线程创建的节点是否是所有的节点的序号小的节点如果当前线程创建的节点是所有节点序号小的节点，则认为获取锁成功。如果当前线程创建的节点不是所有节点序号小的节点，则对节点序号的前一个节点添加一个事件监听。比如当前线程获取到的节点序号为 /lock/003 ,然后所有的节点列表为 [/lock/001,/lock/002,/lock/003] ,则对 /lock/002 这个节点添加一个事件监听器。

如果锁释放了，会唤醒下一个序号的节点，然后重新执行第3步，判断是否自己的节点序号是小。比如 /lock/001 释放了， /lock/002 监听到时间，此时节点集合为 [/lock/002,/lock/003] ,则 /lock/002 为小序号节点，获取到锁。

Curator是一个zookeeper的开源客户端，也提供了分布式锁的实现。

来看看锁的一些特性Zookeeper是否满足：互斥：因为只有一个小节点，满足互斥特性锁释放：使用Zookeeper可以有效的解决锁无法释放的问题，因为在创建锁的时候，客户端会在ZK 中创建一个临时节点，一旦客户端获取到锁之后突然挂掉（Session连接断开），那么这个临时节点就会自动删除掉。其他客户端就可以再次获得锁。阻塞锁：使用Zookeeper可以实现阻塞的锁，客户端可以通过在ZK中创建顺序节点，并且在节点上绑定监听器，一旦节点有变化，Zookeeper会通知客户端，客户端可以检查自己创建的节点是不是当前所有节点中序号小的，如果是，那么自己就获取到锁，便可以执行业务逻辑了。可重入：使用Zookeeper也可以有效的解决不可重入的问题，客户端在创建节点的时候，把当前客户端的主机信息和线程信息直接写入到节点中，下次想要获取锁的时候和当前小的节点中的数据比对一下就可以了。如果和自己的信息一样，那么自己直接获取到锁，如果不一样就再创建一个临时的顺序节点，参与排队。高可用：使用Zookeeper可以有效的解决单点问题，ZK是集群部署的，只要集群中有半数以上的机器存活，就可以对外提供服务。高性能：Zookeeper集群是满足强一致性的，因此就会牺牲一定的性能，与Redis相比略显不足

总结：优点：使用非常简单，不用操心释放问题、阻塞获取问题缺点：性能比Redis稍差一些

5.总结

分布式锁释放方式多种多样，每种方式都有自己的优缺点，我们应该根据业务的具体需求，先择合适的实现。 Redis实现：实现比较简单，性能高，但是可靠性难以维护 Zookeeper实现：实现简单，可靠性高，性能比redis略低

Processed: 0.020, SQL: 9