那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用Redis作為分布式鎖的詳細方案

Linux愛好者 ? 來源:Linux愛好者 ? 作者:Linux愛好者 ? 2022-04-10 17:27 ? 次閱讀

有人問,使用 Redis 分布式鎖的詳細方案是什么

一個很簡單的答案就是去使用 Redission 客戶端。Redission 中的鎖方案就是 Redis 分布式鎖的比較完美的詳細方案。

那么,Redission 中的鎖方案為什么會比較完美呢?

正好,我用 Redis 做分布式鎖經驗十分豐富。在實際工作中,也探索過許多種使用 Redis 做分布式鎖的方案,經過了無數血淚教訓。

所以,在談及 Redission 鎖為什么比較完美之前,先給大家看看我曾經使用 Redis 做分布式鎖遇到過的問題。

我曾經用 Redis 做分布式鎖想去解決一個用戶搶優惠券的問題。這個業務需求是這樣的:當用戶領完一張優惠券后,優惠券的數量必須相應減一;如果優惠券搶光了,就不允許用戶再搶了。

在實現時,先從數據庫中先讀出優惠券的數量進行判斷。當優惠券大于 0,就進行允許領取優惠券。然后,再將優惠券數量減一后,寫回數據庫。

當時由于請求數量比較多,所以我們使用了三臺服務器去做分流。

3b7ebdd6-b720-11ec-aa7f-dac502259ad0.png

這時候會出現一個問題:

  • 如果其中一臺服務器上的 A 應用獲取到了優惠券的數量之后,由于處理相關業務邏輯未及時更新數據庫的優惠券數量;

  • 在 A 應用處理業務邏輯的時候,另一臺服務器上的B 應用更新了優惠券數量。

  • 那么,等 A 應用去更新數據庫中優惠券數量時,就會把 B 應用更新的優惠券數量覆蓋掉。

看到這里可能有人比較奇怪,為什么這里不直接使用 SQL:

update 優惠券表 set 優惠券數量 = 優惠券數量 - 1 where 優惠券id = xxx

原因是,這樣做在沒有分布式鎖協調下,優惠券數量可能直接會出現負數。

因為當優惠券數量為 1 的時候,如果兩個用戶通過兩臺服務器同時發起搶優惠券的請求,都滿足優惠券大于 0 的條件,然后都執行這條 SQL 語句,結果優惠券數量直接變成 -1 了。

還有人說可以用樂觀鎖,比如使用如下 SQL:

update 優惠券表 set 優惠券數量 = 優惠券數量 - 1 where 優惠券id = xxx and version = xx

	

這種方式就在一定幾率下,很可能出現數據一直更新不上導致長時間重試的情況。

所以,經過綜合考慮我們就采用了 Redis 分布式鎖,通過互斥的方式,以防止多個客戶端去同時更新優惠券數量的方案。

當時,我們首先想到的就是使用 Redis 的 setnx 命令,setnx 命令其實就是 set if not exists 的簡寫。

當 key 設置值成功后,則返回 1,否則就返回 0。所以,這里 setnx 設置成功可以表示成獲取到鎖,如果失敗,則說明已經有鎖,可以被視作獲取鎖失敗。

setnx lock true

	

如果想要釋放鎖,執行 del 指令,把 key 刪除即可。

del lock

	

利用這個特性,我們就可以讓系統在執行優惠券邏輯之前,先去 Redis 中執行 setnx 指令。再根據指令執行結果,去判斷是否獲取到鎖。如果獲取到了,就繼續執行業務,執行完再使用 del 指令去釋放鎖。如果沒有獲取到,就等待一定時間,重新再去獲取鎖。

3b96b1ca-b720-11ec-aa7f-dac502259ad0.png

乍一看,這一切沒什么問題,使用 setnx 指令確實起到了想要的互斥效果。

但是,這是建立在所有運行環境都是正常的情況下的。一旦運行環境出現了異常,問題就出現了。

試著想一下,持有鎖的應用突然崩潰了,或者所在的服務器宕機了,會出現什么情況?

這會造成死鎖——持有鎖的應用無法釋放鎖,其他應用根本也沒有機會再去獲取鎖了。這會造成巨大的線上事故。我們要改進方案,解決這個問題。

怎么解決呢?

咱們可以看到,造成死鎖的根源是:一旦持有鎖的應用出現問題,就不會去釋放鎖。從這個方向思考,可以在 Redis 上給 key 一個過期時間。

這樣的話,即使出現問題,key 也會在一段時間后釋放,是不是就解決了這個問題呢?

實際上,大家也確實是這么做的。

不過,由于 setnx 這個指令本身無法設置超時時間,所以一般會采用兩種辦法來做這件事:

1、采用 lua 腳本

在使用 setnx 指令之后,再使用 expire 命令去給 key 設置過期時間。

if redis.call("SETNX", "lock", "true") == 1 then  local expireResult = redis.call("expire", "lock", "10")  if expireResult == 1 then      return "success"  else      return "expire failed"  endelse  return "setnx not null"end

	

2、直接使用 set(key,value,NX,EX,timeout) 指令,同時設置鎖和超時時間

redis.call("SET", "lock", "true", "NX", "PX", "10000")

	

以上兩種方法,使用哪種方式都可以。

釋放鎖的腳本兩種方式都一樣,直接調用 Redis 的 del 指令即可。

到目前為止,我們的鎖既起到了互斥效果,又不會因為某些持有鎖的系統出現問題,導致死鎖了。

這樣就完美了嗎?

假設有這樣一種情況,如果一個持有鎖的應用,其持有的時間超過了我們設定的超時時間會怎樣呢?

會出現兩種情況:

  • 發現系統在 Redis 中設置的 key 還存在;
  • 發現系統在 Redis 中設置的 key 不存在。

出現第一種情況比較正常。因為你畢竟執行任務超時了,key 被正常清除也是符合邏輯的。但是最可怕的是第二種情況,發現設置的 key 還存在。這說明什么?說明當前存在的 key,是另外的應用設置的。

這時候如果持有鎖超時的應用調用 del 指令去刪除鎖時,就會把別人設置的鎖誤刪除,這會直接導致系統業務出現問題。

所以,為了解決這個問題,我們需要繼續對 Redis 腳本進行改動。

首先,我們要讓應用在獲取鎖的時候,去設置一個只有應用自己知道的獨一無二的值。

通過這個唯一值,系統在釋放鎖的時候,就能識別出這鎖是不是自己設置的。如果是自己設置的,就釋放鎖,也就是刪除 key;如果不是,則什么都不做。

腳本如下:

if redis.call("SETNX", "lock", ARGV[1]) == 1 then local expireResult = redis.call("expire", "lock", "10") if expireResult == 1 then     return "success" else     return "expire failed" endelse  return "setnx not null"end

	

或者

redis.call("SET", "lock", ARGV[1], "NX", "PX", "10000")

	

這里,ARGV[1] 是一個可傳入的參數變量,可以傳入唯一值。比如一個只有自己知道的 UUID 的值,或者通過雪球算法,生成只有自己持有的唯一 ID。

釋放鎖的腳本改成這樣:

if redis.call("get", "lock") == ARGV[1]   then      return redis.call("del", "lock")   else      return 0 end

	

可以看到,從業務角度,無論如何,我們的分布式鎖已經可以滿足真正的業務需求了。能互斥,不死鎖,不會誤刪除別人的鎖,只有自己上的鎖,自己可以釋放。

一切都是那么美好。

可惜,還有個隱患我們并未排除。這個隱患就是 Redis 自身

要知道,Lua 腳本都是用在 Redis 的單例上的。一旦 Redis 本身出現了問題,我們的分布式鎖就沒法用了。分布式鎖沒法用,對業務的正常運行會造成重大影響,這是我們無法接受的。

所以,我們需要把 Redis 搞成高可用的。一般來講,解決 Redis 高可用的問題都是使用主從集群。

但是搞主從集群,又會引入新的問題。

主要問題在于,Redis 的主從數據同步有延遲。這種延遲會產生一個邊界條件:當主機上的 Redis 已經被人建好了鎖,但是鎖數據還未同步到從機時,主機宕了。隨后,從機提升為主機,此時從機上是沒有以前主機設置好的鎖數據的——鎖丟了。

到這里,終于可以介紹 Redission(開源 Redis 客戶端)了,我們來看看它怎么是實現 Redis 分布式鎖的。

Redission 實現分布式鎖的思想很簡單,無論是主從集群還是 Redis Cluster 集群,它會對集群中的每個 Redis,挨個去執行設置 Redis 鎖的腳本,也就是集群中的每個 Redis 都會包含設置好的鎖數據。

我們通過一個例子來介紹一下。

假設 Redis 集群有 5 臺機器,同時根據評估,鎖的超時時間設置成 10 秒比較合適。

第 1 步,咱們先算出集群總的等待時間,集群總的等待時間是 5 秒(鎖的超時時間 10 秒 / 2)。

第 2 步,用 5 秒除以 5 臺機器數量,結果是 1 秒。這個 1 秒是連接每臺 Redis 可接受的等待時間。

第 3 步,依次連接 5 臺 Redis,并執行 Lua 腳本設置鎖,然后再做判斷:

  • 如果在 5 秒之內,5 臺機器都有執行結果,并且半數以上(也就是 3 臺)機器設置鎖成功,則認為設置鎖成功。少于半數機器設置鎖成功,則認為失敗;
  • 如果超過 5 秒,不管幾臺機器設置鎖成功,都認為設置鎖失敗。比如,前 4 臺設置成功一共花了 3 秒,但是最后 1 臺機器用了 2 秒也沒結果,總的等待時間已經超過了 5 秒,即使半數以上成功,這也算作失敗。

再額外多說一句,在很多業務邏輯里,其實對鎖的超時時間是沒有需求的。比如,凌晨批量執行處理的任務,可能需要分布式鎖保證任務不會被重復執行。此時,任務要執行多長時間是不明確的。如果設置分布式鎖的超時時間在這里,并沒有太大意義。但是,不設置超時時間又會引發死鎖問題。

所以,解決這種問題的通用辦法是,每個持有鎖的客戶端都啟動一個后臺線程,通過執行特定的 Lua 腳本,去不斷地刷新 Redis 中的 key 超時時間,使得在任務執行完成前,key 不會被清除掉。

腳本如下:

if redis.call("get", "lock") == ARGV[1]   then     return redis.call("expire", "lock", "10") else     return 0 end

	

其中,ARGV[1] 是可傳入的參數變量,表示持有鎖的系統的唯一值,也就是只有持有鎖的客戶端才能刷新 key 的超時時間。

到此為止,一個完整的分布式鎖才算實現完畢。總結實現方案如下:

  • 使用 set 命令設置鎖標記,必須有超時時間,以便客戶端崩潰,也可以釋放鎖;
  • 對于不需要超時時間的,需要自己實現一個能不斷刷新鎖超時時間的線程;
  • 每個獲取鎖的客戶端,在 Redis 中設置的 value 必須是獨一無二的,以便識別出是由哪個客戶端設置的鎖;
  • 分布式集群中,直接每臺機器設置一樣的超時時間和鎖標記;
  • 為了保證集群設置的鎖不會因為網絡問題導致某些已經設置的鎖出現超時的情況,必須合理設置網絡等待時間和鎖超時時間。

這個分布式鎖滿足如下四個條件

  • 任意時刻只能有一個客戶端持有鎖;
  • 不能發生死鎖,有一個客戶端持有鎖期間出現了問題沒有解鎖,也能保證后面別的客戶端繼續去持有鎖;
  • 加鎖和解鎖必須是同一個客戶端,客戶端自己加的鎖只能自己去解;
  • 只要大多數 Redis 節點正常,客戶端就能正常使用鎖。

當然,在 Redission 中的腳本,為了保證鎖的可重入,又對 Lua 腳本做了一定的修改,現在把完整的 Lua 腳本貼在下面。

獲取鎖的 Lua 腳本:

if (redis.call('exists', KEYS[1]) == 0) then  redis.call('hincrby', KEYS[1], ARGV[2], 1);  redis.call('pexpire', KEYS[1], ARGV[1]);  return nil;end;
if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then  redis.call('hincrby', KEYS[1], ARGV[2], 1);  redis.call('pexpire', KEYS[1], ARGV[1]);  return nil;end;
return redis.call('pttl', KEYS[1]);

	

對應的刷新鎖超時時間的腳本:

if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then  redis.call('pexpire', KEYS[1], ARGV[1]);   return 1; end;  return 0;

	

對應的釋放鎖的腳本:

if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then return nil;end;
local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); 
if (counter > 0) then redis.call('pexpire', KEYS[1], ARGV[2]);return 0;else redis.call('del', KEYS[1]); redis.call('publish', KEYS[2], ARGV[1]);return 1;end;return nil;

	

到現在為止,使用 Redis 作為分布式鎖的詳細方案就寫完了。

我既寫了一步一坑的坎坷經歷,也寫明了各個問題和解決問題的細節,希望大家看完能有所收獲。

最后再給大家提個醒,使用 Redis 集群做分布式鎖有一定的爭議性。還需要大家在實際用的時候,根據現實情況,做出更好的選擇和取舍。

審核編輯:彭菁


原文標題:面試題詳解:用 Redis 實現分布式鎖的血淚史

文章出處:【微信公眾號:Linux愛好者】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    12

    文章

    9303

    瀏覽量

    86059
  • 數據庫
    +關注

    關注

    7

    文章

    3846

    瀏覽量

    64683
  • Redis
    +關注

    關注

    0

    文章

    378

    瀏覽量

    10936

原文標題:面試題詳解:用 Redis 實現分布式鎖的血淚史

文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Redis 分布式的正確實現方式

    分布式一般有三種實現方式:1. 數據庫樂觀;2. 基于Redis分布式;3. 基于Zoo
    的頭像 發表于 05-31 14:19 ?3633次閱讀

    Redis分布式的正確使用方式探討

    前言 日常開發中,秒殺下單、搶紅包等等業務場景,都需要用到分布式。而Redis非常適合作為分布式
    的頭像 發表于 03-30 10:53 ?1548次閱讀
    <b class='flag-5'>Redis</b><b class='flag-5'>分布式</b><b class='flag-5'>鎖</b>的正確使用方式探討

    Redis分布式真的安全嗎?

    今天我們來聊一聊Redis分布式
    的頭像 發表于 11-02 14:07 ?1042次閱讀

    手擼了個Redis分布式

    實現分布式的方式有很多,其中 Redis 是最常見的一種。而相較于 Java + Redis方案,我個人更傾向于 Go+
    的頭像 發表于 11-03 14:44 ?728次閱讀

    如何使用注解實現redis分布式

    使用 Redis 作為分布式,將的狀態放到 Redis 統一維護,解決集群中單機 JVM 信
    發表于 04-25 12:42 ?690次閱讀
    如何使用注解實現<b class='flag-5'>redis</b><b class='flag-5'>分布式</b><b class='flag-5'>鎖</b>!

    深入理解redis分布式

    深入理解redis分布式 哈嘍,大家好,我是指北君。 本篇文件我們來介紹如何Redis實現分布式
    的頭像 發表于 10-08 14:13 ?1005次閱讀
    深入理解<b class='flag-5'>redis</b><b class='flag-5'>分布式</b><b class='flag-5'>鎖</b>

    redis分布式如何實現

    的情況,分布式的作用就是確保在同一時間只有一個客戶端可以訪問共享資源,從而保證數據的一致性和正確性。 下面將詳細介紹Redis分布式
    的頭像 發表于 11-16 11:29 ?574次閱讀

    redis分布式可能出現的問題

    Redis分布式是一種常用的機制,用于解決多個進程或多臺服務器對共享資源的并發訪問問題。然而,由于分布式環境的復雜性,使用
    的頭像 發表于 11-16 11:40 ?1460次閱讀

    redis分布式死鎖處理方案

    引言: 隨著分布式系統的廣泛應用,尤其是在大規模并發操作下,對并發控制的需求越來越高。Redis分布式作為一種常見的
    的頭像 發表于 11-16 11:44 ?1815次閱讀

    redis分布式的應用場景有哪些

    Redis分布式是一種基于Redis實現的分布式機制,可以在
    的頭像 發表于 12-04 11:21 ?1500次閱讀

    redis分布式三個方法

    Redis是一種高性能的分布式緩存和鍵值存儲系統,它提供了一種可靠的分布式解決方案。在分布式
    的頭像 發表于 12-04 11:22 ?1517次閱讀

    如何實現Redis分布式

    機制,下面將詳細介紹如何實現Redis分布式。 一、引言 在分布式系統中,多個節點可能同時讀寫同一共享資源。如果沒有實現互斥訪問和同步機制
    的頭像 發表于 12-04 11:24 ?750次閱讀

    redis分布式可能出現的問題及解決方案

    Redis分布式是一種常見的解決分布式系統中并發問題的方案。雖然Redis
    的頭像 發表于 12-04 11:29 ?1039次閱讀

    淺析Redis 分布式解決方案

    Redis 分布式解決方案是一種基于Redis實現的分布式
    的頭像 發表于 12-04 14:00 ?536次閱讀

    redis分布式的缺點

    Redis分布式是一種常見的用于解決分布式系統中資源爭用問題的解決方案。盡管Redis
    的頭像 發表于 12-04 14:05 ?1320次閱讀
    皇冠现金投注网| 百家乐官网最稳妥的打法| 百家乐官网必赢法冯耘| 游戏百家乐押金| 大发888娱乐城| 百家乐官网赌场群| 百家乐路单免费下载| 大发888真钱游戏玩法| 百家乐官网现场新全讯网| 百家乐开户投注| 阳宅24山吉凶方位| 顶级赌场代理| 新龙县| 百家乐赌博怎么玩| 大发888官网黄金版| 视频百家乐官网是真是假| 金逸太阳城团购| 带百家乐官网的时时彩平台| 百家乐游戏作弊| 云浮市| 百家乐官网几点不用补| 德州扑克牌| 百家乐官网专打方法| 皇冠足球现金网| 爱赢百家乐现金网| 龙海市| 百家乐最佳注码法| 东辽县| 至富百家乐的玩法技巧和规则| 百家乐官网庄闲分布概率| 网络百家乐电脑| 百家乐官网公式球打法| 百家乐怎样玩才会赢钱| 百家乐官网赌场视屏| 豪享博百家乐的玩法技巧和规则| 游戏百家乐官网庄闲| sz全讯网xb112| 新葡京百家乐官网的玩法技巧和规则| 362娱乐城开户| 游戏厅百家乐软件| 百家乐官网洗码软件|