能否支持多機同時跑 | 一般不能,同一時刻只能單機跑。 |
存儲數據源 | 一般是mysql或者其它傳統數據庫,并且是單表存儲 |
頻率 | 支持秒、分、時、天,一般不能太快 |
總上所述我們就知道了一般傳統的定時任務存在以下缺點:
1、性能瓶頸。只有一臺機在處理,在大體量數據面前力不從心!
2、實效性差。定時任務的頻率不能太高,太高會業務數據庫造成很大的壓力!
3、單點故障。萬一跑的那臺機掛了,那整個業務不可用了-。- 這是一個很可怕的事情!
所以傳統定時任務也不太適合這個業務。。。
那我們是不是就束手無策了呢?其實不是的! 我們只要對傳統的定時任務做一個簡單的改造!就可以把它變成可以同時多機跑,并且實效性可以精確到秒級,并且拒絕單點故障的定時任務集群!這其中就要借助我們的強大的redis了。
首先我們要定義定時任務集群要解決的三個問題!
1、實效性要高
2、吞吐量要大
3、服務要穩定,不能有單點故障
下面是整個定時任務集群的架構圖。
架構很簡單:我們把用戶的訂閱推送記錄存儲到redis集群的sortedSet隊列里面,并且以提醒用戶提醒時間戳作為score值,然后在我們個每業務server里面起一個定時器頻率是秒級,我的設定就是1s,然后經過負載均衡之后從某個隊列里面獲取要推送的用戶記錄進行推送。下面我們分析以下這個架構
1、性能:除去帶寬等其它因素,基本與機器數成線性相關。機器數量越多吞吐量越大,機器數量少時相對的吞吐量就減少。
2、實效性:提高到了秒級,效果還可以接受。
3、單點故障?不存在的!除非redis集群或者所有server全掛了。。。。
第一redis 可以作為一個高性能的存儲db,性能要比MySQL好很多,并且支持持久化,穩定性好。
第二redisSortedSet隊列天然支持以時間作為條件排序,完美滿足我們選出要推送的記錄。
ok~既然方案已經有了那如何在一天時間內把這個方案落地呢?是的我設計出這個方案到基本編碼完成,時間就是一天。。。 因為時間太趕鳥。
首先我們以user_id作為key,然后mod隊列數hash到redis SortedSet隊列里面。為什么要這樣呢,因為如果用戶同時訂閱了兩張劵并且推送時間很近,這樣的兩條推送就可以合并成一條~,并且這樣hash也相對均勻。下面是部分代碼的截圖:
然后要決定隊列的數量,一般正常來說我們有多少臺處理的服務器就定義多少條隊列。因為隊列太少,會造成隊列競爭,太多可能會導致記錄得不到及時處理。
然而最佳實踐是隊列數量應該是可動態配置化的,因為線上的集群機器數是會經常變的。大促的時候我們會加機器是不是,并且業務量增長了,機器數也是會增加是不是~。所以我是借用了淘寶的diamond進行隊列數的動態配置。
我們每次從隊列里面取多少條記錄也是可以動態配置的
這樣就可以隨時根據實際的生產情況調整整個集群的吞吐量~。 所以我們的定時任務集群還是具有一個特性就是支持動態調整~。
最后一個關鍵組件就是負載均衡了。這個是非常重要的!因為這個做得不好就會可能導致多臺機競爭同時處理一個隊列,影響整個集群的效率!在時間很緊的情況下我就用了一個簡單實用的利用redis一個自增key 然后 mod 隊列數量算法。這樣就很大程度上就保證不會有兩臺機器同時去競爭一條隊列~.
最后我們算一下整個集群的吞吐量
10(機器數) * 2000(一次拉取數) = 20000。然后以MQ的形式把消息推送到消息中心,發MQ是異步的,算上其它處理0.5s。
其實發送20W的推送也就是10幾s的事情。
ok~ 到這里我們整個定時任務集群就差不多基本落地好了。如果你問我后面還有什么可以完善的話那就是:
1、加監控, 集群怎么可以木有監控呢,萬一出問題有任務堆積怎么辦~
2、加上可視化界面。
3、最好有智能調度,增加任務優先級。優先級高的任務先運行嘛。
4、資源調度,萬一機器數量不夠,力不從心,優先保證重要任務執行。
目前項目已上前線,運行平穩~。
到此這篇關于淺談我是如何用redis做實時訂閱推送的的文章就介紹到這了,更多相關redis 實時訂閱推送內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!