現(xiàn)在pc網(wǎng)站的標(biāo)準(zhǔn)一般是做多大長(zhǎng)沙網(wǎng)站優(yōu)化推廣
????????緩存可以提升性能,減輕數(shù)據(jù)庫(kù)壓力,在獲取這部分好處的同時(shí),它卻帶來(lái)了一些新的問(wèn)題,緩存和數(shù)據(jù)庫(kù)之間的數(shù)據(jù)一致性問(wèn)題。
想必大家在工作中只要用了咱們緩存勢(shì)必就會(huì)遇到過(guò)此類(lèi)問(wèn)題
首先我們來(lái)看看一致性:
- 強(qiáng)一致性:任何一次讀都能讀到某個(gè)數(shù)據(jù)的最近一次寫(xiě)的數(shù)據(jù)。
- 弱一致性:數(shù)據(jù)更新后,如果能容忍后續(xù)的訪問(wèn)只能訪問(wèn)到部分或者全部訪問(wèn)不到,則是弱一致性。
1.讀取數(shù)據(jù)
- 當(dāng)應(yīng)用程序需要從數(shù)據(jù)庫(kù)讀取數(shù)據(jù)時(shí),先檢查緩存數(shù)據(jù)是否命中。
- 如果緩存未命中,則查詢(xún)數(shù)據(jù)庫(kù)獲取數(shù)據(jù),同時(shí)將數(shù)據(jù)寫(xiě)到緩存中,以便后續(xù)讀取相同數(shù)據(jù)會(huì)命中緩存,最后再把數(shù)據(jù)返回給調(diào)用者。
- 如果緩存命中,直接返回。
????????單獨(dú)的只讀取數(shù)據(jù)場(chǎng)景是不會(huì)出現(xiàn)不一致。 只有讀和寫(xiě)一起才會(huì)出現(xiàn) , 那我們?cè)賮?lái)說(shuō)下寫(xiě)數(shù)據(jù)的場(chǎng)景
問(wèn)題:如果數(shù)據(jù)庫(kù)中的某條數(shù)據(jù)放入緩存后,又馬上被更新了,那我們應(yīng)該如何更新緩存
2.寫(xiě)數(shù)據(jù)
當(dāng)我們對(duì)數(shù)據(jù)進(jìn)行修改的時(shí)候,到底是先刪緩存,還是先寫(xiě)數(shù)據(jù)庫(kù)?
- 先更新緩存再更新數(shù)據(jù)庫(kù)
- 先刪除緩存再更新數(shù)據(jù)庫(kù)
- 先更新數(shù)據(jù)庫(kù)再更新緩存
- 先更新數(shù)據(jù)庫(kù)再刪除緩存
無(wú)非就是緩存用更新或用刪除?推薦直接刪除
????????為什么不更新?而直接刪, 因?yàn)?strong>緩存的更新成本更高(因?yàn)槟銓?xiě)入數(shù)據(jù)庫(kù)的值,很多情況并不是直接寫(xiě)入緩存的,而是要經(jīng)過(guò)一系列復(fù)雜的計(jì)算再寫(xiě)入緩存。那么,每次寫(xiě)入數(shù)據(jù)庫(kù)后,都再次計(jì)算寫(xiě)入緩存的值,無(wú)疑是浪費(fèi)性能的。顯然,刪除緩存更為適合。)刪除緩存操作簡(jiǎn)單,副作用只是增加了一次 chache miss,建議大家使用該策略。
先操作數(shù)據(jù)庫(kù)還是先操作緩存?
2.先操作緩存
2.1先更新緩存,再更新數(shù)據(jù)庫(kù)
缺點(diǎn):如果先更新緩存成功,在更新數(shù)據(jù)庫(kù)的時(shí)候失敗,這時(shí)候會(huì)導(dǎo)致數(shù)據(jù)不一致;緩存的作用是不是臨時(shí)將我們數(shù)據(jù)保存在內(nèi)存,便于提高查詢(xún)速度;但是如果某條數(shù)據(jù)在數(shù)據(jù)庫(kù)中都不存在,緩存這種數(shù)據(jù)沒(méi)有一點(diǎn)意義
2.2.先刪除緩存,再更新數(shù)據(jù)庫(kù)
缺點(diǎn):高并發(fā)場(chǎng)景下,如果多個(gè)線程同時(shí)執(zhí)行更新數(shù)據(jù)庫(kù)再寫(xiě)緩存操作可能會(huì)出現(xiàn)數(shù)據(jù)庫(kù)是新值,而緩存中是舊值
2.3.先刪緩存再刪數(shù)據(jù)庫(kù)?
????????先刪緩存再刪數(shù)據(jù)庫(kù):在多線程環(huán)境下,當(dāng)一個(gè)線程把緩存刪掉之后,另一個(gè)線程讀緩存,讀不到緩存就會(huì)直接讀庫(kù),讀到數(shù)據(jù)后就會(huì)更新緩存,先前的線程呢,才更新數(shù)據(jù)庫(kù),會(huì)造成緩存臟讀的情況,很容易產(chǎn)生緩存臟讀。
而且,如果不采用給緩存設(shè)置過(guò)期時(shí)間策略,該數(shù)據(jù)永遠(yuǎn)都是臟數(shù)據(jù)。
3.先操作數(shù)據(jù)庫(kù)
3.1.先更新數(shù)據(jù)庫(kù),再更新緩存
優(yōu)點(diǎn):可以解決先更新緩存,再更新數(shù)據(jù)庫(kù)帶來(lái)的假數(shù)據(jù)問(wèn)題
缺點(diǎn):高并發(fā)場(chǎng)景下,如果多個(gè)線程同時(shí)執(zhí)行更新數(shù)據(jù)庫(kù)再寫(xiě)緩存操作可能會(huì)出現(xiàn)數(shù)據(jù)庫(kù)是新值,而緩存中是舊值
3.2.先更新數(shù)據(jù)庫(kù),再刪除緩存
????????在高可用的系統(tǒng)系統(tǒng)里面,我們追求數(shù)據(jù)最終一致性的話,我們可以考慮先更新數(shù)據(jù)庫(kù),再去刪除緩存
? ? ? ? 也算是常用的方案,這里介紹一下,這個(gè)叫 Cache Aside Pattern。如果先更新數(shù)據(jù)庫(kù),再刪除緩存,那么就會(huì)出現(xiàn)更新數(shù)據(jù)庫(kù)之前有瞬間數(shù)據(jù)不是很及時(shí)。
????????同時(shí),如果在更新之前,緩存剛好失效了,讀客戶(hù)端有可能讀到舊值,然后在寫(xiě)客戶(hù)端刪除結(jié)束后再次設(shè)置了舊值,非常巧合的情況。
????????有 2 個(gè)前提條件:緩存在寫(xiě)之前的時(shí)候失效,同時(shí),在寫(xiě)客戶(hù)度刪除操作結(jié)束后,放置舊數(shù)據(jù) — 也就是讀比寫(xiě)慢。設(shè)置有的寫(xiě)操作還會(huì)鎖表。
這個(gè)很難出現(xiàn),但是如果出現(xiàn)了怎么辦?使用雙刪!!!
3.3先刪數(shù)據(jù)庫(kù)再刪緩存?
先刪數(shù)據(jù)庫(kù)再刪緩存,在多線程情況下,當(dāng)一個(gè)線程刪除數(shù)據(jù)庫(kù),另一個(gè)線程讀取緩存數(shù)據(jù),讀到的是緩存的數(shù)據(jù),當(dāng)先前一個(gè)線程刪完數(shù)據(jù)庫(kù)后就會(huì)更新緩存,這是緩存就正常了,產(chǎn)生了一次臟讀。?
5.解決
5.1.強(qiáng)一致性?
在強(qiáng)一致性系統(tǒng)中,通過(guò)2PC、Paxos或分布式鎖保持一致性可能會(huì)成為影響系統(tǒng)吞吐量、響應(yīng)時(shí)間和可伸縮性的昂貴開(kāi)銷(xiāo), 因此通常采用一種相當(dāng)寬松的一致性方法,稱(chēng)為最終一致性。
5.2.最終一致性:延時(shí)雙刪
關(guān)鍵:間隔一段時(shí)間再刪除是為了保證并發(fā)讀請(qǐng)求寫(xiě)入的舊值最終能夠被第二次刪除刪除掉
缺點(diǎn):延時(shí)雙刪可能對(duì)我們性能要求方面不能有太高的要求
注意:我們需要自行評(píng)估項(xiàng)目的讀數(shù)據(jù)業(yè)務(wù)邏輯的耗時(shí)(即線程二從數(shù)據(jù)庫(kù)讀取數(shù)據(jù) 寫(xiě)入緩存完成), 防止線程二覆蓋掉新數(shù)據(jù)
如果第二次刪除緩存失敗怎么辦?
4.為了防止刪除緩存失敗,可以進(jìn)行重試機(jī)制
- 同步重試,如果并發(fā)量高的時(shí)候可能會(huì)影響接口性能
- 異步重試:
- 創(chuàng)建單獨(dú)的一個(gè)線程,進(jìn)行重試;但是在高并發(fā)的場(chǎng)景下,可能會(huì)因?yàn)閯?chuàng)建線程太多,導(dǎo)致OOM
- 交給線程池處理;但是如果服務(wù)重啟,會(huì)導(dǎo)致數(shù)據(jù)丟失
- 重試數(shù)據(jù)寫(xiě)入表,通過(guò)定時(shí)任務(wù)重試(可以保證數(shù)據(jù)不丟失,但是對(duì)于實(shí)時(shí)性要求較高的該場(chǎng)景不太適用)
- 利用MQ消息中間件進(jìn)行重試,在消費(fèi)者中處理
- 訂閱mysql的binlong,在訂閱者中,如果發(fā)現(xiàn)更新數(shù)據(jù)請(qǐng)求,則刪除響應(yīng)的緩存,比如使用canal中間件;為了保證刪除緩存成功,可以增加MQ
6.總結(jié)?
緩存策略的最佳實(shí)踐是 **Cache Aside Pattern。**分別分為讀緩存最佳實(shí)踐和寫(xiě)緩存最佳實(shí)踐。
讀緩存最佳實(shí)踐:先讀緩存,命中則返回;未命中則查詢(xún)數(shù)據(jù)庫(kù),再寫(xiě)到數(shù)據(jù)庫(kù)。
寫(xiě)緩存最佳實(shí)踐:
- 先寫(xiě)數(shù)據(jù)庫(kù),再操作緩存;
- 直接刪除緩存,而不是修改,因?yàn)?strong>緩存的更新成本很高,刪除緩存操作簡(jiǎn)單,副作用只是增加了一次 chache miss,建議大家使用該策略。
在以上最佳實(shí)踐下,為了盡可能保證緩存與數(shù)據(jù)庫(kù)的一致性,我們可以采用延遲雙刪。
防止刪除失敗,我們采用異步重試機(jī)制保證能正確刪除,異步機(jī)制我們可以發(fā)送刪除消息到 mq 消息中間件,或者利用 canal 訂閱 MySQL binlog 日志監(jiān)聽(tīng)寫(xiě)請(qǐng)求刪除對(duì)應(yīng)緩存。
那么,如果我非要保證絕對(duì)一致性怎么辦,先給出結(jié)論:
沒(méi)有辦法做到絕對(duì)的一致性,這是由 CAP 理論決定的,緩存系統(tǒng)適用的場(chǎng)景就是非強(qiáng)一致性的場(chǎng)景,所以它屬于 CAP 中的 AP。
所以,我們得委曲求全,可以去做到 BASE 理論中說(shuō)的最終一致性。
其實(shí)一旦在方案中使用了緩存,那往往也就意味著我們放棄了數(shù)據(jù)的強(qiáng)一致性,但這也意味著我們的系統(tǒng)在性能上能夠得到一些提升。