新疆生產(chǎn)建設(shè)兵團(tuán)社保局網(wǎng)站百度關(guān)鍵字推廣費(fèi)用

SLA = Service Level Agreement = 服務(wù)質(zhì)量/水平協(xié)議
SLO = Service Level Objective = 服務(wù)質(zhì)量/水平目標(biāo)
SLI = Services Level Indicator = 服務(wù)質(zhì)量/水平指標(biāo)
下面用人、事、物的邏輯進(jìn)行闡釋。
人和事
用從上到下,從左到右的順序。
客戶 - 每 1 個客戶在使用產(chǎn)品服務(wù)時,都顯性或隱性的基于某 1 個 SLA,SLA 和客戶之間是一種 1 對 1 的文檔關(guān)系,這份協(xié)議文檔就顯性或者隱性的存在于系統(tǒng)中??蛻羰褂?1 種,或者 n 種連接方式訪問產(chǎn)品服務(wù)的 1 個或者 n 個應(yīng)用系統(tǒng)。
銷售 - SLA 本身是所銷售產(chǎn)品服務(wù)的一部分,它規(guī)定了承諾給客戶的產(chǎn)品功用和質(zhì)量?;?SLA,客戶可以選擇用付費(fèi)或者免費(fèi)的方式使用產(chǎn)品。1 個/份 SLA 的銷售工作可以由 1 到 n 位銷售完成。銷售和客戶都幻想著幾乎完美的 SLA,這樣代表企業(yè)利益的銷售,以及產(chǎn)品的客戶就都可以達(dá)到雙贏的局面,皆大歡喜。
產(chǎn)品 - 通過與銷售的間接互動,或者直接的客戶調(diào)研,產(chǎn)品經(jīng)理能夠確定應(yīng)用系統(tǒng)所應(yīng)該具有的功能和發(fā)展方向。
SRE - SRE 和產(chǎn)品共同制定了每個 SLA 相關(guān)應(yīng)用系統(tǒng)的 SLO,SLO 定量的定義了每 1 個應(yīng)用系統(tǒng)所應(yīng)該具備的服務(wù)質(zhì)量,1 個應(yīng)用系統(tǒng)的 SLO 被該產(chǎn)品服務(wù)的 SLO 文檔定義,在該文檔中 SLO 被映射到 1 個或者 n 個 SLI,每個 SLI 都需要用監(jiān)控工具持續(xù)采集數(shù)據(jù),通常它們的數(shù)值單位各不相同。所有 SLO 都是用百分比數(shù)值形式表達(dá)的,例如:99.99% 的成功率,90% 的請求延遲 < 400 毫秒等。SRE 和產(chǎn)品經(jīng)理/專家還應(yīng)該共同關(guān)注運(yùn)行應(yīng)用系統(tǒng)的基礎(chǔ)設(shè)施層,確保基礎(chǔ)設(shè)施的可用性和容量足以滿足目標(biāo)數(shù)量的用戶訪問,而且還要考慮和設(shè)計底層資源的容災(zāi)和跨區(qū)多活等復(fù)雜場景。
開發(fā)/運(yùn)維 - 重要但暫不做討論。
事
用從下往上的順序。
IaaS 云服務(wù) - 也可以是其它類型的可以供應(yīng)用系統(tǒng)運(yùn)行的環(huán)境。這里存在著 1 到 n 種子服務(wù)。它和上層的 n 個應(yīng)用系統(tǒng)通常是 n 對 n 的關(guān)系。
應(yīng)用系統(tǒng) - 1 個到 n 個應(yīng)用系統(tǒng)構(gòu)成了 1 個產(chǎn)品服務(wù)(內(nèi)含SLA),在和客戶的互動中實現(xiàn)著產(chǎn)品服務(wù)的業(yè)務(wù)價值。
文檔 - 以網(wǎng)頁或者紙張的形式向用戶描述了某個應(yīng)用服務(wù)所提供的服務(wù)內(nèi)容和質(zhì)量信息。向用戶提供這個文檔并不是強(qiáng)制、顯性和必須的。
SLI
Service Level Indicator 服務(wù)水平指示器,服務(wù)水平,簡稱SLI。對于業(yè)務(wù)來說是最重要的指標(biāo)。比如,對于網(wǎng)站來說,一個常見的SLI是請求得到正常響應(yīng)的百分比。
SLO
Service Level Object 服務(wù)水平目標(biāo),是圍繞SLI構(gòu)建的目標(biāo)。通常是一個百分比,并與一個時間范圍掛鉤。比如,月度、季度、年度等。通常用一連串9來度量。如果脫離了時間的度量,SLO的意義就不大了。
90%(1個9的正常運(yùn)行時間):這意味著10%的停機(jī)時間,也就是說在過去的30天里停機(jī)了3天。
99%(2個9的正常運(yùn)行時間):意味著在過去30天中有1%,或者說7.2小時的停機(jī)時間。
99.9%(3個9的正常運(yùn)行時間):意味著0.1%,或者說43.2分鐘的停機(jī)時間。
99.95%(3.5個9的正常運(yùn)行時間):意味著0.05%,或者說21.6分鐘的停機(jī)時間。
99.99%(4個9的正常運(yùn)行時間):意味著0.01%,或者說4.32分鐘的停機(jī)時間。
99.999%(5個9的正常運(yùn)行時間):意味著0.001%,或者說26秒的停機(jī)時間。
SLA
Service Level Agreement 服務(wù)水平協(xié)議,是企業(yè)圍繞SLO發(fā)布的協(xié)議。它要求在不滿足SLO時向客戶補(bǔ)償?shù)膮f(xié)議。
實例
假如我有一個網(wǎng)站http://eample.com,我對這個網(wǎng)站的監(jiān)控指標(biāo)是請求正常響應(yīng)數(shù),從2021年1月1號上線到今天2021年3月18號,請求數(shù)據(jù)如下:
1月,總請求數(shù)500,錯誤響應(yīng)20;
2月,總請求數(shù)600,錯誤響應(yīng)10;并因為故障宕機(jī)10分鐘;
3月1號-3月18號,總請求數(shù)400,錯誤響應(yīng)15;
那么我計算出來的SLI、SLO,SLA是多少呢?
SLI:1 -(20+10+15)/ (500+600+400) = 97%
SLO:1 - ( 10 / 79天 * 24 * 60 )= 99.991%
SLO:假如我們是給第三方做的網(wǎng)站,并簽訂了協(xié)議SLO達(dá)不到99.999%,就賠償多少錢,那么根據(jù)我上面的這個SLO,再根據(jù)簽訂的SLA協(xié)議,算出補(bǔ)償?shù)慕痤~。