有什么軟件可以找客戶搜索引擎營銷與seo優(yōu)化
1.ZooKeeper簡介
ZooKeeper是一個(gè)分布式、高可用性的協(xié)調(diào)服務(wù)。在大數(shù)據(jù)產(chǎn)品中主要提供兩個(gè)功能:
- 幫助系統(tǒng)避免單點(diǎn)故障,建立可靠的應(yīng)用程序。
- 提供分布式協(xié)作服務(wù)和維護(hù)配置信息。
2.ZooKeeper結(jié)構(gòu)
ZooKeeper集群中的節(jié)點(diǎn)分為三種角色:Leader、Follower和Observer,其結(jié)構(gòu)和相互關(guān)系如下圖所示。通常來說,需要在集群中配置奇數(shù)個(gè)(2N+1)ZooKeeper服務(wù),至少(N+1)個(gè)投票才能成功的執(zhí)行寫操作。
ZooKeeper結(jié)構(gòu)
上圖中各部分的功能說明如下表所示。
名稱 | 描述 |
---|---|
Leader | 在ZooKeeper集群中只有一個(gè)節(jié)點(diǎn)作為集群的領(lǐng)導(dǎo)者,由各Follower通過ZooKeeper Atomic Broadcast(ZAB)協(xié)議選舉產(chǎn)生,主要負(fù)責(zé)接收和協(xié)調(diào)所有寫請求,并把寫入的信息同步到Follower和Observer。 |
Follower | Follower的功能有兩個(gè):1.每個(gè)Follower都作為Leader的儲備,當(dāng)Leader故障時(shí)重新選舉Leader,避免單點(diǎn)故障。2.處理讀請求,并配合Leader一起進(jìn)行寫請求處理。 |
Observer | Observer不參與選舉和寫請求的投票,只負(fù)責(zé)處理讀請求、并向Leader轉(zhuǎn)發(fā)寫請求,避免系統(tǒng)處理能力浪費(fèi)。 |
Client | ZooKeeper集群的客戶端,對ZooKeeper集群進(jìn)行讀寫操作。例如HBase可以作為ZooKeeper集群的客戶端,利用ZooKeeper集群的仲裁功能,控制其HMaster的“Active”和“Standby”狀態(tài)。 |
如果集群啟用了安全服務(wù),在連接ZooKeeper時(shí)需要進(jìn)行身份認(rèn)證,認(rèn)證方式有以下兩種:
- keytab方式:需要從MRS集群管理員處獲取一個(gè)“人機(jī)”用戶,用于登錄MRS平臺并通過認(rèn)證,并且獲取到該用戶的keytab文件。
- 票據(jù)方式:從MRS集群管理員處獲取一個(gè)“人機(jī)”用戶,用于后續(xù)的安全登錄,開啟Kerberos服務(wù)的renewable和forwardable開關(guān)并且設(shè)置票據(jù)刷新周期,開啟成功后重啟kerberos及相關(guān)組件。
注意:
- 默認(rèn)情況下,用戶的密碼有效期是90天,所以獲取的keytab文件的有效期是90天。
- Kerberos服務(wù)的renewable、forwardable開關(guān)和票據(jù)刷新周期的設(shè)置在Kerberos服務(wù)的配置頁面的“系統(tǒng)”標(biāo)簽下,票據(jù)刷新周期的修改可以根據(jù)實(shí)際情況修改“kdc_renew_lifetime”和“kdc_max_renewable_life”的值。
3. ZooKeeper原理
寫請求
- Follower或Observer接收到寫請求后,轉(zhuǎn)發(fā)給Leader。
- Leader協(xié)調(diào)各Follower,通過投票機(jī)制決定是否接受該寫請求。
- 如果超過半數(shù)以上的Leader、Follower節(jié)點(diǎn)返回寫入成功,那么Leader提交該請求并返回成功,否則返回失敗。
- Follower或Observer返回寫請求處理結(jié)果。
只讀請求
客戶端直接向Leader、Follower或Observer讀取數(shù)據(jù)。
4. ZooKeeper和HDFS的關(guān)系
ZooKeeper與HDFS的關(guān)系如下圖所示。
ZKFC(ZKFailoverController)作為一個(gè)ZooKeeper集群的客戶端,用來監(jiān)控NameNode的狀態(tài)信息。ZKFC進(jìn)程僅在部署了NameNode的節(jié)點(diǎn)中存在。HDFS NameNode的Active和Standby節(jié)點(diǎn)均部署有zkfc進(jìn)程。
- HDFS NameNode的ZKFC連接到ZooKeeper,把主機(jī)名等信息保存到ZooKeeper中,即“/hadoop-ha”下的znode目錄里。先創(chuàng)建znode目錄的NameNode節(jié)點(diǎn)為主節(jié)點(diǎn),另一個(gè)為備節(jié)點(diǎn)。HDFS NameNode Standby通過ZooKeeper定時(shí)讀取NameNode信息。
- 當(dāng)主節(jié)點(diǎn)進(jìn)程異常結(jié)束時(shí),HDFS NameNode Standby通過ZooKeeper感知“/hadoop-ha”目錄下發(fā)生了變化,NameNode會進(jìn)行主備切換。
5. ZooKeeper和YARN的關(guān)系
ZooKeeper與YARN的關(guān)系如下圖所示。
- 在系統(tǒng)啟動時(shí),ResourceManager會嘗試把選舉信息寫入ZooKeeper,第一個(gè)成功寫入ZooKeeper的ResourceManager被選舉為Active ResourceManager,另一個(gè)為Standby ResourceManager。Standby ResourceManager定時(shí)去ZooKeeper監(jiān)控Active ResourceManager選舉信息。
- Active ResourceManager還會在ZooKeeper中創(chuàng)建Statestore目錄,存儲Application相關(guān)信息。當(dāng)Active ResourceManager產(chǎn)生故障時(shí),Standby ResourceManager會從Statestore目錄獲取Application相關(guān)信息,恢復(fù)數(shù)據(jù)。
6. ZooKeeper和HBase的關(guān)系
ZooKeeper與HBase的關(guān)系如下圖所示。
- HRegionServer以Ephemeral node的方式注冊到ZooKeeper中。其中ZooKeeper存儲HBase的如下信息:HBase元數(shù)據(jù)、HMaster地址。
- HMaster通過ZooKeeper隨時(shí)感知各個(gè)HRegionServer的健康狀況,以便進(jìn)行控制管理。
- .HBase也可以部署多個(gè)HMaster,類似HDFS NameNode,當(dāng)HMaster主節(jié)點(diǎn)出現(xiàn)故障時(shí),HMaster備用節(jié)點(diǎn)會通過ZooKeeper獲取主HMaster存儲的整個(gè)HBase集群狀態(tài)信息。即通過ZooKeeper實(shí)現(xiàn)避免HBase單點(diǎn)故障問題的問題。
7. Zookeeper和SmallFS的配合關(guān)系
FGCService的部署模式為HA模式。HA(High Availability)模式目的是防止單節(jié)點(diǎn)故障導(dǎo)致服務(wù)不可用。為了支持HA模式,FGCService依賴于ZooKeeper。
8. ZooKeeper和Kafka的配合關(guān)系
ZooKeeper與Kafka的關(guān)系如下圖 ZooKeeper和Kafka的關(guān)系所示。
- Broker端使用ZooKeeper用來注冊broker信息,并進(jìn)行partition leader選舉
- Consumer端使用ZooKeeper用來注冊consumer信息,其中包括consumer·消費(fèi)的partition列表等,同時(shí)也用來發(fā)現(xiàn)broker列表,并和partition leader建立socket連接,并獲取消息。