高可用性可以在以下幾個層面實現(xiàn):
1應(yīng)用層高可用性:如實現(xiàn)mysql、oracle數(shù)據(jù)庫應(yīng)用程序的群集,主要是判斷mysql、oracle應(yīng)用程序是否停止運行。
2操作系統(tǒng)高可用性:如windows的故障轉(zhuǎn)移群集(windows failover clusteringWFC)。
3虛擬化層的高可用性:如vsphere high availability(HA)和vsphere faulttolerance(FT)。
4物理層的高可用性:如:多網(wǎng)絡(luò)適配器、SAN等。
vSphere HA和Fault Tolerance(FT)功能分別通過提供中斷快速恢復(fù)和連續(xù)可用性來最小化或消除非計劃停機時間。
使用vSphere,企業(yè)可以輕松提高為所有應(yīng)用程序提供的基準級別,并且以更低成本和更簡單的操作來實現(xiàn)更高級別的可用性。使用vSphere,你可以:
a獨立于硬件、操作系統(tǒng)和應(yīng)用程序提供更高可用性。
b減少常見維護操作的計劃停機時間。
c在出現(xiàn)故障時提供自動恢復(fù)。
一、vSphere HA提供快速中斷恢復(fù)
vSphere HA利用配置為群集的多臺ESXi主機,為虛擬機中運行的應(yīng)用程序提供快速中斷恢復(fù)和具有成本效益的高可用性。
vSphere HA通過以下方式保護應(yīng)用程序可用性:
1通過在群集內(nèi)的其他主機上重新啟動虛擬機,防止服務(wù)器故障。
2通過持續(xù)監(jiān)控虛擬機(通過vmware tools實現(xiàn)主機向虛擬機發(fā)送檢測信號)并在檢測到故障時對其進行重新設(shè)置,防止應(yīng)用程序故障。
與其他群集解決方案不同,vSphere HA提供基礎(chǔ)架構(gòu)并使用該基礎(chǔ)架構(gòu)保護所有工作負載:
a無需在應(yīng)用程序或虛擬機內(nèi)安裝特殊軟件。所有工作負載均受vSphere HA保護。配置vSphere HA之后,不需要執(zhí)行操作即可保護新虛擬機。它們會自動受到保護。
b可以將vSphere HA與vSphere Distributed Resource Scheduler (DRS)結(jié)合使用以防止出現(xiàn)故障,以及在群集內(nèi)的主機之間提供負載平衡。
與傳統(tǒng)的故障切換解決方案相比,vSphere HA具有多個優(yōu)勢:
最小化設(shè)置 | 設(shè)置vSphere HA群集之后,群集內(nèi)的所有虛擬機無需額外配置即可獲得故障切換支持。 |
減少了硬件成本和設(shè)置 | 虛擬機可充當應(yīng)用程序的移動容器,可在主機之間移動。管理員會避免在多臺計算機上進行重復(fù)配置。使用vSphere HA時,必須擁有足夠的資源來對要通過vSphere HA保護的主機數(shù)進行故障切換。但是,vCenter Server系統(tǒng)會自動管理資源并配置群集。 |
提高了應(yīng)用程序的可用性 | 虛擬機內(nèi)運行的任何應(yīng)用程序的可用性變得更高。虛擬機可以從硬件故障中恢復(fù),通過監(jiān)控和響應(yīng)VMwareTools檢測信號并重新啟動未響應(yīng)的虛擬機,可防止客戶機操作系統(tǒng)崩潰。 |
DRS和vMotion集成 | 如果主機發(fā)生了故障,并且在其他主機上重新啟動了虛擬機,則DRS會提出遷移建議或遷移虛擬機以平衡資源分配。 |
vSphere HA群集允許ESXi主機集合作為一個組協(xié)同工作,這些主機為虛擬機提供的可用性級別比ESXi主機單獨提供的級別要高。
群集中的主機均會受到監(jiān)控,如果發(fā)生故障,故障主機上的虛擬機將在備用主機上重新啟動。
創(chuàng)建vSphere HA群集時,你可以選擇使用單個主機作為選主機(master)以與vCenterServer通信并監(jiān)控其他主機、從屬主機(slave)及其虛擬機的狀況。
如果為群集啟用了vSphere HA,則所有活動主機(未處于待機或維護模式的主機或未斷開連接的主機)都將參與選舉以選擇群集的選主機。掛載最多數(shù)量的數(shù)據(jù)存儲的主機在選舉中具有優(yōu)勢。每個群集只存在一臺選主機,其他所有主機都是從屬主機。如果選主機出現(xiàn)故障、關(guān)機或從群集中移除,則會進行新的選舉。
群集中的選主機具有很多職責(zé):
1監(jiān)控從屬主機的狀況。如果從屬主機發(fā)生故障或無法訪問,選主機將確定需要重新啟動的虛擬機。
2監(jiān)控所有受保護虛擬機的電源狀況。如果有一臺虛擬機出現(xiàn)故障,選主機可確保重新啟動該虛擬機。使用本地放置引擎,選主機還可確定執(zhí)行重新啟動的位置。
3選主機管理群集主機和受保護的虛擬機列表并對添加或刪除cluster內(nèi)部的主機進行管理即選主機維護著群集內(nèi)的清單。
4選主機管理被保護的虛擬機清單,在用戶每次發(fā)起開關(guān)機操作時,更新這個清單。vcenter server會要求保護或不保護某些虛擬機。即當虛擬機打開電源,則該虛擬機要受保護,一旦主機出現(xiàn)故障就會在其他主機上重新啟動虛擬機。當虛擬機關(guān)閉電源,就沒有必要再保護它了。
5選主機緩存cluster的配置,master主機通知和提醒slave主機,cluster配置的修改。
6 master主機發(fā)送心跳信息給slave主機,讓slave主機知道m(xù)aster的存在。如果slave主機接收不到心跳信息,則重新選舉出新的選主機。
7master報告狀態(tài)信息給vcenter,vcenter正常情況只與master主機通信。
選主機執(zhí)行的功能之一是虛擬機保護。虛擬機受保護時,vSphere HA可保證在其出現(xiàn)故障后嘗試重新打開電源。
選主機在觀察到虛擬機的電源狀況由關(guān)閉電源變?yōu)榇蜷_電源時,會致力于保護虛擬
機。如果發(fā)生故障切換,選主機必須重新啟動所負責(zé)的受保護的虛擬機。該職責(zé)已分配給在包含虛擬機配置文件的數(shù)據(jù)存儲上以獨占方式鎖定系統(tǒng)定義文件的選主機。
群集中從主機的職責(zé):
1 slave主機監(jiān)視本地運行的虛擬機的狀態(tài),把這些虛擬機運行狀態(tài)的顯著變化發(fā)給master主機。
2 slave主機監(jiān)視master主機的健康狀態(tài),如果master主機出現(xiàn)故障,slave主機參與master的選舉。
3 slave運用vSphere HA接入控制vSphereHA特性,這些特性不需要master的協(xié)調(diào)。這些特性包括VMHealth Monitoring。
查看master和slave的狀態(tài):
主機故障類型和檢測
vSphere HA群集的選主機負責(zé)檢測從屬主機的故障。根據(jù)檢測到的故障類型,在主機上運行的虛擬機可能需要進行故障切換。
在vSphere HA群集中,檢測三種類型的主機故障:
1主機停止運行(即發(fā)生故障)。
2主機與網(wǎng)絡(luò)隔離。
3主機失去與選主機的網(wǎng)絡(luò)連接。
vSphere HA使用管理網(wǎng)絡(luò)和存儲設(shè)備來聯(lián)系。當master通過管理網(wǎng)絡(luò)聯(lián)系不到slave時,master就會使用存儲網(wǎng)絡(luò)(heartbeat datastores)來檢查slave是否存活。
選主機監(jiān)控群集中從屬主機是通過交換網(wǎng)絡(luò)檢測信號來完成,此通信通過管理網(wǎng)絡(luò)來完成。當選主機不能通過管理網(wǎng)絡(luò)(如選主機或從屬主機的網(wǎng)絡(luò)接口出故障)從從屬主機接收這些檢測信號時,它會在聲明該主機出現(xiàn)故障之前檢查主機活躍度。選主機執(zhí)行的活躍度檢查是要確定從屬主機是否在與數(shù)據(jù)存儲(即存儲網(wǎng)絡(luò))交換檢測信號。如果此從屬主機與數(shù)據(jù)存儲交換檢測信號,則選主機會假定它處于某個網(wǎng)絡(luò)分區(qū)或網(wǎng)絡(luò)隔離中,因此會繼續(xù)監(jiān)控該主機及其虛擬機。
網(wǎng)絡(luò)分區(qū):一個或多個slave通過管理網(wǎng)絡(luò)聯(lián)系不到master,即使它們的網(wǎng)絡(luò)連接沒有問題,這種情況下,vSphere HA能夠了使用存儲網(wǎng)絡(luò)來檢測分離的主機(上面的slaves)是否存活以及否要保護它們里面的虛擬機。
網(wǎng)絡(luò)隔離:一個或多個slave丟失了所有的管理網(wǎng)絡(luò)連接,這樣的slave既不能聯(lián)系到master也不能聯(lián)系到其他ESXi hosts。這種情況下,slave主機通過存儲網(wǎng)絡(luò)來通知master,它已經(jīng)是隔離狀態(tài)。
注意:如果你確保網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)具有足夠的冗余度且至少有一個網(wǎng)絡(luò)路徑始終可用,則主機網(wǎng)絡(luò)隔離應(yīng)該在極少數(shù)情況下才出現(xiàn)。
在vSphere HA群集發(fā)生管理網(wǎng)絡(luò)故障時,該群集中的部分主機可能無法通過管理網(wǎng)絡(luò)與其他主機進行通信。一個群集中可能會出現(xiàn)多個分區(qū)。
已分區(qū)的群集會導(dǎo)致虛擬機保護和群集管理功能降級
1虛擬機保護。vCenter Server允許虛擬機打開電源,但僅當虛擬機與負責(zé)它的選主機在相同的分區(qū)中運行時,才會對其進行保護。
2群集管理。vCenter Server只能與群集中的部分主機進行通信,且只能連接到一臺選主機。因此,只有在解決分區(qū)之后,配置中影響vSphere HA的更改才能生效。此故障可能會導(dǎo)致其中一個分區(qū)在舊配置下操作,而另一個分區(qū)使用新的設(shè)置
總結(jié):當vSphere HA群集中的選主機無法通過管理網(wǎng)絡(luò)與從屬主機通信時,選主機將使用數(shù)據(jù)存儲檢測信號來確定從屬主機是否出現(xiàn)故障,是否位于網(wǎng)絡(luò)分區(qū)中,或者是否與網(wǎng)絡(luò)隔離。如果從屬主機已停止數(shù)據(jù)存儲檢測信號,則認為該從屬主機出現(xiàn)故障,并且其虛擬機已在別處重新啟動。
vCenterServer使用vSphere HA主機狀況報告主機是選主機還是從屬主機。如果已啟用“HA狀況”列,則會在vSphere Client中主機的摘要選項卡上和群集或數(shù)據(jù)中心的“主機列表”視圖中報告此狀況。HA狀況“正在運行(master)”表示主機作為vSphere HA選主機。“已連接(slave)”狀況表示主機作為vSphere HA從屬主機。
注意:如果斷開主機與群集之間的連接,則所有向該主機注冊的虛擬機均不受vSphere HA保護。
vCenterServer使用接入控制來確保群集內(nèi)具有足夠的資源,以便提供故障切換保護。
1、“群集允許的主機故障數(shù)目”接入控制策略:
使用“群集允許的主機故障數(shù)目”接入控制策略,vSphere HA允許指定數(shù)目的主機出現(xiàn)故障,同時可以確保群集內(nèi)留有足夠的資源來對這些主機上的虛擬機進行故障切換。
使用“群集允許的主機故障數(shù)目”策略,vSphere HA以下列方式執(zhí)行接入控制:
1插槽大小計算
插槽大小由兩個組件(CPU和內(nèi)存)組成。
avSphere HA計算CPU組件的方法是先獲取每臺已打開電源虛擬機的CPU預(yù)留,然后再選擇大值。如果沒有為虛擬機指定CPU預(yù)留,則系統(tǒng)會為其分配一個默認值32 MHz。
bvSphere HA計算內(nèi)存組件的方法是先獲取每臺已打開電源虛擬機的內(nèi)存預(yù)留和內(nèi)存開銷,然后再選擇大值。內(nèi)存預(yù)留沒有默認值。
2、使用插槽數(shù)目計算當前故障切換容量
計算出插槽大小后,vSphere HA會確定每臺主機中可用于虛擬機的CPU和內(nèi)存資源。通過使用vSphere Client直接連接到主機,然后導(dǎo)航至主機的資源選項卡,可以找到由vSphere HA使用的主機資源數(shù)據(jù)。然后,即可確定每臺主機可以支持的大插槽數(shù)目。為確定此數(shù)目,請用主機的CPU資源數(shù)除以插槽大小的CPU組件,然后將結(jié)果化整。對主機的內(nèi)存資源數(shù)進行同樣的計算。然后,比較這兩個數(shù)字,較小的那個數(shù)字即為主機可以支持的插槽數(shù)。
通過確定可以發(fā)生故障并仍然有足夠插槽滿足所有已打開電源虛擬機要求的主機的數(shù)目(從大值開始)來計算當前故障切換容量。
附錄:高級運行時信息
如果選擇“群集允許的主機故障數(shù)目”接入控制策略,高級運行時信息鏈接則會在vSphere Client中群集摘要選項卡上的vSphere HA區(qū)域中顯示。單擊此鏈接以顯示有關(guān)群集的下列信息:
a插槽大小。
b群集內(nèi)的插槽總數(shù)。
c已使用的插槽數(shù)。分配給已打開電源的虛擬機的插槽數(shù)目。如果已使用高級選項定義插槽大小的上限,則此數(shù)目可以大于已打開電源的虛擬機的數(shù)目。這是因為有些虛擬機會占用多個插槽。
d可用插槽數(shù)。可用于打開群集內(nèi)其他虛擬機的電源的插槽數(shù)量。vSphere HA保留故障切換所需的插槽數(shù)量。剩余的插槽可用于打開新虛擬機電源。
e故障切換插槽數(shù)。除已使用的插槽和可用插槽之外的插槽總數(shù)。
f群集中已打開電源虛擬機的總數(shù)。
g群集中的主機總數(shù)。
h群集中的正常主機總數(shù)。處于連接狀態(tài)、未進入維護模式而且沒有vSphere HA錯誤的主機數(shù)目。
示例:使用“群集允許的主機故障數(shù)目”策略的接入控制
示例中展示了使用此接入控制策略計算和使用插槽大小的方式。對群集進行如下假設(shè):
1群集包括三臺主機,每臺主機上可用的CPU和內(nèi)存資源數(shù)各不相同。第一臺主機(H1)的可用CPU資源和可用內(nèi)存分別為9 GHz和9 GB,第二臺主機(H2)為9 GHz和6 GB,而第三臺主機(H3)則為6 GHz和6 GB。
2群集內(nèi)存在五個已打開電源的虛擬機,其CPU和內(nèi)存要求各不相同。VM1所需的CPU資源和內(nèi)存分別為2 GHz和1 GB,VM2為2 GHz和1 GB,VM3為1 GHz和2 GB,VM4為1 GHz和1 GB,VM5則為1 GHz和1 GB。
3“群集允許的主機故障數(shù)目”設(shè)置為1。
1比較虛擬機的CPU和內(nèi)存要求,然后選擇大值,從而計算出插槽大小。
大CPU要求(由VM1和VM2共享)為2 GHz,而大內(nèi)存要求(針對VM3)為2 GB。根據(jù)上述情況,插槽大小為2 GHz CPU和2 GB內(nèi)存。
2由此可確定每臺主機可以支持的大插槽數(shù)目。
H1可以支持四個插槽。H2可以支持三個插槽(取9GHz/2GHz和6GB/2GB中較小的一個),H3也可以支持三個插槽。
3計算出當前故障切換容量。
大的主機是H1,如果它發(fā)生故障,群集內(nèi)還有六個插槽,足夠供所有五個已打開電源的虛擬機使用。如果H1和H2都發(fā)生故障,群集內(nèi)將僅剩下三個插槽,這是不夠用的。因此,當前故障切換容量為1。
群集內(nèi)可用插槽的數(shù)目為1(H2和H3上的六個插槽減去五個已使用的插槽)。
建議最好不使用“群集允許的主機故障數(shù)目”策略的接入控制,因為如果群集內(nèi)部的主機硬件性能不一時,就不好確定故障數(shù)目了。除非群集內(nèi)部的主機硬件性能一致時可以使用此策略。
2、“預(yù)留的群集資源的百分比”接入控制策略
可以將vSphere HA配置為通過預(yù)留特定百分比的群集CPU和內(nèi)存資源來執(zhí)行接入控制,用于從主機故障中進行恢復(fù)。
使用“預(yù)留的群集資源的百分比”接入控制策略,vSphere HA可確保預(yù)留CPU和內(nèi)存資源總量的指定百分比以用于故障切換。
使用“預(yù)留的群集資源”策略,vSphere HA可強制執(zhí)行下列接入控制:
1計算群集內(nèi)所有已打開電源虛擬機的總資源要求。
2計算可用于虛擬機的主機資源總數(shù)。
3計算群集的“當前的CPU故障切換容量”和“當前的內(nèi)存故障切換容量”。
4確定“當前的CPU故障切換容量”或“當前的內(nèi)存故障切換容量”是否小于對應(yīng)的“配置的故障切換容量”(由用戶提供)。如果是,則接入控制不允許執(zhí)行此操作。
注意 “預(yù)留的群集資源的百分比”接入控制策略還會檢查群集中是否至少有兩個已啟用vSphere HA的主機(不包括正在進入維護模式的主機)。如果只有一個已啟用vSphere HA的主機,即使可以使用足夠的資源百分比,也不允許執(zhí)行此操作。進行此次額外檢查的原因在于如果群集中只有一個主機,則vSphere HA無法進行故障切換。
計算當前故障切換容量
已打開電源的虛擬機的總資源要求由兩個組件組成,即CPU和內(nèi)存。vSphere HA將計算這些值。
1CPU組件值的計算方法是:加總已打開電源虛擬機的CPU預(yù)留。如果沒有為虛擬機指定CPU預(yù)留,則系統(tǒng)會為其分配一個默認值32 MHz。
2內(nèi)存組件值的計算方法是:加總每臺已打開電源虛擬機的內(nèi)存預(yù)留(以及內(nèi)存開銷)。
計算出主機的CPU和內(nèi)存資源總和,從而得出虛擬機可使用的主機資源總數(shù)。
先用主機CPU資源總數(shù)減去總CPU資源要求,然后再用這個結(jié)果除以主機CPU資源總數(shù),從而計算出“當前的CPU故障切換容量”。“當前的內(nèi)存故障切換容量”的計算方式與之相似。
示例:使用“預(yù)留的群集資源的百分比”策略的接入控制
示例中展示了使用此接入控制策略計算和使用“當前故障切換容量”的方式。對群集進行如下假設(shè):
1群集包括三臺主機,每臺主機上可用的CPU和內(nèi)存資源數(shù)各不相同。第一臺主機(H1)的可用CPU資源和可用內(nèi)存分別為9 GHz和9 GB,第二臺主機(H2)為9 GHz和6 GB,而第三臺主機(H3)則為6 GHz和6 GB。
2群集內(nèi)存在五個已打開電源的虛擬機,其CPU和內(nèi)存要求各不相同。VM1所需的CPU資源和內(nèi)存分別為2 GHz和1 GB,VM2為2 GHz和1 GB,VM3為1 GHz和2 GB,VM4為1 GHz和1 GB,VM5則為1 GHz和1 GB。
3“配置的故障切換容量”設(shè)置為25%。
已打開電源的虛擬機的總資源要求為7 GHz CPU和6 GB內(nèi)存。可用于虛擬機的主機資源總數(shù)為24 GHz CPU和21 GB內(nèi)存。
根據(jù)上述情況,“當前的CPU故障切換容量”為70% ((24GHz - 7GHz)/24GHz)。同樣,“當前的內(nèi)存故障切換容量”為71% ((21GB-6GB)/21GB)。
由于群集的“配置的故障切換容量”設(shè)置為25%,因此仍然可使用45%的群集CPU資源總數(shù)和46%的群集內(nèi)存資源打開其他虛擬機電源。
3、“指定故障切換主機”接入控制策略
在配置vSphere HA時可以將特定主機指定為故障切換主機。
如果使用“指定故障切換主機”接入控制策略,則在主機發(fā)生故障時,vSphere HA將嘗試在指定的故障切換主機之一上重新啟動其虛擬機
注意 如果使用“指定故障切換主機”接入控制策略,并指定多個故障切換主機,則DRS不會對故障切換主機進行負載平衡
vSphereClient中群集的摘要選項卡的vSphere HA區(qū)域內(nèi)顯示了“當前故障切換主機”。每個主機旁邊的狀態(tài)圖標可以是綠色、×××或紅色。
1綠色。主機處于連接狀態(tài)、未進入維護模式且沒有vSphere HA錯誤。主機上沒有任何已打開電源的虛擬機。
2×××。主機處于連接狀態(tài)、未進入維護模式且沒有vSphere HA錯誤。但是,主機上駐留了已打開電源的虛擬機。
3紅色。主機已斷開連接、處于維護模式或存在vSphere HA錯誤。
vSphere HA群集的要求
在設(shè)置vSphereHA群集之前,應(yīng)滿足以下要求:
1所有主機必須獲得vSphereHA許可。
2群集中至少需要有兩臺主機。
3需要為所有主機配置靜態(tài)IP地址。
4所有主機應(yīng)該至少有一個公共的管理網(wǎng)絡(luò),最佳做法則至少需要有兩個。
5版本4.0及更高版本的ESXi主機-已選中了復(fù)選框的VMkernel網(wǎng)絡(luò)。
6為了確保任何虛擬機都可以在群集內(nèi)的任何主機上運行,所有主機都應(yīng)該可以訪問相同的虛擬機網(wǎng)絡(luò)和數(shù)據(jù)存儲。同樣,虛擬機必須位于共享而非本地存儲器上,否則在主機出現(xiàn)故障時它們將無法進行故障切換。
注意vSphere HA使用數(shù)據(jù)存儲信號檢測來區(qū)分已分區(qū)的主機、已隔離的主機和出現(xiàn)故障的主機。相應(yīng)地,必須確保為vSphere HA預(yù)留的數(shù)據(jù)存儲始終立即可用。
7為了使虛擬機監(jiān)控工作,必須安裝VMware Tools。
總結(jié):vSphere HA群集的要求和Vmotion的要要求類似。
創(chuàng)建vSphere HA群集
可以為群集啟用vSphere HA。啟用了vSphere HA的群集是Fault Tolerance的必備條件。VMware建議你首先創(chuàng)建空群集。在規(guī)劃好群集的資源和網(wǎng)絡(luò)架構(gòu)之后,可以使用vSphere Client將主機添加到群集,并指定群集的vSphere HA設(shè)置。
步驟
1選擇“主機和群集”視圖。
2右鍵單擊清單樹中的數(shù)據(jù)中心,然后單擊新建群集。
3完成新建群集向?qū)А?/p>
此時不要啟用vSphere HA(或DRS)。
4單擊完成,關(guān)閉向?qū)Р?chuàng)建群集。
此時創(chuàng)建了一個空群集。
5根據(jù)你的群集資源和網(wǎng)絡(luò)架構(gòu)計劃,使用vSphere Client將主機添加到群集。
6右鍵單擊群集,然后單擊編輯設(shè)置。
在群集的“設(shè)置”對話框中,你可以修改群集的vSphere HA(和其他)設(shè)置。
7在“群集功能”頁上,選擇打開vSphere HA。
8根據(jù)需要為群集配置vSphere HA設(shè)置。
a主機監(jiān)控狀態(tài)
b接入控制
c虛擬機選項
d虛擬機監(jiān)控
e數(shù)據(jù)存儲檢測信號
9單擊確定關(guān)閉群集的“設(shè)置”對話框。
1、群集功能
新建群集向?qū)е械牡谝粋€面板可用于為群集指定基本選項。
在該面板中,可以指定群集名稱并選擇一個或兩個群集功能。
名稱指定群集的名稱。該名稱顯示在vSphere Client清單面板中。必須指定一個名
稱,才能繼續(xù)創(chuàng)建群集。
打開vSphere HA如果選中此復(fù)選框,則在主機出現(xiàn)故障時,虛擬機將在群集內(nèi)的其他主機上重新啟動。要在群集內(nèi)的任何虛擬機上啟用vSphere Fault Tolerance,必須打開vSphere HA。
打開vSphere DRS如果選中此復(fù)選框,則DRS將平衡整個群集的虛擬機負載。即使虛擬機受HA保護,DRS也會放置并遷移虛擬機。
2、主機監(jiān)控狀態(tài)
創(chuàng)建群集后,請啟用主機監(jiān)控以便vSphere HA可以監(jiān)控由群集內(nèi)每個主機上的vSphere HA代理發(fā)送的檢測信號。
如果選擇啟用主機監(jiān)控,則會檢查群集內(nèi)的每臺主機以確保其正在運行。如果某臺主機出現(xiàn)故障,則會在另一臺主機上重新啟動虛擬機。主機監(jiān)控還是vSphere Fault Tolerance恢復(fù)進程正常運行所必需的。
注意:如果需要執(zhí)行可能會觸發(fā)主機隔離響應(yīng)的網(wǎng)絡(luò)維護,VMware建議首先禁用主機監(jiān)控以掛起vSphereHA。完成維護后,請重新啟用“主機監(jiān)控”。
3、啟用或禁用接入控制
通過新建群集向?qū)В梢詾関Sphere HA群集啟用或禁用接入控制,并選擇有關(guān)其執(zhí)行方式的策略。可以為vSphere HA群集啟用或禁用接入控制。
啟用:禁止違反可用性限制的打開虛擬機電源操作啟用接入控制并執(zhí)行可用性限制,同時保留故障切換容量。不允許在虛擬機上執(zhí)行違反可用性限制的任何操作。
禁用:允許違反可用性限制的打開虛擬機電源操作
禁用接入控制。例如,即使打開虛擬機電源會造成故障切換容量不足,仍然可執(zhí)行該操作。執(zhí)行該操作時,不會顯示任何警告,而且群集不會變?yōu)榧t色。如果群集的故障切換容量不足,vSphere HA仍可以執(zhí)行故障切換,并使用“虛擬機重新啟動優(yōu)先級”設(shè)置來確定要先打開電源的虛擬機。
如果啟用了接入控制,vSphere HA會提供三個強制接入控制的策略。
1群集允許的主機故障數(shù)量
2作為故障切換空間容量保留的群集資源的百分比
3指定故障切換主機
4、虛擬機選項
默認虛擬機設(shè)置控制虛擬機的重新啟動順序(虛擬機重新啟動優(yōu)先級)以及在主機之間失去網(wǎng)絡(luò)連接時vSphereHA的響應(yīng)方式(主機隔離響應(yīng))。
這些設(shè)置適用于主機發(fā)生故障或主機隔離時群集內(nèi)的所有虛擬機。此外,也可以為特定虛擬機配置異常。
虛擬機重新啟動優(yōu)先級設(shè)置
虛擬機重新啟動優(yōu)先級確定主機發(fā)生故障后虛擬機的重新啟動相對順序。這些虛擬機在新主機上按順序重新啟動,首先啟動優(yōu)先級高的虛擬機,然后是那些低優(yōu)先級的虛擬機,直到重新啟動所有虛擬機或者沒有更多的可用群集資源為止。如果主機故障數(shù)目超過了接入控制所允許的數(shù)目,則系統(tǒng)可能會等到有更多資源可用時再重新啟動優(yōu)先級較低的虛擬機。如果指定了一個故障切換主機,則虛擬機將在該故障切換主機上重新啟動。
此設(shè)置的值為:已禁用、低、中等(默認)和高。如果選擇“已禁用”,則會為虛擬機禁用vSphere HA,這意味著當其主機出現(xiàn)故障時不會在其他ESXi主機上重新啟動虛擬機。“已禁用”設(shè)置不會對虛擬機監(jiān)控造成影響,這意味著當正常運行的主機上的某個虛擬機出現(xiàn)故障時,會在同一主機上重置該虛擬機。你可更改各個虛擬機的這種設(shè)置。
虛擬機的重新啟動優(yōu)先級設(shè)置因用戶需求而有所不同。VMware建議為提供最重要服務(wù)的虛擬機分配較高的重新啟動優(yōu)先級。
主機隔離響應(yīng)設(shè)置
主機隔離響應(yīng)確定當vSphere HA群集內(nèi)的某個主機失去其管理網(wǎng)絡(luò)連接但仍繼續(xù)運行時出現(xiàn)的情況。
主機會執(zhí)行其隔離響應(yīng)。響應(yīng)包括:保持打開電源(默認值)、關(guān)閉電源和關(guān)機。還可以為各個虛擬機自定義此屬性。
要使用“關(guān)機”設(shè)置,必須在虛擬機的客戶機操作系統(tǒng)中安裝VMware Tools。將虛擬機關(guān)機的優(yōu)點在于可以保留其狀況。關(guān)機操作優(yōu)于關(guān)閉虛擬機電源操作,關(guān)閉虛擬機電源不會將最近的更改刷新到磁盤中,也不會提交事務(wù)。
5、虛擬機和應(yīng)用程序監(jiān)控
如果在設(shè)置的時間內(nèi)沒有收到單個虛擬機的VMware Tools檢測信號,虛擬機監(jiān)控將重新啟動該虛擬機。同樣,如果沒有收到虛擬機正在運行的應(yīng)用程序的檢測信號,應(yīng)用程序監(jiān)控也可以重新啟動該虛擬機。可以啟用這些功能,并配置vSphere HA監(jiān)控?zé)o響應(yīng)時的敏感度。
啟用虛擬機監(jiān)控后,虛擬機監(jiān)控服務(wù)(使用VMware Tools)將通過檢查正在客戶機內(nèi)運行的VMware Tools進程的常規(guī)檢測信號和I/O活動來評估群集內(nèi)的每個虛擬機是否正在運行。如果沒有收到檢測信號或I/O活動,則很有可能是客戶機操作系統(tǒng)出現(xiàn)故障,或未分配給VMware Tools用來完成任務(wù)的時間。在這種情況下,虛擬機監(jiān)控服務(wù)會先確定虛擬機已發(fā)生故障,然后決定重新引導(dǎo)虛擬機以還原服務(wù)。
你可以配置監(jiān)控敏感度的級別。高敏感度監(jiān)控可以更快得出已發(fā)生故障的結(jié)論。然而,如果受監(jiān)控的虛擬機或應(yīng)用程序?qū)嶋H上仍在運行,但由于資源限制等因素導(dǎo)致未收到檢測信號,高敏感度監(jiān)控可能會錯誤地認為此虛擬機發(fā)生了故障。低敏感度監(jiān)控會延長實際故障和虛擬機重置之間服務(wù)中斷的時間。請選擇一個有效折衷滿足需求的選項。
二、vSphere Fault Tolerance提供連續(xù)可用性
vSphere HA通過在主機出現(xiàn)故障時重新啟動虛擬機來為虛擬機提供基本級別的保護。因此它的缺點就是存在宕機時間,可能是幾分鐘也可能是十幾分鐘。
可以為虛擬機啟用vSphere FaultTolerance,以獲得比vSphere HA所提供的級別更高的可用性和數(shù)據(jù)保護,從而確保業(yè)務(wù)連續(xù)性。
vSphere FaultTolerance通過創(chuàng)建和維護與主虛擬機相同,且可在發(fā)生故障切換時隨時替換主虛擬機的輔助虛擬機,來確保虛擬機的連續(xù)可用性。
要獲取FaultTolerance的最佳結(jié)果,應(yīng)先熟悉其工作原理、如何為群集和虛擬機啟用它及其最佳使用方法。
可以為大多數(shù)任務(wù)關(guān)鍵虛擬機啟用FaultTolerance。并會創(chuàng)建一個重復(fù)虛擬機(稱為輔助虛擬機),該虛擬機會以虛擬鎖步(vLockstep)方式隨主虛擬機一起運行。VMware vLockstep可捕獲主虛擬機上發(fā)生的輸入和事件,并將這些輸入和事件發(fā)送到正在另一主機上運行的輔助虛擬機。使用此信息,輔助虛擬機的執(zhí)行將等同于主虛擬機的執(zhí)行。因為輔助虛擬機與主虛擬機一起以虛擬鎖步方式運行,所以它可以無中斷地接管任何點處的執(zhí)行,從而提供容錯保護。
如下圖所示:Fault Tolerance對中的主虛擬機和輔助虛擬機
主虛擬機和輔助虛擬機可持續(xù)交換檢測信號。此交換使得虛擬機對中的虛擬機能夠監(jiān)控彼此的狀態(tài),以確保持續(xù)提供Fault Tolerance保護。如果運行主虛擬機的主機發(fā)生故障,系統(tǒng)將會執(zhí)行透明故障切換,此時會立即啟用輔助虛擬機以替換主虛擬機,并將啟動新的輔助虛擬機,同時在幾秒鐘內(nèi)重新建立Fault Tolerance冗余。如果運行輔助虛擬機的主機發(fā)生故障,則該主機也會立即被替換。在任一情況下,用戶都不會遭遇服務(wù)中斷和數(shù)據(jù)丟失的情況。
主虛擬機及其輔助副本不允許在相同主機上運行。此限制可確保主機故障而導(dǎo)致兩個虛擬機都丟失。
Fault Tolerance不支持的vSphere功能
容錯虛擬機不支持以下vSphere功能。
1快照。在虛擬機上啟用Fault Tolerance前,必須移除快照。此外,不可能對已啟用Fault Tolerance的虛擬機執(zhí)行快照。
2Storage vMotion。不能為已啟用Fault Tolerance的虛擬機調(diào)用Storage vMotion。要遷移存儲器,應(yīng)當先暫時關(guān)閉Fault Tolerance,然后再執(zhí)行Storage vMotion操作。在完成遷移之后,可以重新打開FaultTolerance。
3鏈接克隆。不能在為鏈接克隆的虛擬機上啟用Fault Tolerance,也不能從啟用了Fault Tolerance的虛擬機創(chuàng)建鏈接克隆。
4虛擬機備份。不能使用Storage API for Data Protection、VMware Data Recovery或需要使用虛擬機快照(如ESXi所執(zhí)行的那樣)的類似備份產(chǎn)品來備份啟用了FT的虛擬機。要以這種方式備份容錯虛擬機,首先必須禁用FT,然后在執(zhí)行備份后重新啟用FT。基于存儲陣列的快照不影響FT。
將Fault Tolerance功能與DRS配合使用
啟用EnhancedvMotion Compatibility (EVC)功能時,可以將vSphere Fault Tolerance與vSphere Distributed Resource Scheduler (DRS)配合使用。此過程不但可使容錯虛擬機受益于更好的初始放置位置,還可以將其納入群集的負載平衡計算中。
當群集啟用了EVC時,DRS將為容錯虛擬機提出初始放置位置建議、在重新平衡群集負載期間移動這些虛擬機,并允許你為主虛擬機分配DRS自動化級別(輔助虛擬機總是采用與其關(guān)聯(lián)的主虛擬機相同的設(shè)置。)
在初始放置或負載平衡期間,DRS放置在主機上的主虛擬機或輔助虛擬機的數(shù)目不會超過一個固定的數(shù)目。此限制由高級選項das.maxftvmsperhost控制。此選項的默認值為4。但是,如果將此選項設(shè)置為0,DRS將忽略此限制。
Fault Tolerance要求:
以下是使用vSphere FaultTolerance之前需要了解的群集、主機和虛擬機要求。
FaultTolerance的群集要求:
在使用FaultTolerance之前,必須滿足以下群集要求。
1主機證書檢查功能已啟用。稍后會講到如何查看。
2至少有兩臺通過FT認證的主機運行相同的Fault Tolerance版本號或主機內(nèi)部版本號(即相同版本的ESXi包括補丁程序)。FaultTolerance版本號顯示在vSphereClient中主機的摘要選項卡上。
3ESXi主機可以訪問相同的虛擬機數(shù)據(jù)存儲(SAN、NAS、ISCSI)和網(wǎng)絡(luò)。請參考后面的講課資料
4配置了Fault Tolerance日志記錄和vMotion網(wǎng)絡(luò)。請參考后面的講課資料
5vSphere HA群集已創(chuàng)建并啟用。請參見“創(chuàng)建vSphere HA群集”。打開要容錯虛擬機電源或者將主機添加到已支持容錯虛擬機的群集之前,必須啟用vSphere HA。
FaultTolerance的主機要求:
在使用FaultTolerance之前,必須滿足以下主機要求。
1主機上的處理器必須來自與FT兼容的處理器組。此外,強烈建議主機的處理器之間也相互兼容。有關(guān)受支持處理器的信息,網(wǎng)址為http://kb.vmware.com/kb/1008027。
2在配置每臺主機時,都必須在BIOS中啟用硬件虛擬化(HV)。
注意:當主機無法支持Fault Tolerance時,可在vSphere Client中主機的摘要選項卡上查看原因。單擊已配置FT的主機字段旁邊的藍色標題圖標,查看主機不符合的Fault Tolerance要求的列表。
FaultTolerance的虛擬機要求
在使用FaultTolerance之前,必須滿足以下虛擬機要求。
1虛擬機必須存儲在虛擬RDM或厚置備的虛擬機磁盤(VMDK)文件中。如果虛擬機存儲在精簡置備的VMDK文件中,則在嘗試啟用Fault Tolerance時將會出現(xiàn)一則指示必須轉(zhuǎn)換VMDK文件的消息。要執(zhí)行該轉(zhuǎn)換,必須關(guān)閉虛擬機電源。
2虛擬機文件必須存儲在共享存儲器上。可接受共享的存儲解決方案包括光纖通道、(硬件和軟件)iSCSI、NFS和NAS。
3只有帶有單個vCPU的虛擬機才能與Fault Tolerance功能兼容。
具體操作步驟如下:
為Fault Tolerance準備群集和主機:
要為群集啟用FaultTolerance,必須滿足此功能的必備條件,然后在主機上執(zhí)行特定的配置步驟。完成這些步驟并創(chuàng)建群集后,還可以檢查配置是否符合啟用Fault Tolerance的要求。
為群集啟用FaultTolerance之前,應(yīng)當完成的任務(wù)包括:
1啟用主機證書檢查(如果你要從先前版本的vCenter Server升級)。
2為每臺主機配置網(wǎng)絡(luò)。
3創(chuàng)建vSphere HA群集,添加主機,并檢查合規(guī)性。
在為群集和主機準備好FaultTolerance之后,便可為虛擬機打開FaultTolerance
1、啟用主機證書檢查
使用主機證書檢查,可以將ESXi主機配置為相互驗證身份,確保維護一個更安全的環(huán)境。對于容錯虛擬機所在的ESXi主機來說,主機證書檢查是必需的。
步驟
1將vSphere Client連接到vCenter Server。
2選擇系統(tǒng)管理,然后選擇vCenter Server設(shè)置。此時會出現(xiàn)vCenter Server設(shè)置窗口3在左窗格中單擊SSL設(shè)置。
4選中vCenter需要已驗證的主機SSL證書框。
5單擊確定。
2、為主機配置網(wǎng)絡(luò)
在要添加到vSphere HA群集的每臺主機上,必須配置兩個不同的網(wǎng)絡(luò)交換機,以便讓主機支持Vmotion也能支持vSphereFaultTolerance。
注:每臺ESXi主機上至少要有三塊網(wǎng)卡,一塊用于與vcenter通信及虛擬機橋接收;另一塊用于Vmotion通信用;第三塊用于Fault Tolerance日志記錄使用
有關(guān)用于Vmotion端口組請參考Vmotion遷移的文檔。
前提條件
需要多個千兆位網(wǎng)絡(luò)接口卡(NIC)。對于支持Fault Tolerance功能的每臺主機,最少需要兩個物理千兆位網(wǎng)卡。例如,你需要一個網(wǎng)卡專門用于Fault Tolerance日志記錄,另一個則專門用于vMotion。VMware建議具備三個或更多網(wǎng)卡來確保可用性。
注意vMotion和FT日志記錄網(wǎng)卡必須位于不同的子網(wǎng)上,并且FT日志記錄網(wǎng)卡不支持IPv6。
創(chuàng)建專門用于FaultTolerance日志記錄的端口組:
步驟
1將vSphere Client連接到vCenter Server。
2在vCenter Server清單中,選擇主機,然后單擊配置選項卡。
3選擇硬件下的網(wǎng)絡(luò),然后單擊添加網(wǎng)絡(luò)鏈接。此時會出現(xiàn)添加網(wǎng)絡(luò)向?qū)А?/p>
4選擇連接類型下的VMkernel,然后單擊下一步。
5選擇創(chuàng)建vsphere標準交換機,然后單擊下一步。
6提供交換機的標簽。
7選擇將此端口組用于Fault Tolerance日志記錄,然后單擊下一步。
8提供IP地址和子網(wǎng)掩碼,然后單擊下一步。
9單擊完成。
在其他ESXi主機上進行相同的操作完成用于Fault Tolerance日志記錄的端口組。
要確認是否在主機上成功啟用了vMotion和Fault Tolerance,請在vSphere Client中查看該主機的摘要選項卡。在“常規(guī)”窗格中,vMotion已啟用和已配置FT的主機字段均應(yīng)顯示為“是”。
3、創(chuàng)建vSphere HA群集和檢查合規(guī)性
vSphere FaultTolerance在vSphere HA群集環(huán)境中使用。在每臺主機上配置網(wǎng)絡(luò)之后,創(chuàng)建vSphere HA群集并向其中添加主機。可以查看群集配置是否正確以及是否符合成功啟用Fault Tolerance的要求。
步驟
1將vSphere Client連接到vCenter Server。
2創(chuàng)建群集并向其中添加主機
3在vCenter Server清單中,選擇群集,然后單擊配置文件合規(guī)情況選項卡。
4單擊立即檢查合規(guī)性運行合規(guī)性測試。
要查看運行的測試,請單擊描述。
合規(guī)性測試的結(jié)果將顯示在屏幕的底部。主機將標記為“合規(guī)”或“不合規(guī)”。
為虛擬機提供Fault Tolerance:
在采取了為群集啟用vSphere FaultTolerance所需的全部步驟之后,可以為各個虛擬機打開Fault Tolerance
功能。
如果符合下列任一情況,則用于打開Fault Tolerance的選項將不可用并變成灰色:
1虛擬機所駐留的主機并未獲得使用該功能的許可證。
2虛擬機所駐留的主機處于維護模式或待機模式。
3虛擬機已斷開連接或被孤立(無法訪問其.vmx文件)。
4用戶沒有打開此功能的權(quán)限。
為虛擬機打開Fault Tolerance
可以通過vSphereClient打開vSphere FaultTolerance
步驟
1選擇“主機和群集”視圖。
2右鍵單擊一個虛擬機并選擇Fault Tolerance >打開Fault Tolerance。
如果選擇多個虛擬機,則FaultTolerance菜單處于禁用狀態(tài)。一次只能為一個虛擬機打開Fault Tolerance。
特定的虛擬機將指定為主虛擬機,并在另一臺主機上建立輔助虛擬機。現(xiàn)在,主虛擬機已啟用了容錯功能。
查看有關(guān)容錯虛擬機的信息
可以使用vSphereClient查看vCenterServer清單中的容錯虛擬機。
注意:不能從輔助虛擬機禁用FaultTolerance。
主虛擬機的摘要選項卡中顯示了vSphere FaultTolerance區(qū)域(窗格),其中包含有關(guān)虛擬機的信息。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
當前標題:關(guān)于vsphere高可性-創(chuàng)新互聯(lián)
鏈接URL:http://newbst.com/article32/dggspc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供服務(wù)器托管、網(wǎng)站改版、網(wǎng)站設(shè)計、移動網(wǎng)站建設(shè)、軟件開發(fā)、網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容