加入收藏 設為首頁 聯(lián)系我們 歡迎光臨本網(wǎng)站!
郵箱:support@zcecs.com
地址:北京市西城區(qū)南濱河路27號貴都國際中心A座1111室
除了涵蓋傳統(tǒng)數(shù)據(jù)中心的相關設置之外,究竟什么是現(xiàn)代化的數(shù)據(jù)中心呢?當您所在的企業(yè)組織在進行現(xiàn)代數(shù)據(jù)中心的設計時,需要重點關注哪些設計決策呢?請相信:積極的采用新興技術(shù)幾乎總是能夠讓貴公司的數(shù)據(jù)中心管理運營人員們的日常工作變得更輕松。
遠程服務器監(jiān)控和管理是現(xiàn)代服務器的最低標準。故而定期/不定期的對數(shù)據(jù)中心的這些服務器進行升級和替換是不可避免的。
在本文中,我們將于廣大讀者朋友們共同討論在制定企業(yè)的數(shù)據(jù)中心設計決策時所需重點關注的相關領域。在這一過程中,您將了解到對于遠程服務器實施監(jiān)控和管理的三方面的選擇;同時文章中還將對刀片和機架服務器之間的差異進行深入的探討。
對于遠程服務器實施監(jiān)控和管理的三種選擇方案
企業(yè)數(shù)據(jù)中心對其遠程服務器實施監(jiān)控和管理并不僅僅只是大型企業(yè)們的理想選擇。事實上,這幾乎是所有現(xiàn)代服務器的最低標準,其允許數(shù)據(jù)中心的管理運營人員們遠程檢查、配置或重置位于數(shù)據(jù)處理大廳下方,或位于數(shù)英里以外的數(shù)據(jù)中心的服務器機柜中的相關系統(tǒng) .一款通用的服務器管理界面也將使得企業(yè)數(shù)據(jù)中心的管理運營人員們的工作更輕松,這減少了他們需要使用的工具的數(shù)量。在企業(yè)數(shù)據(jù)中心內(nèi)部建立了幾個主要的帶外(out-of-band,OOB)服務器管理界面,包括諸如智能平臺管理界面(IPMI)、iDRAC和iLO.
1、 IPMI
智能平臺管理界面(IPMI)于1998年9月正式發(fā)布,目前已經(jīng)逐步發(fā)展成為了現(xiàn)代服務器管理的基礎。IPMI提供基本的硬件接口和規(guī)格,為服務器監(jiān)控和管理創(chuàng)建了專用通道,使得數(shù)據(jù)中心的管理運營人員們可以使用獨立系統(tǒng)的處理器,固件和操作系統(tǒng)。目前有超過200家的供應商支持IPMI,該接口被廣泛的用于供應商們所提供的服務器產(chǎn)品中,包括惠普企業(yè)公司(HPE),戴爾和思科。
IPMI適用于異構(gòu)環(huán)境中的遠程服務器監(jiān)控和管理,跨網(wǎng)絡交換簡單網(wǎng)絡管理協(xié)議消息。使用主板網(wǎng)絡接口的專用帶外網(wǎng)絡鏈接和邊帶(side- band)網(wǎng)絡鏈接便于遠程訪問。這允許IPMI在操作系統(tǒng)啟動之前、操作系統(tǒng)發(fā)生故障以及系統(tǒng)斷電后保持運行 ——但其必須插入并連接到管理網(wǎng)絡。
IPMI提供了一系列關于系統(tǒng)的實用硬件級信息,包括風扇的轉(zhuǎn)速、電壓級別、溫度、電源狀態(tài)和機箱完整性。IPMI還可以收集數(shù)據(jù)中心操作運營現(xiàn)場可更換部件的系統(tǒng)清單數(shù)據(jù),并匯總?cè)罩疽圆檎覞撛诘膯栴}(如低電壓等)。它也可以發(fā)出系統(tǒng)命令,例如斷電和重啟。IPMI通常是新服務器的一項必備的功能,無需額外的硬件或軟件來為其提供支持。
2、IDRAC
戴爾的遠程訪問控制器(DRAC)是戴爾服務器中的一款帶外管理平臺和一套軟件工具。早期的DRAC平臺是作為一個擴展卡安裝的,但當前型號的DRAC平臺則是使用包含在系統(tǒng)板中的集成整合的DRAC(iDRAC)。最新版本的iDRAC8服務于戴爾的第13代PowerEdge服務器,如R330. IDRAC8建立在IPMI之上,因此其支持IPMI的相關基本功能——包括對操作運營溫度、風扇和電壓的監(jiān)控,以及對接口(如LAN上的IPMI)的監(jiān)控。但是這屬于高級功能和集成選項——特別是對于遠程服務器監(jiān)控和管理——將iDRAC從底層IPMI中分離出來。
例如,具備生命周期控制器(Lifecycle Controller,簡稱LC)的iDRAC8能夠提供系統(tǒng)清單和運行健康狀況的監(jiān)控,同時還提供內(nèi)存信息和CPU狀態(tài),包括自動處理器調(diào)節(jié)和預測故障的監(jiān)控。IDRAC8還可以協(xié)助完成服務器部署的任務,例如自動發(fā)現(xiàn),基于腳本XML的系統(tǒng)配置和遠程存儲設備配置。IDRAC8有助于許可證管理和固件更新,并且可以支持電源循環(huán)等故障排除任務。iDRAC界面也采用了比普通IPMI管理更為強大的安全性。
企業(yè)數(shù)據(jù)中心的運營管理員們可以通過一款Web瀏覽器或命令行界面執(zhí)行這些遠程服務器監(jiān)視和管理任務,還可以將iDRAC與戴爾OpenManage等工具集成。 OpenManage可以使用插件連接到其他供應商的管理工具,如甲骨文數(shù)據(jù)庫管理器,HPE的運營管理器,IBM的Tivoli Netcool/OMNIbus以及CA公司的網(wǎng)絡和系統(tǒng)管理器。
3、ILO
Integrated Lights-Out(iLO)是惠普企業(yè)公司在其ProLiant服務器上的帶外系統(tǒng)管理平臺。ILO首次出現(xiàn)在ProLiant G2,G3和G4服務器上;目前的迭代產(chǎn)品iLO 4已經(jīng)嵌入到了其ProLiant Gen8和Gen9服務器中,例如HPE 的ProLiant DL580 Gen9服務器。
ILO同樣也基于底層IPMI技術(shù),使用嵌入式管理處理器來支持遠程系統(tǒng)設置和配置、運行狀況監(jiān)控以及電源和溫度監(jiān)控。但是,iLO具有其他方面的功能,可以有助于進一步增強HPE產(chǎn)品的遠程服務器監(jiān)控和管理功能。
例如,iLO 4所提供的功能包括無代理管理,這是一款改進的運行狀況系統(tǒng),通過虛擬電源按鈕和基于XML的腳本的遠程控制卡命令語言(Remote Insight Board Command Language)能夠?qū)崿F(xiàn)循環(huán)系統(tǒng)電源。其他方面的高級功能還包括API訪問,預啟動和高級運行狀況檢查,以提供更好的診斷功能;iLO的聯(lián)合發(fā)現(xiàn)和管理功能支持ProLiant Gen8和Gen9服務器組,并通過一款集成遠程控制臺的協(xié)作支持控制臺的錄制和回放功能。
并非所有功能都在所有的iLO版本產(chǎn)品中可用。
ILO 4與管理軟件(如HPE的OneView和Insight Control)集成整合,以提供高級功能。例如,HPE OneView軟件將HPE Con??vergedSystem,HPE BladeSystem,HPE ProLiant服務器和HP 3PAR StoreServ存儲系統(tǒng)集成到一個服務器管理界面中。這允許企業(yè)用戶的數(shù)據(jù)中心管理運營人員匯集和分配資源,并自動化任務,例如配置更改或軟件更新。
IPMI為遠程服務器監(jiān)控和管理提供了硬件基礎,系統(tǒng)供應商們在此基礎上提供了額外的管理功能。當然,戴爾iDRAC和HPE iLO只是兩個常見的例子,市場上還有眾多其他的IPMI擴展,如IBM的集成管理模塊,英特爾的遠程管理模塊2和甲骨文的Integrated Lights Out Manager.
數(shù)據(jù)中心刀片服務器VS.機架服務器的更新升級考慮因素
對于絕大多數(shù)的IT企業(yè)來說,服務器群的升級或替換是不可避免的。但是,更新的過程會根據(jù)企業(yè)數(shù)據(jù)中心具體所安裝的究竟是刀片服務器配置還是傳統(tǒng)機架服務器的配置而有所不同。如下,讓我們看看刀片服務器與機架式服務器之間的關鍵性的設計差異,以及這些差異將如何影響到數(shù)據(jù)中心的服務器設備的更新決策。
1、設計差異:刀片服務器VS.機架式服務器
為了更好的制定企業(yè)數(shù)據(jù)中心服務器設備的更新戰(zhàn)略,我們建議數(shù)據(jù)中心的管理人員么首先可以從查看服務器的設計和認證過程開始著手。刀片服務器是緊密配置的硬件塊,設計為相互物理集成。所有這些元件(如電源、交換機模塊,主板和適配器)都是特定刀片系列的專有產(chǎn)品,供應商在這些服務器產(chǎn)品出廠之前就已經(jīng)對其進行了廣泛的測試。
然而,這種嚴格的認證和測試過程也存在著一大缺點。這一過程非常耗時,這使得服務器供應商們的刀片服務器產(chǎn)品的設計周期更長,并限制了企業(yè)數(shù)據(jù)中心客戶在服務器升級方面的選擇。
刀片服務器存在強大的供應商鎖定。從保修控制到驅(qū)動器上的非標準化的包裝和簽名,在刀片服務器環(huán)境中添加商用現(xiàn)成(COTS)系統(tǒng)本質(zhì)上是一大禁忌。這些COTS系統(tǒng)包括CPU、驅(qū)動器、內(nèi)存和其他因保修條款限制而無法插入刀片服務器的組件。
另一大缺點是,服務器供應商們可能無法在其機箱、基礎設施和IT流程所要求的8至12年內(nèi)持續(xù)的生產(chǎn)任何一款特定的刀片系列服務器產(chǎn)品。換句話說,屆時,實施服務器的升級可能已經(jīng)不是一種選擇方案了。一個簡單的例子就說明了這一點:刀片服務器通常具有以特定鏈路速度運行的切換式背板。但是現(xiàn)在,以太網(wǎng)的速度每18個月翻一番,所以刀片服務器可能早已無法在未來幾年內(nèi)利用更快的以太網(wǎng)傳輸速度了。
一般而言,機架式服務器的升級要容易得多,其可以被分為兩大類。首先,存在供應商專有的配置,其中機架式服務器僅包含經(jīng)認證的部件。雖然這可以防止使用未經(jīng)批準授權(quán)的零配件,但現(xiàn)如今的市場的現(xiàn)實情況則是,大多數(shù)商品零件(如果從分銷商或受信任的供應商處購買)將按照相同的規(guī)定工作,并且比專有供應商的組件配件要便宜得多。
第二類是完全開放的機架式服務器,這類服務器通常是企業(yè)客戶以更高的價格從供應商處采購,或者甚至由部件組裝而成。這些服務器可以使用便宜的COTS部件,通常使得企業(yè)客戶實施服務器升級的可能性很大。
2、刀片服務器與機架服務器的更新決策
無論企業(yè)數(shù)據(jù)中心所采用的是刀片式服務器抑或還是機架式服務器,其IT團隊均可以通過將可用的內(nèi)存提高四倍,并在該內(nèi)存中保留更多工作負載來提高工作負載的性能。一個內(nèi)存數(shù)據(jù)庫便是最好的例子,其性能提高了100倍。
增加內(nèi)存大小通常會給存儲子系統(tǒng)帶來壓力,因為更高效的系統(tǒng)需要提供更多數(shù)據(jù)。此時便是將工作負載托付給固態(tài)硬盤(SSD)來替換舊的慢速硬盤的時候的。通過消除許多管理員無法識別的瓶頸問題,更快的SSD會讓企業(yè)數(shù)據(jù)中心的運營人員們大吃一驚。
企業(yè)數(shù)據(jù)中心同時執(zhí)行這兩種服務器的升級,他們可能會使得服務器群集的使用壽命延長好幾年。這是一個很好的經(jīng)濟命題,因為升級套件的成本通常會遠遠低于采購新服務器的成本。
但是,在某些情況下,這種升級在刀片服務器上可能并不符合經(jīng)濟成本效益。企業(yè)數(shù)據(jù)中心所需的部件可能還沒有上市。這可能會迫使刀片服務器用戶在現(xiàn)有配置下需要繼續(xù)維持2年的時間,甚至比通常的一年的硬件更新時長多出4年,這樣,服務器的效率將會逐漸下降。
網(wǎng)絡升級與服務器升級分別有著不同的影響。首先,企業(yè)組織需要在整個配置范圍內(nèi)進行更改以實現(xiàn)全面的益處。即使僅僅只有幾個節(jié)點處于舊的,較慢的網(wǎng)絡速度下,也會存在使得整個工作流程處理速度降低的風險。
這對于機架式服務器來說不是一個大問題。在升級內(nèi)存和驅(qū)動器時,添加新的網(wǎng)絡接口卡很容易。網(wǎng)絡架構(gòu)通常是相同的,所以該過程涉及交換機設備并再次插入。而在刀片服務器中,這可能會成為叉車式工作。網(wǎng)絡架構(gòu)往往過時,任何交換機功能都需要更換。
更新過程最終會涉及到服務器的更換,但同樣,刀片服務器與機架服務器的更換有著不同的流程。此時,企業(yè)數(shù)據(jù)中心所需要重點關注的是:接下來要做什么。刀片服務器需要維持8到12年的使用壽命才能算得上符合經(jīng)濟成本效益,但這顯然不符合當今的市場趨勢。而機架式服務器的有效使用壽命為3至4年,此時就亟待進行升級或更換了。