ServersCheck7.0監(jiān)控網(wǎng)絡(luò)健康狀況

字號(hào):

ServersCheck是一個(gè)非常強(qiáng)力的監(jiān)控工具,讓IT管理員們可以監(jiān)控服務(wù)器以及全面的基礎(chǔ)健康狀態(tài)。
    很長時(shí)間以來,我一直在尋找一個(gè)產(chǎn)品,它的價(jià)格不是非常昂貴,又能夠完全以圖形,表格等提供給我非常直觀的操作狀態(tài),而且界面還要很漂亮。另外,我也希望這個(gè)產(chǎn)品能夠提供在必要時(shí)進(jìn)行深度挖掘的能力。最終,我找到了ServersCheck 7.0,我想它就是我所需要的產(chǎn)品。
    安裝和配置
    下載樂軟件后,你就可以開始“ Start Configuration(開始配置)”向?qū)нx項(xiàng),從而正式開始。
    圖A ServersCheck的歡迎屏幕
    在公司里,可以使用配置向?qū)硗瓿蒘erversCheck的初始安裝。在默認(rèn)狀態(tài)下,ServersCheck服務(wù)將以localsystem帳戶的上下文來運(yùn)行。雖然這種方式對(duì)本地運(yùn)行的服務(wù)來說很好,但是該服務(wù)將無法存取其他電腦——如果該服務(wù)試圖獲取其他電腦上的任何東西,該服務(wù)就必須獲得能夠跨越其他系統(tǒng)的信任方才可以。
    在如圖B所示的屏幕上,你應(yīng)當(dāng)輸入某個(gè)賬號(hào)的用戶名和密碼,而該帳號(hào)應(yīng)當(dāng)擁有在你計(jì)劃監(jiān)控的每一個(gè)系統(tǒng)上的管理權(quán)限。
    圖B 管理權(quán)限
    在許多公司里——特別是在一些大公司里——對(duì)需要監(jiān)控的每一個(gè)基礎(chǔ)設(shè)施,常常不是一個(gè)人負(fù)責(zé)的。舉例來說,在許多公司里,管理服務(wù)器的人,一般并不是在發(fā)現(xiàn)數(shù)據(jù)中心過熱時(shí)需要報(bào)告的人選。
    通過使用團(tuán)隊(duì),(圖C),你可以讓ServersCheck在發(fā)現(xiàn)問題時(shí)向多個(gè)人發(fā)出通知。通過建立面向不同問題的不同團(tuán)隊(duì),你可以確保通知只發(fā)向最合適的人選,這一點(diǎn)可以保證你的SLA正常運(yùn)作。
    圖C 建立團(tuán)隊(duì)
    雖然你可以單獨(dú)的一臺(tái)一臺(tái)向ServersCheck中添加服務(wù)器,但是這么做實(shí)在相當(dāng)無趣。在絕大多數(shù)具有良好IP地址預(yù)定義策略的公司里,服務(wù)器一般都會(huì)被賦予特定范圍的地址。在ServersCheck的配置中,你可以定義一個(gè)起始和終止地址,然后ServersCheck會(huì)尋找在該地址范圍內(nèi)存在的每一臺(tái)設(shè)備。另外,ServersCheck還提供給你一個(gè)機(jī)會(huì),可以自動(dòng)為任何一個(gè)被它定位的設(shè)備建立一個(gè)“Ping規(guī)則”。一個(gè)Ping規(guī)則很簡單,就是簡單的定期向被監(jiān)控的設(shè)備發(fā)送Ping數(shù)據(jù)包,以確定它正常在線。一旦該設(shè)備無法完成Ping測(cè)試,ServersCheck就會(huì)向指定的團(tuán)隊(duì)發(fā)出警報(bào)。
    ServersCheck可以使用公司的SMTP服務(wù)器,也可以使用自帶的SMTP服務(wù)器。如圖D所示,你在配置頁所指定的信息,將決定ServersCheck是否可以使用自帶的SMTP服務(wù)器。我推薦你應(yīng)該盡自己一切可能,使用ServersCheck的內(nèi)置SMTP服務(wù)器。畢竟,如果不這么做的話,萬一公司的SMTP服務(wù)器也壞了,到時(shí)你又該怎么辦呢?又該如何通知系統(tǒng)管理員呢?
    圖D 指派SMTP服務(wù)器
    ServersCheck并不一定需要在所安裝的服務(wù)器上進(jìn)行管理。你可以使用任意網(wǎng)頁瀏覽器來訪問ServersCheck服務(wù)器,然后進(jìn)行配置方面的修改。而且正如你可能所期望的那樣,ServersCheck的配置由一個(gè)用戶名和口令所保護(hù)。在配置精靈完成后,你可以添加其他用戶。
    生效
    完成了配置向?qū)е?,進(jìn)入主屏幕,你在這里可以看到ServersCheck的初始化儀表板視圖(圖E)。在本截圖中,你可以看到一個(gè)單獨(dú)的監(jiān)控服務(wù)器——本地系統(tǒng)。如果在配置向?qū)нM(jìn)行的過程中,ServersCheck定位過其他服務(wù)器的話,那么那些服務(wù)器也會(huì)一并列出在這個(gè)屏幕上。
    圖E 儀表板
    注意,圖E中展示了非常豐富的信息。巨大的綠色圓形,提示了在被監(jiān)控的設(shè)備上一切都很正常,并且ServersCheck甚至還計(jì)算出了你的“當(dāng)前服務(wù)級(jí)別”。還有,ServersCheck報(bào)告了多個(gè)通斷情形,以及哪些情形是“可疑的”(橘色)。在窗口下半部,注意和被監(jiān)控設(shè)備相關(guān)聯(lián)的標(biāo)尺。這些標(biāo)尺讓你可以一目了然的了解該設(shè)備的健康狀態(tài)。
    一旦你擁有了相關(guān)設(shè)備合理數(shù)量的信息之后,你就可以開始執(zhí)行趨勢(shì)分析了。一個(gè)趨勢(shì)分析會(huì)非常有助于計(jì)劃未來對(duì)磁盤空間的需求,確定未來在CPU性能方面會(huì)否有問題,以及其他很多。要建立一份趨勢(shì)報(bào)告,只要選中你打算出具報(bào)告的被監(jiān)控項(xiàng)目,然后給報(bào)告取個(gè)名字,然后選好應(yīng)當(dāng)被包含在分析中的時(shí)間和日期即可。
    在圖F中的圖形展示了在我的GoodLink服務(wù)器上的CPU活動(dòng)狀態(tài)。該服務(wù)器的利用率并不算特別高,但是該圖形指出,其不規(guī)則的狀態(tài)值得研究。
    在主屏幕中,如果你點(diǎn)擊了一臺(tái)設(shè)備,ServersCheck就會(huì)提供你有關(guān)該設(shè)備的一系列信息。在如圖G所示的屏幕里,你可以看到本地系統(tǒng)CPU正運(yùn)行在1%的繁忙度,而75%的內(nèi)存空閑可用。你也可以看到,在屏幕的底部的圖形上,該信息隨著時(shí)間的變化趨勢(shì)。
    圖G 設(shè)備信息
    對(duì)于每一臺(tái)你監(jiān)控的設(shè)備,你都可以添加大量的規(guī)則,以確認(rèn)該設(shè)備的監(jiān)控情況。你可以執(zhí)行一個(gè)常見的Ping檢查,運(yùn)行一個(gè)Tracert以確認(rèn)被用于訪問該設(shè)備的路徑,以及對(duì)該設(shè)備的特定方面進(jìn)行監(jiān)控。比方說,如果你是在運(yùn)行一個(gè)網(wǎng)頁服務(wù)器,一個(gè)Ping檢查能夠告訴你該服務(wù)器正常在線,而絕大多數(shù)合理監(jiān)控的程序?qū)⒛軌蛟试S你查看網(wǎng)頁服務(wù)器的服務(wù),從而確認(rèn)它正常工作。但是,你怎么才能知道你的內(nèi)容頁面也在正常工作呢?
    簡單!在你的網(wǎng)頁服務(wù)器上,建立一個(gè)“傻瓜”頁面,該頁面將僅用于被監(jiān)控;然后建立一條ServersCheck規(guī)則,不斷查看在訪問該頁面時(shí),是否返回了特定的文本。如果該文本正常返回,就說明你的網(wǎng)頁服務(wù)器在內(nèi)容提供方面也是一切正常的。
    多久應(yīng)當(dāng)執(zhí)行一次新檢查呢?對(duì)于某些檢查來說,你希望狀態(tài)更新非常迅速,但是對(duì)其他的檢查來說,較長的時(shí)間間隔也是很合理的。要留意,不要因?yàn)樘^頻繁的執(zhí)行檢查,而導(dǎo)致對(duì)系統(tǒng)或者網(wǎng)絡(luò)造成過載。
    對(duì)我來說,我一般執(zhí)行新檢查,是選擇監(jiān)控一個(gè)特定的服務(wù)器服務(wù),以確認(rèn)不會(huì)消耗太多的CPU時(shí)間。在這個(gè)例子里,如圖H所示,該服務(wù)運(yùn)行在本地服務(wù)器上,所以信任就不再像其他情況下那么重要。記住,對(duì)于遠(yuǎn)程檢查而言,你必須對(duì)一個(gè)帳戶提供信任,且該賬戶應(yīng)當(dāng)擁有獲取指定信息的相關(guān)權(quán)限。
    在精靈的最后屏幕上,你可以指定具體授權(quán)發(fā)布警報(bào)的情形,以及該警報(bào)是如何發(fā)布的。注意,ServersCheck提供了一系列的警報(bào)選擇。我推薦你不要單純依靠電子郵件。畢竟,萬一你的互聯(lián)網(wǎng)連接中斷了的話,你讓軟件用什么方法來通知你呢?
    隨著時(shí)間的推移,你很可能會(huì)在身邊的環(huán)境里添加更多服務(wù)器,并需要將它們也加入ServersCheck。你應(yīng)當(dāng)提供設(shè)備名稱,IP地址,說明文字,操作系統(tǒng)版本,設(shè)備類型,以及一個(gè)可用于掃描新設(shè)備的用戶帳號(hào)以及密碼。
    注意最小服務(wù)級(jí)別入口(圖I)。這個(gè)入口是用于測(cè)量某個(gè)設(shè)備上出現(xiàn)問題的緊急程度。舉例來說,如果你進(jìn)行了10個(gè)檢查,其中一個(gè)失敗,那么你的服務(wù)級(jí)別就是90%。如果該服務(wù)器僅有80%的服務(wù)級(jí)別,你一般不會(huì)把它認(rèn)做是“當(dāng)機(jī)”。
    通過你提供的信任,新設(shè)備被掃描完畢,并返回正確監(jiān)控的選項(xiàng)。在我的示例里,我已經(jīng)添加了一個(gè)Windows域控制器,于是Windows健康檢查就可以用了,包括了CPU監(jiān)控,內(nèi)存監(jiān)控,以及磁盤空間監(jiān)控等。你可以另外執(zhí)行TCP檢查,從而確定特定的TCP端口能繼續(xù)保持被新設(shè)備訪問。最后,你可以查看特定服務(wù),以確認(rèn)它們依舊正常可用。
    如果你的某個(gè)系統(tǒng)出了問題,儀表板會(huì)揭示出來。在圖J中,本地系統(tǒng)的“details(細(xì)節(jié))”選項(xiàng),顯示出“Error: Query returned zero processes(錯(cuò)誤:查詢返回零個(gè)進(jìn)程)”。在這個(gè)例子里,我是試圖掃描一個(gè)不存在于該服務(wù)器上的服務(wù),但是這個(gè)例子的確可以讓你看出,讓ServersCheck找出哪里有了錯(cuò)誤是多么的簡單。
    當(dāng)你為一臺(tái)設(shè)備增加檢查時(shí),它們會(huì)出現(xiàn)在該設(shè)備的“device view(設(shè)備視圖)”中。如果一臺(tái)服務(wù)器當(dāng)機(jī)了,你碰到了問題,ServersCheck就會(huì)變成紅色,從而讓你知道這一切。注意,在圖K中,名為AIS的服務(wù)器現(xiàn)在正處于當(dāng)機(jī)狀態(tài),在窗口前面中央的位置指出了這個(gè)事實(shí)。同時(shí),餅圖也改變了,反映出設(shè)備當(dāng)機(jī)的狀態(tài)。
    底線
    在我的測(cè)試中,我發(fā)現(xiàn)ServersCheck非常易于使用,而且它明確提供了我所希望的視覺線索。通過使用ServersCheck,我們可以在我們的IT設(shè)備當(dāng)中豎起一塊大型顯示器,然后追蹤我們所有設(shè)備的狀態(tài)。