筆者公司局域網(wǎng)采用的是星型拓撲結(jié)構(gòu)千兆以太網(wǎng)技術(shù),中心機房配備一臺三層路由交換機,各樓層采用接入核心交換機,各部門計算機通過直接接入或用級連方式通過接入層交換機接進網(wǎng)絡。中心的服務器有多臺,提供FTP、文件服務、Web等多項服務。分為5個VLAN,根據(jù)業(yè)務不同為不同網(wǎng)段定義了IP地址。
隨著接進網(wǎng)絡PC的不斷增多及信息流量的增加,在網(wǎng)絡維護中遇到過各類問題及故障,現(xiàn)在分析其中影響較大的一個故障,談談在管理與維護上的一點經(jīng)驗和體會。
◆故障現(xiàn)象
某日有多個用戶反映網(wǎng)絡連接情況時通時斷,有時同一樓層的計算機都無法互相Ping通,故障用戶分布在多個樓層,故障點不集中。對個別端口做互換測試,故障仍然存在。在故障計算機上進行測試,發(fā)現(xiàn)可以Ping通網(wǎng)絡中的部分服務器或計算機,Ping核心交換機的IP地址常出現(xiàn)不通、丟包、時延大的現(xiàn)象。利用網(wǎng)絡軟件對可管理的交換機做檢查,沒有明顯的報錯。
◆故障排查
首先懷疑為核心交換機物理故障,觀察交換機的指示燈狀態(tài)以及各端口的狀態(tài),顯示正常。對核心交換機清除緩存、關(guān)閉重啟,并檢查交換機的配置情況,沒有改變。
經(jīng)過以上的檢查和測試,分析故障應該不在硬件部分,利用Sniffer抓包分析軟件將網(wǎng)絡中的數(shù)據(jù)包抓下來分析,發(fā)現(xiàn)有大量數(shù)據(jù)包來自同一個MAC地址,目的地址是根本不存在的IP,懷疑是類似于“沖擊波殺手”一類會造成網(wǎng)絡堵塞的蠕蟲病毒。根據(jù)網(wǎng)絡正常時建立的IP地址及MAC地址對應表查出該機屬于某層的一臺PC,初步確認故障點后將MAC地址對應的計算機從網(wǎng)絡中斷開并升級殺毒軟件,然后重新接入網(wǎng)絡,此時故障仍然存在。
為了確定具體故障點,要求該單位提供其接入拓撲圖分析,發(fā)現(xiàn)該單位將分屬于兩個不同VLAN的連線分別連接兩個不同的Hub,當天為了使用方便,將兩個Hub用級聯(lián)的方式連接到了一起,將其連線斷開后,故障徹底排除。
◆故障原因
此次故障原因分析主要是由于網(wǎng)絡中有環(huán)路存在,造成每一幀都在網(wǎng)絡中重復廣播,引起了廣播風暴。要消除這種網(wǎng)絡循環(huán)連接帶來的網(wǎng)絡廣播風暴可以使用STP協(xié)議(生成樹協(xié)議),以網(wǎng)絡中一臺交換機為節(jié)點生成一棵轉(zhuǎn)發(fā)樹,而樹是沒有環(huán)路的,這樣所有的數(shù)據(jù)都只在這棵樹所指示的路徑上傳輸,就不會產(chǎn)生廣播風暴,但由于SPT算法的開銷非常大,所以交換機上都未啟用該協(xié)議。
為避免在接入層出現(xiàn)同樣的故障,從而影響整個局域網(wǎng)絡用戶的使用,所以在接入層啟用樹生成協(xié)議是必要的,或者在診斷故障時可以打開SPT協(xié)議協(xié)助確定故障點。
◆經(jīng)驗總結(jié)
在故障發(fā)生時,應首先了解故障前網(wǎng)絡的改動,建立完善的網(wǎng)絡文檔資料。包括網(wǎng)絡布線圖、IP及MAC對應表等,否則在確定MAC地址端口時會消耗大量的時間?,F(xiàn)在有很多局域網(wǎng)工具軟件都可以通過掃描獲取網(wǎng)絡中的計算機的這些信息,如LanExplorer等。
隨著接進網(wǎng)絡PC的不斷增多及信息流量的增加,在網(wǎng)絡維護中遇到過各類問題及故障,現(xiàn)在分析其中影響較大的一個故障,談談在管理與維護上的一點經(jīng)驗和體會。
◆故障現(xiàn)象
某日有多個用戶反映網(wǎng)絡連接情況時通時斷,有時同一樓層的計算機都無法互相Ping通,故障用戶分布在多個樓層,故障點不集中。對個別端口做互換測試,故障仍然存在。在故障計算機上進行測試,發(fā)現(xiàn)可以Ping通網(wǎng)絡中的部分服務器或計算機,Ping核心交換機的IP地址常出現(xiàn)不通、丟包、時延大的現(xiàn)象。利用網(wǎng)絡軟件對可管理的交換機做檢查,沒有明顯的報錯。
◆故障排查
首先懷疑為核心交換機物理故障,觀察交換機的指示燈狀態(tài)以及各端口的狀態(tài),顯示正常。對核心交換機清除緩存、關(guān)閉重啟,并檢查交換機的配置情況,沒有改變。
經(jīng)過以上的檢查和測試,分析故障應該不在硬件部分,利用Sniffer抓包分析軟件將網(wǎng)絡中的數(shù)據(jù)包抓下來分析,發(fā)現(xiàn)有大量數(shù)據(jù)包來自同一個MAC地址,目的地址是根本不存在的IP,懷疑是類似于“沖擊波殺手”一類會造成網(wǎng)絡堵塞的蠕蟲病毒。根據(jù)網(wǎng)絡正常時建立的IP地址及MAC地址對應表查出該機屬于某層的一臺PC,初步確認故障點后將MAC地址對應的計算機從網(wǎng)絡中斷開并升級殺毒軟件,然后重新接入網(wǎng)絡,此時故障仍然存在。
為了確定具體故障點,要求該單位提供其接入拓撲圖分析,發(fā)現(xiàn)該單位將分屬于兩個不同VLAN的連線分別連接兩個不同的Hub,當天為了使用方便,將兩個Hub用級聯(lián)的方式連接到了一起,將其連線斷開后,故障徹底排除。
◆故障原因
此次故障原因分析主要是由于網(wǎng)絡中有環(huán)路存在,造成每一幀都在網(wǎng)絡中重復廣播,引起了廣播風暴。要消除這種網(wǎng)絡循環(huán)連接帶來的網(wǎng)絡廣播風暴可以使用STP協(xié)議(生成樹協(xié)議),以網(wǎng)絡中一臺交換機為節(jié)點生成一棵轉(zhuǎn)發(fā)樹,而樹是沒有環(huán)路的,這樣所有的數(shù)據(jù)都只在這棵樹所指示的路徑上傳輸,就不會產(chǎn)生廣播風暴,但由于SPT算法的開銷非常大,所以交換機上都未啟用該協(xié)議。
為避免在接入層出現(xiàn)同樣的故障,從而影響整個局域網(wǎng)絡用戶的使用,所以在接入層啟用樹生成協(xié)議是必要的,或者在診斷故障時可以打開SPT協(xié)議協(xié)助確定故障點。
◆經(jīng)驗總結(jié)
在故障發(fā)生時,應首先了解故障前網(wǎng)絡的改動,建立完善的網(wǎng)絡文檔資料。包括網(wǎng)絡布線圖、IP及MAC對應表等,否則在確定MAC地址端口時會消耗大量的時間?,F(xiàn)在有很多局域網(wǎng)工具軟件都可以通過掃描獲取網(wǎng)絡中的計算機的這些信息,如LanExplorer等。