這樣的機房故障排查從哪裡下手?交換機環路導致的網路癱瘓

昨天接到一家公司的電話,公司網路癱瘓一天了,找了電信的人和電腦城的人去看過,但是無法解決問題。公司業務基本全部停擺了,全公司亂成了一鍋粥。要求我們派人過去查一下,願意付點費用。

其實這也算是我們的一個老客戶了,一年多前幫他們做了20幾個攝像頭的監控,偶爾也有一些電話上的聯絡。這次突然向我們求助有點意外,估計也是搞的沒有辦法了。他們那個機房做監控的時侯我也是去過的,太亂太亂。既然電信和電腦城的人都去過沒解決,估計不那麼好辦。架不住對方行政的苦苦哀求,我能理解她的心情,全公司上下不停的打電話給她,網管吧是新來的總務兼著的。

畢竟斷網一天了。算了,去看一看吧,救人於水火之中。離公司大約也就6公里的距離,不是太遠。

這樣的機房故障排查從哪裡下手?交換機環路導致的網路癱瘓

機房機櫃一角

到了機房,首先了解情況。(如上圖)原來的網管是總務兼著的,離職了。新來的總務也是兼著網管的,問了一些情況,一問三不知。連哪根網線是到哪裡的都不知道。原來是裝置是誰配置的,路由器在哪也不知道。網路從前一天下午就變慢中斷了,一直到我中午趕過去,整整一天。電信來人測了專線的光纖是正常的,然後走人了。電腦城來人一看這個線,不敢動走了。

到處掛著那種50塊錢的小交換機。真是難以想像這是一個100多人的公司機房。問了一圈,沒啥結果,只好硬著頭皮自已查了。

得先搞清楚大致的網路架構,不然不知道從何查起。從電信光纖收發器上的網線摸起,查到進線到了一臺伺服器,是用一個伺服器做成的軟路由和其他服務。沒有賬號,沒有密碼,不看了。伺服器的出線到一臺華為的S2700交換機。

這樣的機房故障排查從哪裡下手?交換機環路導致的網路癱瘓

華為s2700交換機

不管了,隨便找個空埠,把筆記本接上S2700上看看,可以分配到一個IP地址,也可以ping通路由器,但是無法開啟網頁,懷疑限制了埠。然後從1號埠開始測試,發現1號埠可以分到IP,並且也可以上網。但是看了一下IP,是192。168。99的網段,而開始接的埠分到的是192。168。1的網段,看來是分了VLAN。

檢查S2700三根出線的用途,1號口是到了另一臺思科的路由器,2號口的線到了另外一個小交換機上,另外一根直接到了一臺電腦。不管,記好線對應的埠,把三根線全拔了,給筆記本設定了一個192。168。1網段的IP地址,重新接到S2700上,發現完全正常。

到此,我大致也能判斷出哪裡有問題了,筆記本上開一個長ping,把三根網線一根根插回去,插到2口的時侯,網路馬上丟包,開時出問題了。

這樣的機房故障排查從哪裡下手?交換機環路導致的網路癱瘓

ping 192。168。1。1

找到2口網線連線的交換機,又發現三根網線分到了不同的地方,三根網線拔掉,馬上正常。然後一根根接回去,找到那根出問題的網線,又連線了一臺tplink 1024的交換機,然後透過這個tplink1024,又串了兩臺tplink 1024,如下圖所示:紅框的背後就是那三臺tplink交換機。

這樣的機房故障排查從哪裡下手?交換機環路導致的網路癱瘓

機櫃一角

在這堆混亂的線背後,小心翼翼的找到跳線(關鍵是沒有打標,沒有顏色區別),把三臺tplink交換機斷開,網路恢復正常。看來三臺交換機中的某一臺出現了問題,然後一臺臺交換機恢復回去,發現第二臺交換機只要一接,就出問題。

OK,斷開第二個交換機,其他兩個交換機接入,沒有問題。網路訪問部分恢復。沒有辦法了,第二個交換機上接著一堆線呢,鬼知道是哪一根出問題,只能把線全拔了,一根根試。

後面的事就很簡單,但是也很煩鎖。一根根網線拔了再插上去,到17根時,找到了。17號埠一插,網路馬上丟包,一會兒就掛了。

到這兒就差不多了,小編也不想分析17號那根線是幹什麼用的,到哪兒去了,由它去吧。對於這種拿50塊錢的交換機當主幹、300塊錢上門費都不願意付的公司,我也不想多說啥,臨時解決問題就行了。

最後,小編認為,這次的斷網應該是由於亂接線造成交換機環路引起的。不知道各位朋友在工作有沒有碰到這樣的情況。如果你有不同的看法,歡迎交流指教。

本文由“年糕小哥”原創。歡迎關注我或在評論裡和我交流。