雲吶|IT結構業務技術的發展是智慧運維發展的原動力!

IT體系結構和IT業務的技術發展是運維發展的原動力和推手,所IT業務的開發總是比IT技術的發展戰略落後。在IT領域,SDN、雲計算、大資料等技術不斷湧現IT資源體系結構日益複雜,IT資源規模日益增大,執行的複雜性和難度日益增大,IT可維護性越來越受到人們的關注,而首輪施工後IT可運維性問題也逐漸成為IT管理人員不斷關注的焦點。

雲吶|IT結構業務技術的發展是智慧運維發展的原動力!

從早到晚的純手工運維,到後來依賴於網管工具報告工具化運維為主的工具化運維,與工具相關聯或融合的平臺運維,以及目前流行的智慧和自動化運維繫統,使運維領域在技術上不斷髮生變化。開發新工具並不意味著完全消除舊工具,而是使用不同的工具來解決實際的運維問題。新工具進一步解放了執行運維的效率。

雲計算時代,如何選擇合適的運維模式,選擇合適的運維工具,建立合理的組織結構和管理體系,這些都是IT管理者們必須重新思考的問題。

面臨運維的多維屬性,企業如何進行自我定位

說到運維和維護,人們往往只考慮技術本身,而忽視場景的差異,簡單地追求技術領先和上層建築,往往事半功倍,不容易達到預期的效果。其實不同的運維場景在實際運維上差別很大,一味求新、求快,並不一定能取得好的運維效果。透過多年對運維領域的瞭解,我總結了影響運維工具選擇的行業屬性、成熟度屬性、規模屬性和位置屬性等以下屬性

行業

先說行業屬性,不同行業由於業務特徵不同,其所關注的內容和執行模式也大相徑庭。就拿因特網來說,因特網的釋出速度快,更新快,伺服器數量多,研究開發能力強,通常一週內會有數個甚至數十個新業務釋出,同時也會有數十個新的釋出。在ITIL基礎上開發的變更與釋出流程雖然考慮周全、過程嚴謹,但節奏緩慢、週期長。

雲吶|IT結構業務技術的發展是智慧運維發展的原動力!

在網際網路業務快速更迭的行業背景下,傳統的變更釋出流程已使網際網路企業失去了產品的市場機會視窗,因此因特網運應會選擇諸如自動化和自我維護等高效的運維模式,要做自動化就必須建立精確的CMDB,為了提高效率必須追求敏捷開發,DevOps、灰色版本和開源模式。那麼因特網運維模式主要關注的是運維效率

運維成熟度數

各個行業受各自業務特點的影響,其運維模式、關注點和工具選擇各不相同,同時影響運維工具選擇的是運維成熟度。運維成熟度也是制約企業運維發展的關鍵因素。ITIL的核心方法是PDCA,這一方法向我們闡明瞭執行的一個簡單原則是逐步、螺旋上升的模式。運維成熟度的高低,決定著運維所處的不同階段,也決定了不同時期使用者應關注的內容。在運維過程中選擇脫離實際情況的激進做法往往只能起到拔苗助長的作用,最後又推倒重來,反而得不償失。許多使用者以前都沒有注意這一客觀規律,在沒有做好監測的情況下,就同時構建了執行流程,從而導致運維過程與監控脫節,流程對運維管理員的幫助非常有限,淪為走單工具。另外一種常犯的錯誤是在CMDB的構建中過分追求完美,沒有與現有的監控功能相結合,由於沒有采用自動化方法來簡化CMDB的維護工作,相反,過度追求CMDB設計中的精細化,以致CMDB的維護費用很高,甚至超過了實際使用價值,導致CMDB專案最終走向破產。

運維的另一成熟度是指人員成熟度模型。其中包括運維人員的技術成熟度、組織過程成熟度和開發能力成熟度。技術成熟度包括運維人員對網路、計算、儲存、虛擬化和業務的熟悉程度和問題處理能力。技術成熟度越高,對問題的處理和反應速度就越快,相反,對管理能力較差的管理員將延長故障恢復時間。因此如何讓運維人員減少對個人技能和知識的依賴也是對運維工具的一個重要考慮。以往建立在知識庫基礎上的系統,實際執行效果不甚理想。要從根本上解決這一問題,一方面要建立起精確的CMDB配置資訊庫,另一方面要把專家的經驗同時固化為運維工具,那麼運維專家系統將成為未來運維工具發展的又一趨勢

雲吶|IT結構業務技術的發展是智慧運維發展的原動力!

如今,開放原始碼軟體的數量和成熟度日益增加,如果能充分利用開源軟體進行自我開發,不管從業務層面還是運維層面,都是很好的選擇,但同時也提高了對執行人員開發能力的要求。成熟度,體現了運維人員在需求分析、架構設計、程式碼編寫、開放原始碼軟體熟悉程度、商業背景知識以及對軟體開發過程的瞭解。DevOps在運維界的流行表明了開發和執行維護的逐漸融合,這無疑也是未來運維發展的趨勢之一,但是,如果不能充分開發人力,又缺乏敏捷流程儲備,如果貿然選擇DevOps(開發及運維)模式,有可能面臨巨大的風險

因此企業要看清楚自己所處的運維階段、運維人員成熟度,選擇更務實的運維策略,尋求逐步改善、水到渠成的方法

運維規模

還有一點要注意尺寸屬性,這一尺度包括哪些內容(伺服器和網路)、業務規模和管理人員的數量。一個使用者的50個伺服器還是200個伺服器在運維方面,1000臺伺服器或者成千上萬臺伺服器之間的差異非常明顯。在裝置數量較少的情況下,許多時間都可以進行人工管理,但隨著受管理裝置數目的增加,執行工作量將直線上升,此時運維難度實際上呈指數級上升,再依賴人工運維幾乎成為不可能完成的任務。大規模的運維必須依靠自動?監?測測測測工具、自動配置工具、自動部署工具和自動過程工具來輔助實施。隨著執行規模的進一步擴大,傳統的執行將向大容量執行演化。大容量執行不僅僅是運維工具的改變,大容量運維帶來了技術價值的改變,技術手段的改變,以及運維意識的改變,這些都影響到深度運維方法的變革。

大量執行運維指南

影響運維的另一個因素是運維人員規模,如果運維人員在8人以下,則要慎重考慮是否要進行復雜的運維流程建設。過程設定解決了運維事件閉環跟蹤、責任確認、規範管理等問題,但若企業的運維人數較少,建立複雜流程反而會降低運維效率,增加運維成本。但若企業運維人員的數量超20世紀末,對運維流程進行規範管理,同時在運維人員績效管理方面也需要對運維流程進行輔助,此時運維流程的重要性就凸顯出來。但隨著時代的發展,自動化和智慧化技術逐漸普及,運維流程的發展趨勢越來越輕量化,ITIL流程體系的建設將在將來越來越少

運維定位屬性

最終探討了運維的定位屬性,這裡的位置包括了網路位置和邏輯位置。運維目標所處的網路位置大致可以分為接入網路、廣域網和資料中心。因為三個系統所處的地理位置不同,其運維差率很高。上一節討論的大部分內容都是關於資料中心的執行維護,下面主要講接入網的運維。接入網路運維涉及終端(型別、系統)、接入者(無線嗎),在身份認證等方面,由於終端型別複雜,接入人員水平參差不齊,接入網執行的複雜性也較高,運維人員不僅要具備多方面的運維知識,還要有足夠的耐心,要有豐富的運維經驗,還要有足夠的耐心。

想了解更多精彩內容,快來關注雲吶資產物聯服務平臺