压在透明的玻璃上c-国产精品国产一级A片精品免费-国产精品视频网-成人黄网站18秘 免费看|www.tcsft.com

北塔軟件:已用盡洪荒之力,“主動運維”真的沒有更好的選擇了嗎?

在IT運維領域,有兩個被無數次提起的詞,一個是“救火隊員”,一個是與之對應的“主動運維”。兩個詞匯前后呼應,旨在說明IT部門為了擺脫前者匆忙、低效的形象,用盡洪荒之力,以求避免IT系統故障,增加業務系統的健康運行時間。

但是,作為國內領先的IT運維管理解決方案提供商,北塔軟件在為很多客戶提供運維服務時卻發現,在“主動運維”的光環背后,很多人還只能將其當成一種愿望,真正實現起來卻是困難重重。這是因為,在主動運維落地時存在的兩大難題:經驗、能力。

誤把“閾yù”當“閥fá”,棘手問題緊跟其后

在IT管理中,有兩個詞經常被混淆在一起用,你甚至可以在一些IT大咖演講時也能聽到。這就是閾值和閥值。其實,“閥值”這個詞最早是沒有的,后來國家的咬文嚼字工作組通過統計全國人民使用詞語的習慣(也就是別字用多了,大家都成了習慣),發現了閥值這個詞。但規范來講,“閾值”才是主動運維中的正宗血脈。那么,我們為何要緊緊抓住它呢?

在被動運維中,業務部門一般最先發現故障現象,然后層層匯報領導后,指令IT運維部門盡快查明原因,并制定故障解決方案,直至解決故障,系統恢復正常為止。而主動式IT運維服務則可以很好的采取預防的手段進行監控管理,由IT部門首先發現可能出現的故障,改變“被火烤”的局面。為此,IT部門需要針對每個系統建立閾值報警體系,通過“基準線”觀察每個系統可用性、流暢度、安全性的指標,凡低于或超過閾值,說明系統無法達到最低要求,則對該系統進行報警提示。

閾值的定義很容易理解,但在運維工具中如何設定就是一道難題了,這需要“經驗”。首先,除了“0%”或是“100%”,這之間的任何一個數值都會處于設定預警閾值的范疇,管理員很難選取最合理的基線范圍。其次,如果說“60%~80%”屬于最常見的平均預警數,但業務系統都會出現集中訪問的高峰期或是空閑期,閾值空間就會極大,造成頻繁誤報的現象。對于許多新上線的系統,“管理員的經驗”幾乎無法發揮作用。

對此,北塔軟件表示:閾值的設定要依據歷史數據,但一些維護人員往往是依靠自己的運維經驗和行業慣例來設定故障告警閥值,無法按照系統的運行變化特性及時地進行智能調整,也沒有持續改進和優化的有效方法來改變現狀。鑒于以上難題,北塔BTSO2.5在保留實時閾值告警的基礎上,更著重于對歷史數據進行深入挖掘,系統從用戶業務環境中自主學習和生成風險閾值,這項特性可以幫助管理員解決閾值固化的問題,進而實現自動化的主動運維方式。

沒有“技術大咖”就無法實現主動運維嗎?

建立和實施信息系統的主動式運維管理平臺,注定是一個循序漸進的過程,需要對運維規則進行反復的調整,這不可能一蹴而就。但是,每個企業的IT部門都有著自己的特色,有的技術人員能力很強、待遇很高,有的卻無法留住這些高資人才,導致運維規則無法落地。

因此,如果說“自主學習”是主動運維的第一步,接下來就需要實現“智能運維”,這也是從“人治”到“法治”的門檻。

傳統的主動運維思路以事件為核心,側重對故障的定位,但不負責解決,這就無法擺脫“人治”的束縛。而BTSO提出的主動運維不僅以數據為核心,根據用戶所屬行業自動定義正常閾值,還能將運維規則自動導入,指引用戶按照規則處理IT預警信息,直接讓用戶步入中等運維水平。

以高負載主機為例,當管理對象加入系統后,BTSO自動啟動各類主機性能監控,當個別主機出現高負載的表象后,系統不僅可以過濾偶發的CPU沖高現象,還能橫向擴展分析,結合歷史數據自動判斷,告之用戶這個偶發現象是否有關聯、是否影響了業務系統的整體健康。如果被確定為長期高負載主機,系統將提出優化處理步驟。

不僅是CPU,管理員最擔心的內存泄露,BTSO也能從增長趨勢的角度,智能分析出這些表像背后的根源,利用72小時或更長時期的分析報告,或是系統將根據用戶需求自動做出24小時的“進程級”內存泄露定位,展現有可能溢出的進程名稱和消耗,更主動的消除故障隱患。另外,網絡擁堵、數據庫指標異常波動等,這些很難在短時間處理、必須依靠技術高手處理的問題,BTSO都提供了智能處理的內置規則,在用戶無需掌握深奧理論的情況下,首先解決實際問題。并且,這些正確處理的步驟會被一一記錄,在企業內部形成運維知識體系的傳承。

“開刀治病”不如“強身健體”

在IT運維領域中,“主動”并不是一個新鮮的概念,幾乎所有的IT運維產品都在宣傳它。然而,由于今天的IT組織面臨著諸如日益增長的基礎設施復雜性、技能方面的限制以及“人才短板”等相當多的問題,因此要實現這一點并不容易。

但是,“主動運維”刻不容緩。這就如人生病一樣,很多疾病都會造成身體上多處特征的不良反應,但生活中多數人都不在意身體不適癥狀,因此導致很多疾病錯過了最佳的治療時機。當然,主動運維理念的發展方向也將迎來改變,智慧運維不僅需要“開刀治病”,更應解決運維經驗、個人能力等問題,指引業務系統“強身健體”。

上一篇:“態勢感知”引領信息安全銳捷網絡RG-BDS大數據安全平臺正式問世

下一篇:瑞星:未來中國信息安全趨勢展望