文章摘要: ??客戶面臨的挑戰(zhàn)隨著某國有大型券商業(yè)務(wù)的快速發(fā)展,信息系統(tǒng)日漸龐大和復(fù)雜,數(shù)據(jù)…
隨著某國有大型券商業(yè)務(wù)的快速發(fā)展,信息系統(tǒng)日漸龐大和復(fù)雜,數(shù)據(jù)中心運(yùn)維管理難度和重要性也日漸凸顯,對(duì)業(yè)務(wù)連續(xù)性要求和運(yùn)維服務(wù)質(zhì)量的要求也不斷提高,迫切需要建設(shè)一套科學(xué)、高效的運(yùn)維管理體系。
目前由于監(jiān)視數(shù)據(jù)源復(fù)雜多樣,數(shù)據(jù)源來自不同應(yīng)用程序、主機(jī),及各種基礎(chǔ)設(shè)施,差異大而管理復(fù)雜。一旦出現(xiàn)問題,基礎(chǔ)架構(gòu)、中間件、數(shù)據(jù)庫和應(yīng)用分頭查,但相互孤立,難以及時(shí)找出問題環(huán)節(jié)。也缺乏技術(shù)手段,針對(duì)單個(gè)用戶、單筆交易無法關(guān)聯(lián)分析交易過程、操作過程,導(dǎo)致問題定位難。
故障診斷發(fā)生時(shí),時(shí)間往往被耗費(fèi)在無序的排查工作中,其中的主要問題在于:一旦發(fā)生問題,多部門同時(shí)開始根據(jù)各自經(jīng)驗(yàn)診斷;缺乏統(tǒng)一視角的證據(jù)支持,沒有入手點(diǎn);若無法達(dá)成共識(shí),則需要進(jìn)一步線索進(jìn)行反復(fù)排查。
傳統(tǒng)應(yīng)用性能管理方法存在很多技術(shù)局限,諸如“豎井”式的數(shù)據(jù)分析方式,缺乏關(guān)聯(lián)性,分析冗雜而效率低下;給應(yīng)用主機(jī)部署Agent模式帶來的性能下降、宕機(jī)風(fēng)險(xiǎn);開發(fā)周期長、落地困難等等。諸多因素都會(huì)導(dǎo)致項(xiàng)目可行性變差,存在無法落地的風(fēng)險(xiǎn)。
如何面對(duì)以上交易系統(tǒng)的運(yùn)維問題,并提出合理的建議和可行的方案,成了當(dāng)務(wù)之急。
君思科技結(jié)合證券行業(yè)的特點(diǎn)為其設(shè)計(jì)了交易分析監(jiān)控系統(tǒng)
君思科技依據(jù)其對(duì)證券行業(yè)業(yè)務(wù)的了解,為某國有券商部署了交易分析監(jiān)控系統(tǒng)。
通過獲得可測量的交易應(yīng)用性能數(shù)據(jù),為后續(xù)流程進(jìn)行分析、追蹤、定位提供數(shù)據(jù)和功能支持。通過即時(shí)獲得有效的交易應(yīng)用性能管理數(shù)據(jù),了解、把握交易應(yīng)用系統(tǒng)的運(yùn)行狀態(tài),一旦發(fā)現(xiàn)異常波動(dòng),可以及時(shí)采取措施,在預(yù)防階段捕捉并解決問題,避免因業(yè)務(wù)性能下降或中斷范圍擴(kuò)大而導(dǎo)致業(yè)務(wù)經(jīng)營損失;而在問題發(fā)生時(shí),能夠幫助企業(yè) IT 部門加速分析、追蹤和定位故障,減少業(yè)務(wù)中斷時(shí)間,達(dá)成 SLA 目標(biāo)。
交易分析監(jiān)控系統(tǒng)著眼的是系統(tǒng)整體的性能管理,而非僅僅針對(duì)某個(gè)技術(shù)層次的“豎井”式的解決方案,因此從指標(biāo)到覆蓋范圍,交易分析監(jiān)控系統(tǒng)提供了如下功能:
-
關(guān)注交易性能指標(biāo):包括交易量、成功率、響應(yīng)率、響應(yīng)時(shí)間、返回代碼五個(gè)表征交易性能的重要指標(biāo)。
-
端到端監(jiān)視能力:多層級(jí)的應(yīng)用組件串聯(lián)在一起構(gòu)成服務(wù)路徑,這個(gè)服務(wù)路徑最終交付的業(yè)務(wù)性能構(gòu)成用戶體驗(yàn),以最終用戶的響應(yīng)時(shí)間為主要的衡量標(biāo)準(zhǔn),在第一時(shí)間將問題定位于某個(gè)組件層級(jí),在問題解決之后,也會(huì)從應(yīng)用整體響應(yīng)時(shí)間的角度,測量改進(jìn)之后的性能。
-
交易追蹤和關(guān)聯(lián)分析能力:針對(duì)特定交易記錄提供可追蹤分析的能力,并且能夠關(guān)聯(lián)多層級(jí)應(yīng)用組件,提供快捷和深入的問題分析定位能力。
-
實(shí)時(shí)性:實(shí)時(shí)獲取業(yè)務(wù)性能數(shù)據(jù)并提供關(guān)鍵指標(biāo)的統(tǒng)計(jì),及時(shí)掌握、分析、追蹤業(yè)務(wù)性能的動(dòng)態(tài)變化,及時(shí)發(fā)現(xiàn)問題進(jìn)入解決流程。
-
多數(shù)據(jù)中心覆蓋能力:目具備全面覆蓋多中心環(huán)境的能力,并且能夠捕捉到數(shù)據(jù)流向變化以及因此對(duì)業(yè)務(wù)性能產(chǎn)生的影響。
客戶收益
-
面向網(wǎng)絡(luò)服務(wù),構(gòu)建以網(wǎng)絡(luò)服務(wù)為中心的管理視圖,一對(duì)一垂直支撐業(yè)務(wù),與用戶體驗(yàn)相關(guān)聯(lián)
-
覆蓋端到端的應(yīng)用組件,全面可視化應(yīng)用性能和可用性,業(yè)務(wù)動(dòng)態(tài)實(shí)時(shí)呈現(xiàn),展現(xiàn)應(yīng)用性能對(duì)用戶體驗(yàn)的影響;
-
體現(xiàn)應(yīng)用六大關(guān)鍵指標(biāo):交易量、成功率、響應(yīng)時(shí)間、返回代碼分布、交易類別、交易渠道;
-
深入網(wǎng)絡(luò)精細(xì)測量網(wǎng)絡(luò)服務(wù)質(zhì)量,體現(xiàn)網(wǎng)絡(luò)關(guān)鍵指標(biāo):流量、連接數(shù)、客戶端數(shù)量、TCP事件、重傳重置等;
-
組合條件交易追蹤,適用于一線、二線運(yùn)維人員,快速獲得目標(biāo)信息,找出問題位置、原因;
-
無代理,旁路式監(jiān)控,不影響被管理應(yīng)用,零風(fēng)險(xiǎn);
-
自動(dòng)生成基準(zhǔn)線、支持基于基線的動(dòng)態(tài)告警以及閾值告警,即時(shí)告警即時(shí)通知