觀縱在協(xié)調(diào)交付與研發(fā)做信創(chuàng)產(chǎn)品適配,幫助客戶在內(nèi)部搭建信創(chuàng)環(huán)境的時(shí)候發(fā)現(xiàn),如果想讓運(yùn)維行業(yè)的信創(chuàng)產(chǎn)業(yè)高質(zhì)量發(fā)展,是依靠自主創(chuàng)新研發(fā)產(chǎn)品是不夠的,還需要有領(lǐng)航者來(lái)為運(yùn)維行業(yè)發(fā)展做“規(guī)劃”,給予客戶足夠的安全感和信任感。
如今,觀縱的Argus運(yùn)維監(jiān)控系統(tǒng)目前已獲得部分信創(chuàng)適配證書。未來(lái)觀縱將繼續(xù)投入人力與物力,對(duì)產(chǎn)品進(jìn)行創(chuàng)新實(shí)踐,加快其在信創(chuàng)領(lǐng)域的運(yùn)維場(chǎng)景落地應(yīng)用,攜手上下游合作伙伴共建生態(tài),領(lǐng)導(dǎo)智能運(yùn)維行業(yè)向高質(zhì)量發(fā)展。 什么是統(tǒng)一運(yùn)維監(jiān)控平臺(tái)?真的能提高IT運(yùn)維效率嗎?技術(shù)運(yùn)維監(jiān)控
2020年12月13日,據(jù)海外媒體報(bào)道,一個(gè)名為APT的網(wǎng)絡(luò)入侵組織把世界出名網(wǎng)管軟件廠商SolarWinds作為入侵目標(biāo)。這次APT攻擊首先是對(duì)SolarWinds旗下的Orion網(wǎng)絡(luò)監(jiān)控軟件更新服務(wù)器進(jìn)行入侵,并在軟件更新(Orion)中植入了惡意代碼。透露大約有1.8萬(wàn)客戶在其系統(tǒng)上部署了該更新,且對(duì)美國(guó)財(cái)政部高層領(lǐng)導(dǎo)使用的電子郵件系統(tǒng)也造成了影響。
SolarWinds的系統(tǒng)被攻擊之后,已導(dǎo)致全球許多組織的網(wǎng)絡(luò)遭到破壞,涉及的供應(yīng)鏈范圍極為廣大,被稱為2020年美國(guó)極大網(wǎng)絡(luò)安全事件。
“太陽(yáng)風(fēng)”(SolarWinds) 是一家專職提供IT監(jiān)控和運(yùn)維解決方案的商業(yè)公司。其產(chǎn)品SolarWinds Orion Network Performance Monitor(NPM)是集網(wǎng)絡(luò)監(jiān)測(cè)、設(shè)備性能維護(hù)管理、故障監(jiān)控、網(wǎng)絡(luò)實(shí)時(shí)流量監(jiān)控和歷史數(shù)據(jù)統(tǒng)計(jì)、匯總和歷史數(shù)據(jù)分析、虛擬數(shù)據(jù)中心監(jiān)控、網(wǎng)絡(luò)拓?fù)浔O(jiān)控等功能于一體的網(wǎng)絡(luò)管理系統(tǒng)。該軟件主要是用于企業(yè)內(nèi)部網(wǎng)絡(luò)管理,目前全球客戶超過(guò)32萬(wàn)家。SolarWinds作為一個(gè)齊全的IT管理系統(tǒng)還有一些功能的欠缺,而且中文支持也是一個(gè)國(guó)內(nèi)推廣的難題。像同一類型的軟件Hostmonitor、CA Unicenter也是存在同樣的問(wèn)題。 服務(wù)運(yùn)維監(jiān)控24企業(yè)級(jí)運(yùn)維監(jiān)控系統(tǒng)體系化建設(shè)指南。
在云原生時(shí)代,基礎(chǔ)設(shè)施與應(yīng)用的部署構(gòu)建都發(fā)生了極大變化,傳統(tǒng)的監(jiān)控方式已經(jīng)無(wú)法適應(yīng)云原生的場(chǎng)景。Prometheus支持對(duì)kubernetes和容器的監(jiān)控,基本上是完美選擇,那么通過(guò)Prometheus監(jiān)控體系如何搭建PAAS監(jiān)控體系?監(jiān)控哪些對(duì)象?
k8s管理組件、節(jié)點(diǎn)、pod容器、各種中間件數(shù)據(jù)庫(kù)組件指標(biāo):mysql、redis、kafka、rocketmq、activemq、zookeeper、elasticsearch、mongodb、nginx、clickhouse。同時(shí),還提供了kingbase、polardb、GreatDB等國(guó)產(chǎn)數(shù)據(jù)庫(kù)的監(jiān)控。
怎么監(jiān)控?
k8s組件監(jiān)控:Prometheus直接拉取各組件的metrics接口數(shù)據(jù);
節(jié)點(diǎn)監(jiān)控:在各節(jié)點(diǎn)部署node_exporter,Prometheus自動(dòng)發(fā)現(xiàn)所有節(jié)點(diǎn)對(duì)象拉取exporter提供的數(shù)據(jù);
pod容器監(jiān)控:用各節(jié)點(diǎn)部署的kubelet的cadivisor功能,使Prometheus自動(dòng)發(fā)現(xiàn)并拉取cadivisor提供的容器運(yùn)行時(shí)指標(biāo),并部署kube-state-metrics拉取pod容器元數(shù)據(jù)。
基于Zabbix來(lái)構(gòu)建整個(gè)監(jiān)控體系生態(tài)圈。下面我們就來(lái)監(jiān)控系統(tǒng)的整個(gè)流程:數(shù)據(jù)采集:Zabbix通過(guò)SNMP、Agent、ICMP、SSH、IPMI等對(duì)系統(tǒng)進(jìn)行數(shù)據(jù)采集;數(shù)據(jù)存儲(chǔ):Zabbix存儲(chǔ)在MySQL上,也可以存儲(chǔ)在其他數(shù)據(jù)庫(kù)服務(wù);使用數(shù)據(jù)庫(kù)是必備技能。數(shù)據(jù)分析:當(dāng)我們事后需要復(fù)盤分析故障時(shí),Zabbix能給我們提供圖形以及時(shí)間等相關(guān)信息,方面我們確定故障所在;數(shù)據(jù)展示:Web界面展示、(移動(dòng)APP、java_php開發(fā)一個(gè)Web界面也可以);監(jiān)控報(bào)警:電話報(bào)警、郵件報(bào)警、微信報(bào)警、短信報(bào)警、報(bào)警升級(jí)機(jī)制等(無(wú)論什么報(bào)警都可以);報(bào)警處理:當(dāng)接收到報(bào)警,我們需要根據(jù)故障的級(jí)別進(jìn)行處理,比如:重要緊急、重要不緊急,等。根據(jù)故障的級(jí)別,配合相關(guān)的人員進(jìn)行快速處理。運(yùn)維監(jiān)控的目的是什么?
監(jiān)控是一項(xiàng)非常重要的運(yùn)維工作,尤其對(duì)于一些比較重要的業(yè)務(wù),如果沒有監(jiān)控,就只能等著用戶反饋。常見的開源監(jiān)控軟件有 Cacti、Nagios、Zabbix、Smokeping 和 Open-falcon 等。Cacti 和 Smokeping 傾向于基礎(chǔ)監(jiān)控,成圖非常漂亮。Cacti、Nagios 和 Zabbix 服務(wù)端監(jiān)控中心需要 PHP 環(huán)境支持,其中 Zabbix 和 Cacti 需要安裝 MySQL 作為存儲(chǔ)數(shù)據(jù)庫(kù)。Nagios 不用存儲(chǔ)歷史數(shù)據(jù),注重服務(wù)或監(jiān)控項(xiàng)的狀態(tài)。Zabbix 會(huì)獲取服務(wù)或監(jiān)控項(xiàng)目的數(shù)據(jù),把數(shù)據(jù)記錄到數(shù)據(jù)庫(kù)中,可以成圖查看。Argus是基于Zabbix的IT運(yùn)維監(jiān)控平臺(tái),打造完整的Iaas&Paas兼容感知解耦Zabbix版本限制,生態(tài)無(wú)縫兼容 基于Zabbix二開的開源監(jiān)控和報(bào)警系統(tǒng)Argus入門之旅!福建運(yùn)維監(jiān)控供應(yīng)
Argus單一業(yè)務(wù)環(huán)境下可以支持多 組采集單元(多zabbix-server),實(shí)現(xiàn)真正意義上的分布式采集。技術(shù)運(yùn)維監(jiān)控
對(duì)于網(wǎng)絡(luò)設(shè)備的監(jiān)控,也一般從設(shè)備性能、質(zhì)量、狀態(tài)等維度入手。對(duì)于每臺(tái)網(wǎng)絡(luò)設(shè)備來(lái)說(shuō)運(yùn)維同學(xué)一般會(huì)關(guān)注如下等高頻場(chǎng)景:
網(wǎng)絡(luò)設(shè)備的運(yùn)行狀態(tài)syslog(設(shè)備運(yùn)行日志)的監(jiān)控與告警;設(shè)備堆疊狀態(tài)下的(例如交換機(jī)堆疊)的監(jiān)控與告警;網(wǎng)絡(luò)設(shè)備上每個(gè)物理端口的、流量、包量、錯(cuò)包與端口狀態(tài)的監(jiān)控與告警;網(wǎng)絡(luò)設(shè)備上邏輯端口(物理端口組合)的性能與狀態(tài)。
對(duì)于網(wǎng)絡(luò)設(shè)備的syslog告警來(lái)說(shuō),同樣也會(huì)面臨諸如:不同的廠商、設(shè)備類型與設(shè)備型號(hào)日志標(biāo)準(zhǔn)不統(tǒng)一等問(wèn)題。
所以對(duì)于網(wǎng)絡(luò)設(shè)備syslog監(jiān)控告警來(lái)說(shuō),首先是將眾多的網(wǎng)絡(luò)設(shè)備進(jìn)行邏輯分組,以便于在一個(gè)分組內(nèi)的設(shè)備均可以響應(yīng)同一個(gè)告警關(guān)鍵字,并且這個(gè)分組粒度建議較細(xì),這樣才能保障告警關(guān)鍵字的有效性與獨(dú)一性。在這里根據(jù)多年的運(yùn)維經(jīng)驗(yàn),建議syslog告警的分組模型由四個(gè)維度組成:廠商+類型+型號(hào)+用途例如:CISCO+交換機(jī)+EX43000-24T+內(nèi)網(wǎng)接入層交換機(jī),通過(guò)這個(gè)公式就描述出一個(gè)設(shè)備的邏輯分組。 技術(shù)運(yùn)維監(jiān)控
上海觀縱科技有限公司擁有一般項(xiàng)目:技術(shù)服務(wù)、技術(shù)開發(fā)、技術(shù)咨詢、技術(shù)交流、技術(shù)轉(zhuǎn)讓、技術(shù)推廣;軟件開發(fā);人工智能基礎(chǔ)軟件開發(fā);人工智能應(yīng)用軟件開發(fā);數(shù)據(jù)處理服務(wù);信息技術(shù)咨詢服務(wù);信息系統(tǒng)集成服務(wù):信息系統(tǒng)運(yùn)行維護(hù)服務(wù);計(jì)算機(jī)系統(tǒng)服務(wù);軟件銷售;計(jì)算機(jī)軟硬件及輔助設(shè)備批發(fā);計(jì)算機(jī)軟硬件及輔助設(shè)備零售;電子產(chǎn)品銷售;通信設(shè)備銷售;通訊設(shè)備銷售;咨詢策劃服務(wù);市場(chǎng)調(diào)查(不含涉外調(diào)查);廣告制作;廣告發(fā)布;廣告設(shè)計(jì)、代理;會(huì)議及展覽服務(wù);貨物進(jìn)出口。(除依法須經(jīng)批準(zhǔn)的項(xiàng)目外,憑營(yíng)業(yè)執(zhí)照依法自主開展經(jīng)營(yíng)活動(dòng)) 許可項(xiàng)目:建筑智能化系統(tǒng)設(shè)計(jì);建設(shè)工程施工;網(wǎng)絡(luò)文化經(jīng)營(yíng);互聯(lián)網(wǎng)信息服務(wù)。(依法須經(jīng)批準(zhǔn)的項(xiàng)目,經(jīng)相關(guān)部門批準(zhǔn)后方可開展經(jīng)營(yíng)活動(dòng),具體經(jīng)營(yíng)項(xiàng)目以相關(guān)部門批準(zhǔn)文件或許可證件為準(zhǔn))等多項(xiàng)業(yè)務(wù),主營(yíng)業(yè)務(wù)涵蓋webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控。公司目前擁有專業(yè)的技術(shù)員工,為員工提供廣闊的發(fā)展平臺(tái)與成長(zhǎng)空間,為客戶提供高質(zhì)的產(chǎn)品服務(wù),深受員工與客戶好評(píng)。上海觀縱科技有限公司主營(yíng)業(yè)務(wù)涵蓋webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控,堅(jiān)持“質(zhì)量保證、良好服務(wù)、顧客滿意”的質(zhì)量方針,贏得廣大客戶的支持和信賴。公司力求給客戶提供全數(shù)良好服務(wù),我們相信誠(chéng)實(shí)正直、開拓進(jìn)取地為公司發(fā)展做正確的事情,將為公司和個(gè)人帶來(lái)共同的利益和進(jìn)步。經(jīng)過(guò)幾年的發(fā)展,已成為webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控行業(yè)出名企業(yè)。