信息系統(tǒng)運(yùn)維方案
發(fā)布時(shí)間:2020-07-07 來源: 工作總結(jié) 點(diǎn)擊:
目 目
錄 1
運(yùn)維 服務(wù)內(nèi)容 ................................................................................................................................ 2
1.1
服務(wù)目標(biāo) ............................................................................................................................... 2
1.2
信息資產(chǎn)統(tǒng)計(jì)服務(wù) ............................................................................................................... 3
1.3
網(wǎng)絡(luò)、安全系統(tǒng)運(yùn)維服務(wù) ................................................................................................... 3
1.4
主機(jī)、存儲系統(tǒng)運(yùn)維服務(wù) ................................................................................................... 5
1.5
數(shù)據(jù)庫系統(tǒng)運(yùn)維服務(wù) ........................................................................................................... 8
1.6
中間件運(yùn)維服務(wù) ................................................................................................................... 9
2
運(yùn)維服務(wù)流程 .............................................................................................................................. 10
3
服務(wù)管理制度規(guī)范 ...................................................................................................................... 12
3.1
服務(wù)時(shí)間 ............................................................................................................................. 12
3.2
行為規(guī)范 ............................................................................................................................. 12
3.3
現(xiàn)場服務(wù)支持規(guī)范 ............................................................................................................. 13
3.4
問題記錄規(guī)范 ..................................................................................................................... 13
4
應(yīng)急服務(wù)響應(yīng)措施 ...................................................................................................................... 15
4.1
應(yīng)急基本流程 ..................................................................................................................... 15
4.2
預(yù)防措施 ............................................................................................................................. 15
4.3
突發(fā)事件應(yīng)急策略 ............................................................................................................. 16
1 服務(wù)內(nèi)容 1.1 服務(wù)目標(biāo) 運(yùn)行維護(hù)服務(wù)包括,信息系統(tǒng)相關(guān)的主機(jī)設(shè)備、操作系統(tǒng)、數(shù)據(jù)庫和存儲設(shè)備及其他信息系統(tǒng)的運(yùn)行維護(hù)與安全防范服務(wù),保證用戶現(xiàn)有的信息系統(tǒng)的正常運(yùn)行,降低整體管理成本,提高網(wǎng)絡(luò)信息系統(tǒng)的整體服務(wù)水平。同時(shí)根據(jù)日常維護(hù)的數(shù)據(jù)和記錄,提供用戶信息系統(tǒng)的整體建設(shè)規(guī)劃和建議,更好的為用戶的信息化發(fā)展提供有力的保障。
用戶信息系統(tǒng)的組成主要可分為兩類:硬件設(shè)備和軟件系統(tǒng)。硬件設(shè)備包括網(wǎng)絡(luò)設(shè)備、安全設(shè)備、主機(jī)設(shè)備、存儲設(shè)備等;軟件設(shè)備可分為操作系統(tǒng)軟件、典型應(yīng)用軟件(如:數(shù)據(jù)庫軟件、中間件軟件等)、業(yè)務(wù)應(yīng)用軟件等。
通過運(yùn)行維護(hù)服務(wù)的有效管理來提升用戶信息系統(tǒng)的服務(wù)效率,協(xié)調(diào)各業(yè)務(wù)應(yīng)用系統(tǒng)的內(nèi)部運(yùn)作,改善網(wǎng)絡(luò)信息系統(tǒng)部門與業(yè)務(wù)部門的溝通,提高服務(wù)質(zhì)量。結(jié)合用戶現(xiàn)有的環(huán)境、組織結(jié)構(gòu)、IT 資源和管理流程的特點(diǎn),從流程、人員和技術(shù)三方面來規(guī)劃用戶的網(wǎng)絡(luò)信息系統(tǒng)的結(jié)構(gòu)。將用戶的運(yùn)行目標(biāo)、業(yè)務(wù)需求與IT 服務(wù)的相協(xié)調(diào)一致。
信息系統(tǒng)服務(wù)的目標(biāo)是,對用戶現(xiàn)有的信息系統(tǒng)基礎(chǔ)資源進(jìn)行監(jiān)控和管理,及時(shí)掌握網(wǎng)絡(luò)信息系統(tǒng)資源現(xiàn)狀和配置信息,反映信息系統(tǒng)資源的可用性情況和健康狀況,創(chuàng)建一個(gè)可知可控的 IT 環(huán)境,從而保證用戶信息系統(tǒng)的各類業(yè)務(wù)應(yīng)用系統(tǒng)的可靠、高效、持續(xù)、安全運(yùn)行。
服務(wù)項(xiàng)目范圍覆蓋的信息系統(tǒng)資源以下方面的關(guān)鍵狀態(tài)及參數(shù)指標(biāo):
? 運(yùn)行狀態(tài)、故障情況 ? 配置信息 ? 可用性情況及健康狀況性能指標(biāo) ? 統(tǒng)計(jì)運(yùn)維數(shù)椐、提供信息系統(tǒng)管理和工作報(bào)告、歸納總結(jié)并提供用戶想了解的數(shù)椐報(bào)告
1.2 信息資產(chǎn)統(tǒng)計(jì)服務(wù) 此項(xiàng)服務(wù)為基本服務(wù),包含在運(yùn)行維護(hù)服務(wù)中,幫助我們對用戶現(xiàn)有的信息資產(chǎn)情況進(jìn)行了解,更好的提供系統(tǒng)的運(yùn)行維護(hù)服務(wù)。
服務(wù)內(nèi)容包括:
? 硬件設(shè)備型號、數(shù)量、版本等信息統(tǒng)計(jì)記錄 ? 軟件產(chǎn)品型號、版本和補(bǔ)丁等信息統(tǒng)計(jì)記錄 ? 網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)路由、網(wǎng)絡(luò) IP 地址統(tǒng)計(jì)記錄 ? 綜合布線系統(tǒng)結(jié)構(gòu)圖的繪制 ? 其它附屬設(shè)備的統(tǒng)計(jì)記錄 硬件設(shè)備清單如下表統(tǒng)計(jì):
1.3 網(wǎng)絡(luò) 、安全 系統(tǒng)運(yùn)維服務(wù) 從網(wǎng)絡(luò)的連通性、網(wǎng)絡(luò)的性能、網(wǎng)絡(luò)的監(jiān)控管理三個(gè)方面實(shí)現(xiàn)對網(wǎng)絡(luò)系統(tǒng)的運(yùn)維管理。網(wǎng)絡(luò)、安全系統(tǒng)基本服務(wù)內(nèi)容:
序號 服務(wù)模塊 內(nèi)容描述 提供方 1 現(xiàn)場備件安裝
配合用戶進(jìn)行,按備件到達(dá)現(xiàn)場時(shí)間工程師到達(dá)現(xiàn)場
2 現(xiàn)場軟件升級
首先分析軟件升級的必要性和風(fēng)險(xiǎn),配合用戶進(jìn)行軟件升級
3 現(xiàn)場故障診斷
按服務(wù)級別:7× 24 小時(shí)
5× 8 小時(shí)
4 電話遠(yuǎn)程技術(shù)支持 7× 24 小時(shí)
5 問題管理系統(tǒng) 對遇到的問題進(jìn)行匯總和發(fā)布
網(wǎng)絡(luò)核心交換機(jī)巡視典型作業(yè)計(jì)劃書
系統(tǒng)管理單位:
維保單位:
設(shè)備名:
設(shè)備型號:
管理 IP:
檢查內(nèi)容
參考標(biāo)準(zhǔn)
檢查結(jié)果
檢查結(jié)論
巡視方法描述
巡檢周期
硬件運(yùn)行狀態(tài) 電源運(yùn)行狀態(tài)
□正常
□異常
風(fēng)扇運(yùn)行狀態(tài)
□正常
□異常
模塊運(yùn)行狀態(tài)
□正常
□異常
系統(tǒng) VLAN
狀態(tài)
□正常
□異常
運(yùn)行狀態(tài)檢查 配置
狀態(tài)
□正常
□異常
OSPF
狀態(tài)
□正常
□異常
日志檢查 日志
狀態(tài)
□正常
□異常
其他檢查內(nèi)容
□正常
□異常
□正常
□異常
□正常
□異常
(1) 用戶現(xiàn)場技術(shù)人員值守 根據(jù)用戶的需求提供長期的用戶現(xiàn)場技術(shù)人員值守服務(wù),保證網(wǎng)絡(luò)的實(shí)時(shí)連通和可用,保障接入交換機(jī)、匯聚交換機(jī)和核心交換機(jī)的正常運(yùn)轉(zhuǎn),F(xiàn)場值守的技術(shù)人員每天記錄網(wǎng)絡(luò)交換機(jī)的端口是否可以正常使用,網(wǎng)絡(luò)的轉(zhuǎn)發(fā)和路由是否正常進(jìn)行,交換機(jī)的性能檢測,進(jìn)行整體網(wǎng)絡(luò)性能評估,針對網(wǎng)絡(luò)的利用率進(jìn)行優(yōu)化并提出網(wǎng)絡(luò)擴(kuò)容和優(yōu)化的建議。
現(xiàn)場值守人員還進(jìn)行安全設(shè)備的日常運(yùn)行狀態(tài)的監(jiān)控,對各種安全設(shè)備的日志檢查,對重點(diǎn)事件進(jìn)行記錄,對安全事件的產(chǎn)生原因進(jìn)行判斷和解決,及時(shí)發(fā)現(xiàn)問題,防患于未然。
同時(shí)能夠?qū)υO(shè)備的運(yùn)行數(shù)據(jù)進(jìn)行記錄,形成報(bào)表進(jìn)行統(tǒng)計(jì)分析,便于進(jìn)行網(wǎng)絡(luò)系統(tǒng)的分析和故障的提前預(yù)知。具體記錄的數(shù)據(jù)包括:
? 配置數(shù)據(jù) ? 性能數(shù)據(jù) ? 故障數(shù)據(jù) (2) 現(xiàn)場 巡檢服務(wù) 現(xiàn)場巡檢服務(wù)是對客戶的設(shè)備及網(wǎng)絡(luò)進(jìn)行全面檢查的服務(wù)項(xiàng)目,通過該服務(wù)可使客戶獲得設(shè)備運(yùn)行的第一手資料,最大可能地發(fā)現(xiàn)存在的隱患,保障設(shè)備穩(wěn)定運(yùn)行。同時(shí),將有針對性地提出預(yù)警及解決建議,使客戶能夠提早預(yù)防,最大限度降低運(yùn)營風(fēng)險(xiǎn)。
巡檢包括的內(nèi)容如下:
編號 巡檢內(nèi)容 1 硬件運(yùn)行狀態(tài)檢查項(xiàng)目
單板狀態(tài)檢查 電源模塊狀態(tài)檢查 風(fēng)扇狀態(tài)檢查 整機(jī)指示燈狀態(tài)檢查 機(jī)框防塵網(wǎng)檢查 機(jī)房溫度、濕度檢查 設(shè)備地線檢查
2 軟件運(yùn)行情況檢查項(xiàng)目 設(shè)備運(yùn)行情況檢查 網(wǎng)絡(luò)報(bào)文分析 設(shè)備對接運(yùn)行狀況檢查 路由運(yùn)行情況檢查
3 網(wǎng)絡(luò)整體運(yùn)行情況調(diào)查 網(wǎng)絡(luò)運(yùn)行問題調(diào)查 網(wǎng)絡(luò)變更情況調(diào)查 網(wǎng)絡(luò)歷史故障調(diào)查 (3) 網(wǎng)絡(luò)運(yùn)行分析與管理服務(wù) 網(wǎng)絡(luò)運(yùn)行分析與管理服務(wù)是指工程師通過對網(wǎng)絡(luò)運(yùn)行狀況、網(wǎng)絡(luò)問題進(jìn)行周期性檢查、分析后,為客戶提出指導(dǎo)性建議的一種綜合性高級服務(wù),其內(nèi)容包括:
服務(wù)內(nèi)容 服務(wù)優(yōu)點(diǎn) 向客戶提供網(wǎng)絡(luò)專家電話號碼。
保證重大問題第一連線至網(wǎng)絡(luò)專家。
網(wǎng)絡(luò)專家組每周與客戶進(jìn)行不少于 2 小時(shí)的電話技術(shù)交流 以最小成本保證及時(shí)解答客戶關(guān)心的技術(shù)問題,并就某一領(lǐng)域技術(shù)問題展開深層次溝通。
每月向客戶提交 CASE 匯總分析報(bào)告,并可擴(kuò)展到每年 17 次(月度、季度、年度)
使客戶了解網(wǎng)絡(luò)歷史故障情況以及故障預(yù)防建議,最大程度減少網(wǎng)絡(luò)故障隱患,更高效的進(jìn)行網(wǎng)絡(luò)管理。
(4) 重要時(shí)刻專人值守服務(wù) 保證重要時(shí)刻設(shè)備穩(wěn)定運(yùn)行對客戶成功尤為關(guān)鍵,因此,可對客戶提供重要時(shí)刻的專人現(xiàn)場值守支持,包括政府客戶的重大會議期間、金融客戶的年終結(jié)算日、運(yùn)營商客戶的生產(chǎn)網(wǎng)重大割接或其它任何客戶認(rèn)為可能對其業(yè)務(wù)運(yùn)營產(chǎn)生重大影響的時(shí)刻。
如需專人值守,客戶需至少提前 3 周與授權(quán)服務(wù)商客戶服務(wù)經(jīng)理聯(lián)系。對每位合約客戶,授權(quán)服務(wù)商均需按事先合同約定提供專人值守服務(wù)。客戶如需超出合同約定范圍的更多值守支持,需額外支付相應(yīng)人力和差旅費(fèi)用。
1.4 主機(jī) 、存儲 系統(tǒng)運(yùn) 維服務(wù) 主機(jī)、存儲系統(tǒng)的運(yùn)維服務(wù)包括:主機(jī)、存儲設(shè)備的日常監(jiān)控,設(shè)備的運(yùn)行狀態(tài)監(jiān)控,故障處理,操作系統(tǒng)維護(hù),補(bǔ)丁升級等內(nèi)容。
主機(jī)存儲系統(tǒng)基本服務(wù)內(nèi)容:
序號 服務(wù)模塊 內(nèi)容描述 提供方 1 現(xiàn)場備件安裝
配合用戶進(jìn)行。按備件到達(dá)現(xiàn)場時(shí)間工程師到達(dá)現(xiàn)場
2 補(bǔ)丁服務(wù) 消除軟件漏洞給系統(tǒng)帶來的安全隱患,并對安裝補(bǔ)丁所引起的系統(tǒng)連鎖反應(yīng)進(jìn)行合理的平衡。
3 升級服務(wù) 對系統(tǒng)進(jìn)行軟件或硬件的升級,以改進(jìn)、完善現(xiàn)有系統(tǒng)或消除現(xiàn)有系統(tǒng)的漏洞。
4 現(xiàn)場故障診斷 按服務(wù)級別:7× 24 小時(shí)
5× 8 小時(shí)
5 電話遠(yuǎn)程技術(shù)支持 7× 24 小時(shí)
6 問題管理系統(tǒng) 對遇到的問題進(jìn)行匯總和發(fā)布
7 系統(tǒng)優(yōu)化 對客戶系統(tǒng)的括主機(jī)、存儲設(shè)備、操作系統(tǒng)、提供優(yōu)化服務(wù)。
現(xiàn)場值守人員可進(jìn)行監(jiān)控管理的內(nèi)容包括:
? CPU 性能管理; ? 內(nèi)存使用情況管理; ? 硬盤利用情況管理; ? 系統(tǒng)進(jìn)程管理; ? 主機(jī)性能管理; ? 實(shí)時(shí)監(jiān)控主機(jī)電源、風(fēng)扇的使用情況及主機(jī)機(jī)箱內(nèi)部溫度; ? 監(jiān)控主機(jī)硬盤運(yùn)行狀態(tài); ? 監(jiān)控主機(jī)網(wǎng)卡、陣列卡等硬件狀態(tài); ? 監(jiān)控主機(jī) HA 運(yùn)行狀況; ? 主機(jī)系統(tǒng)文件系統(tǒng)管理; ? 監(jiān)控存儲交換機(jī)設(shè)備狀態(tài)、端口狀態(tài)、傳輸速度; ? 監(jiān)控備份服務(wù)進(jìn)程、備份情況(起止時(shí)間、是否成功、出錯告警); ? 監(jiān)控記錄磁盤陣列、磁帶庫等存儲硬件故障提示和告警,并及時(shí)解決故障問題; ? 對存儲的性能(如高速緩存、光纖通道等)進(jìn)行監(jiān)控。
小型機(jī)系統(tǒng)巡檢典型作業(yè)計(jì)劃書(P HP 服務(wù)器部分)
系統(tǒng)管理單位:
設(shè)備名:
設(shè)備型號
設(shè)備序列號
管理 IP:
檢查內(nèi)容
參考標(biāo)準(zhǔn)
檢查結(jié)果
狀態(tài)是否正常
巡檢方法描述
巡檢周期
硬件運(yùn)行狀態(tài) 電源指示燈
▅正常
□異常
面板指示燈
▅正常
□異常
內(nèi)置磁帶機(jī)
▅正常
□異常
CPU 狀態(tài)
▅正常
□異常
內(nèi)存狀態(tài)
▅正常
□異常
磁盤狀態(tài)
▅正常
□異常
網(wǎng)卡狀態(tài)
▅正常
□異常
HBA 卡運(yùn)行狀態(tài)
▅正常
□異常
系統(tǒng)檢查 系統(tǒng)日志
▅正常
□異常
▅正常
□異常
文件系統(tǒng),包括磁盤卷剩余空間
▅正常
□異常
硬件檢測
▅正常
□異常
交換分區(qū)
▅正常
□異常
固件版本
▅正常
□異常
補(bǔ)丁包版本
▅正常
□異常
系統(tǒng)鏡像
▅正常
□異常
存儲磁盤
▅正常
□異常
存儲驅(qū)動
▅正常
□異常
進(jìn)程狀態(tài)
▅正常
□異常
系統(tǒng)性能檢查 CPU 利用率
▅正常
□異常
內(nèi)存利用率
▅正常
□異常
磁盤 I/O 性能
▅正常
□異常
數(shù)據(jù)庫運(yùn)行狀態(tài) 數(shù)據(jù)庫安裝目錄
▅正常
□異常
數(shù)據(jù)庫進(jìn)程狀態(tài)
▅正常
□異常
集群檢查 集群進(jìn)程狀態(tài)
▅正常
□異常
集群日志
▅正常
□異常
存儲檢查 存儲設(shè)備故障燈狀態(tài)
▅正常
□異常
SAN 交換機(jī)端口狀態(tài)
▅正常
□異常
存儲交換機(jī)環(huán)境狀態(tài)
▅正常
□異常
系統(tǒng)故障報(bào)告
▅正常
□異常
1.5 數(shù)據(jù)庫系統(tǒng)運(yùn)維服務(wù) 數(shù)據(jù)庫運(yùn)行維護(hù)服務(wù)是包括主動數(shù)據(jù)庫性能管理,數(shù)據(jù)庫的主動性能管理對系統(tǒng)運(yùn)維非常重要。通過主動式性能管理可了解數(shù)據(jù)庫的日常運(yùn)行狀態(tài),識別數(shù)據(jù)庫的性能問題發(fā)生在什么地方,有針對性地進(jìn)行性能優(yōu)化。同時(shí),密切注意數(shù)據(jù)庫系統(tǒng)的變化,主動地預(yù)防可能發(fā)生的問題。
數(shù)據(jù)庫運(yùn)行維護(hù)服務(wù)還包括快速發(fā)現(xiàn)、診斷和解決性能問題,在出現(xiàn)問題時(shí),及時(shí)找出性能瓶頸,解決數(shù)據(jù)庫性能問題,維護(hù)高效的應(yīng)用系統(tǒng)。
數(shù)據(jù)庫運(yùn)行維護(hù)服務(wù),主要工作是使用技術(shù)手段來達(dá)到管理的目標(biāo),以系統(tǒng)最終的運(yùn)行維護(hù)為目標(biāo),提高用戶的工作效率。
具體數(shù)據(jù)庫運(yùn)行維護(hù)監(jiān)控的基本服務(wù)內(nèi)容包括:
序號 服務(wù)模塊 內(nèi)容描述 提供方 1 Oracle 數(shù)據(jù)庫 7*24 電話支持服務(wù)
每周 7 天,每天 24 小時(shí)支持中心電話,電子郵件答詢,以滿足業(yè)務(wù)發(fā)展的需要。
Oracle 產(chǎn)品技術(shù)專家直接同客戶對話,幫助解決客戶提出的疑難問題。
根據(jù)問題的嚴(yán)重程度,將優(yōu)先解決客戶認(rèn)為是關(guān)鍵而緊急的任務(wù)。
對客戶提出的一般性問題進(jìn)行技術(shù)咨詢、指導(dǎo)。
定期的客戶管理報(bào)告, 避免問題再度發(fā)生。
2 Oracle 數(shù)據(jù)庫產(chǎn)品 現(xiàn)場服務(wù)響應(yīng) 數(shù)據(jù)庫宕機(jī) 數(shù)據(jù)壞塊 影響業(yè)務(wù)不能進(jìn)行的產(chǎn)品問題 軟件產(chǎn)品的更新及維護(hù)。
3 Oracle 數(shù)據(jù)庫產(chǎn)品 系統(tǒng)健康檢查 對系統(tǒng)的配置及運(yùn)作框架提出建議,以幫助您得到一個(gè)更堅(jiān)強(qiáng)可靠的運(yùn)作環(huán)境 降低系統(tǒng)潛在的風(fēng)險(xiǎn),包括數(shù)據(jù)丟失、安全漏洞、系統(tǒng)崩潰、性能降低及資源緊張 檢查并分析系統(tǒng)日志及跟蹤文件,發(fā)現(xiàn)并排除數(shù)據(jù)庫系統(tǒng)錯誤隱患 檢查數(shù)據(jù)庫系統(tǒng)是否需要應(yīng)用最新的補(bǔ)丁集 檢查數(shù)據(jù)庫空間的使用情況
序號 服務(wù)模塊 內(nèi)容描述 提供方 協(xié)助進(jìn)行數(shù)據(jù)庫空間的規(guī)劃管理 檢查數(shù)據(jù)庫備份的完整性 監(jiān)控?cái)?shù)據(jù)庫性能 確認(rèn)系統(tǒng)的資源需求 明確您系統(tǒng)的能力及不足 優(yōu)化 Oracle Server 的表現(xiàn) 通過改善系統(tǒng)環(huán)境的穩(wěn)定性來降低潛在的系統(tǒng)宕機(jī)時(shí)間 4 Oracle 數(shù)據(jù)庫產(chǎn)品 性能調(diào)優(yōu) 分析用戶的應(yīng)用類型和用戶行為 評價(jià)并修改 ORACLE 數(shù)據(jù)庫的參數(shù)設(shè)置 評價(jià)并調(diào)整 ORACLE 數(shù)據(jù)庫的數(shù)據(jù)分布 評價(jià)應(yīng)用對硬件和系統(tǒng)的使用情況,并提出建議 利用先進(jìn)的性能調(diào)整工具實(shí)施數(shù)據(jù)庫的性能調(diào)整 培訓(xùn)用戶有關(guān)性能調(diào)整的概念 提供用戶完整的性能調(diào)整報(bào)告和解決方法
1.6 中間件運(yùn)維服務(wù) 中間件管理是指對 BEA Weblogic、MQ 等中間件的日常維護(hù)管理和監(jiān)控工作,提高對中間件平臺事件的分析解決能力,確保中間件平臺持續(xù)穩(wěn)定運(yùn)行。中間件監(jiān)控指標(biāo)包括配置信息管理、故障監(jiān)控、性能監(jiān)控。
? 執(zhí)行線程:監(jiān)控 WebLogic 配置執(zhí)行線程的空閑數(shù)量。
? JVM 內(nèi)存:JVM 內(nèi)存曲線正常,能夠及時(shí)的進(jìn)行內(nèi)存空間回收。
? JDBC 連接池:連接池的初始容量和最大容量應(yīng)該設(shè)置為相等,并且至少等于執(zhí)行線程的數(shù)量,以避免在運(yùn)行過程中創(chuàng)建數(shù)據(jù)庫連接所帶來的性能消耗。
? 檢查 WEBLOG 日志文件是否有異常報(bào)錯 ? 如果有 WEBLOG 集群配置,需要檢查集群的配置是否正常。
2 運(yùn)維服務(wù) 流程 建議用戶采用的服務(wù)方式為兩種:一種為技術(shù)人員現(xiàn)場值守,另一種是定期巡檢結(jié)合故障現(xiàn)場服務(wù)。
技術(shù)人員現(xiàn)場值守運(yùn)行維護(hù)服務(wù)的基本操作流程如下圖所示:
IT資源情況匯總故障記錄技術(shù)人員用戶現(xiàn)場值守,日常狀態(tài)監(jiān)控提交給用戶信息系統(tǒng)運(yùn)行維護(hù)報(bào)告和系統(tǒng)運(yùn)行分析報(bào)告記錄到維護(hù)數(shù)據(jù)庫備件更換 故障現(xiàn)場解決主動式信息系統(tǒng)性能偵測故障現(xiàn)場解決系統(tǒng)運(yùn)維日志
定期巡檢結(jié)合故障現(xiàn)場運(yùn)行維護(hù)服務(wù)的基本操作流程如下圖所示:
技術(shù)專家7*24小時(shí)服務(wù)響應(yīng)IT資源情況匯總用戶故障報(bào)修備件更換 技術(shù)人員現(xiàn)場故障解決硬件設(shè)備故障軟件故障故障記錄用戶現(xiàn)場巡檢MICROSOFT CORPORATION用戶簽署故障解決單提交給用戶信息系統(tǒng)運(yùn)行維護(hù)報(bào)告和系統(tǒng)運(yùn)行分析報(bào)告巡檢記錄及系統(tǒng)可用性分析記錄到運(yùn)行維護(hù)數(shù)據(jù)庫用戶
3 服務(wù)管理制度規(guī)范 3.1 服務(wù)時(shí)間 (1) 接收服務(wù)請求和咨詢:
? 在 5*8 小時(shí)工作時(shí)間內(nèi)設(shè)置由專人職守的熱線電話,接聽內(nèi)部的服務(wù)請求,并記錄服務(wù)臺事件處理結(jié)果。
(2) 在非工作時(shí)間設(shè)置有專人 7*24 小時(shí)接聽的移動電話熱線,用于解決內(nèi)部的技術(shù)問題以及接聽 7*24 小時(shí)機(jī)房監(jiān)控人員的機(jī)房突發(fā)情況匯報(bào)。
(3) 服務(wù)響應(yīng)時(shí)間:
故障級別
響應(yīng)時(shí)間
故障解決時(shí)間
I I 級:屬于緊急問題;其具體現(xiàn)象為:系統(tǒng)崩潰導(dǎo)致業(yè)務(wù)停止、數(shù)據(jù)丟失。
30 分鐘,2 小時(shí)內(nèi)提交故障處理方案 12 小時(shí)以內(nèi) I II 級:屬于嚴(yán)重問題;其具體現(xiàn)象為:出現(xiàn)部分部件失效、系統(tǒng)性能下降但能正常運(yùn)行,不影響正常業(yè)務(wù)運(yùn)作。
30 分鐘,2 小時(shí)內(nèi)提交故障處理方案 24 小時(shí)以內(nèi) I III 級:屬于較嚴(yán)重問題;其具體現(xiàn)象為:出現(xiàn)系統(tǒng)報(bào)錯或警告,但業(yè)務(wù)系統(tǒng)能繼續(xù)運(yùn)行且性能不受影響。
30 分鐘,2 小時(shí)內(nèi)提交故障處理方案 48 小時(shí)以內(nèi) V IV 級:屬于普通問題;其具體現(xiàn)象為:系統(tǒng)技術(shù)功能、安裝或配置咨詢,或其他顯然不影響業(yè)務(wù)的預(yù)約服務(wù)。
30 分鐘,2 小時(shí)內(nèi)提交故障處理方案 5 天內(nèi) ? 技術(shù)支持人員在解決故障時(shí),會最大限度保護(hù)好數(shù)據(jù),做好故障恢復(fù)的文檔,力爭恢復(fù)到故障點(diǎn)前的業(yè)務(wù)狀態(tài)。對于“系統(tǒng)癱瘓,業(yè)務(wù)系統(tǒng)不能運(yùn)轉(zhuǎn)”的故障級別,如果不能于 12 小時(shí)內(nèi)解決故障,將在 16 小時(shí)內(nèi)提出應(yīng)急方案,確保業(yè)務(wù)系統(tǒng)的運(yùn)行。故障解決后 24 小時(shí)內(nèi),提交故障處理報(bào)告。說明故障種類、故障原因、故障解決中使用的方法及故障損失等情況。
3.2 行為規(guī)范 (1) 遵守用戶的各項(xiàng)規(guī)章制度,嚴(yán)格按照用戶相應(yīng)的規(guī)章制度辦事。
(2) 與用戶運(yùn)行維護(hù)體系其他部門和環(huán)節(jié)協(xié)同工作,密切配合,共同開展技術(shù)支持工作。
(3) 出現(xiàn)疑難技術(shù)、業(yè)務(wù)問題和重大緊急情況時(shí),及時(shí)向負(fù)責(zé)人報(bào)告。
(4) 現(xiàn)場技術(shù)支持時(shí)要精神飽滿,穿著得體,談吐文明,舉止莊重。接聽電話時(shí)要文明禮貌,語言清晰明了,語氣和善。
(5) 遵守保密原則。對被支持單位的網(wǎng)絡(luò)、主機(jī)、系統(tǒng)軟件、應(yīng)用軟件等的密碼、核心參數(shù)、業(yè)務(wù)數(shù)據(jù)等負(fù)有保密責(zé)任,不得隨意復(fù)制和傳播。
3.3 現(xiàn)場服務(wù)支持規(guī)范 運(yùn)維服務(wù)人員要做到耐心、細(xì)心、熱心的服務(wù)。工作要做到事事有記錄、事事有反饋、重大問題及時(shí)匯報(bào)。嚴(yán)格遵守工作作息時(shí)間,嚴(yán)格按照服務(wù)工作流程操作。
(1) 現(xiàn)場支持工程師應(yīng)著裝整潔、言行禮貌大方,技術(shù)專業(yè),操作熟練、嚴(yán)謹(jǐn)、規(guī)范;現(xiàn)場支持時(shí)必須遵守用戶單位的相關(guān)規(guī)章制度。
(2) 現(xiàn)場支持工程師在進(jìn)行現(xiàn)場支持工作時(shí)必須在保證數(shù)據(jù)和系統(tǒng)安全的前提下開展工作。
(3) 現(xiàn)場支持時(shí)出現(xiàn)暫時(shí)無法解決的故障或其他新的故障時(shí),應(yīng)告知用戶并及時(shí)上報(bào)負(fù)責(zé)人,尋找其他解決途徑。
(4) 故障解決后,現(xiàn)場支持工程師要詳細(xì)記錄問題的發(fā)生時(shí)間、地點(diǎn)、提出人和問題描述,并形成書面文檔,必要時(shí)應(yīng)向用戶介紹故障出現(xiàn)的原因及預(yù)防方法和解決技巧。
3.4 問題記錄規(guī)范 根據(jù)使用人員提出問題的類別,將問題分為咨詢類問題和系統(tǒng)缺陷類問題二類:咨詢類問題是指通過服務(wù)熱線或現(xiàn)場解疑等方式能夠當(dāng)場解決用戶提出的問題,具有問題解答直接、快速和實(shí)時(shí)的特點(diǎn),該問題到現(xiàn)場支持人員處即可中止,對于該類問題的記錄可使用咨詢類問題記錄模版進(jìn)行記錄。系統(tǒng)缺陷類問題是指使用人員提出的問題涉及到系統(tǒng)相應(yīng)環(huán)節(jié)的確認(rèn)修改,需要經(jīng)過逐級提交、診斷、確認(rèn)、處理和回復(fù)等環(huán)節(jié),處理解決需要項(xiàng)目組的分析確認(rèn),問題有解決方案后,將解決方案反饋給用戶。具體提交流程如下:
(1) 問題提交。應(yīng)用信息系統(tǒng)的用戶發(fā)現(xiàn)屬于系統(tǒng)缺陷類的問題時(shí),填寫系統(tǒng)缺陷類問題提交單,提交服務(wù)支持中心。
(2) 問題分析。服務(wù)中心接到用戶提交的問題單,要組織相應(yīng)人員對問題單中描述的問題進(jìn)行分析研判,確定問題的類型(技術(shù)問題、業(yè)務(wù)問題或者操作問題)。屬于技術(shù)問題,提交服務(wù)中心技術(shù)人員對存在的問題提出具體的處理意見和建議;屬于業(yè)務(wù)問題,提交服務(wù)中心業(yè)務(wù)人員進(jìn)行處理;屬于操作問題,可安排相關(guān)人員對問題提出人進(jìn)行解釋,并將系統(tǒng)缺陷類問題提交單轉(zhuǎn)為系統(tǒng)咨詢類問題提交單。
(3) 問題確認(rèn)、解決。服務(wù)中心的技術(shù)人員和業(yè)務(wù)人員收到系統(tǒng)缺陷類問題提交單后,對提交的問題進(jìn)行歸類匯總和分析、確認(rèn)。可以解決的,明確問題解決的具體處理建議和措施,經(jīng)主管領(lǐng)導(dǎo)簽字同意后,交實(shí)施人員進(jìn)行解決方案的實(shí)施。服務(wù)人員確認(rèn)是否解決,并將解決方法附在系統(tǒng)缺陷類問題提交單上反饋給問題提出人員。
(4) 問題上報(bào)。服務(wù)人員收到經(jīng)業(yè)務(wù)或技術(shù)人員確認(rèn)的系統(tǒng)缺陷類問題提交單后,上報(bào)服務(wù)中心。
(5) 問題回復(fù)。服務(wù)中心根據(jù)提交問題的進(jìn)行分析,制定解決方案并進(jìn)行實(shí)施的解決,同時(shí)做好變更記錄。將解決方案匯總后及時(shí)向問題提交單位或問題交辦單位作出回復(fù),并將分析過程和問題產(chǎn)生原因一并提交。
4 應(yīng)急服務(wù)響應(yīng)措施 針對項(xiàng)目制定了詳盡的設(shè)計(jì)、應(yīng)急處理預(yù)案,整個(gè)流程嚴(yán)謹(jǐn)而有序。但是,在服務(wù)維護(hù)過程中,意外情況將難以完全避免。下面,我們將對項(xiàng)目實(shí)施的突發(fā)風(fēng)險(xiǎn)進(jìn)行詳細(xì)分析,并且針對各類突發(fā)事件,設(shè)計(jì)了相應(yīng)的預(yù)防與解決措施,同時(shí)提供了完整的應(yīng)急處理流程。
4.1 應(yīng)急基本流程 出現(xiàn)突發(fā)情況報(bào)項(xiàng)目經(jīng)理項(xiàng)目經(jīng)理協(xié)調(diào)、處理結(jié)束問題報(bào)告單采取措施避免類似事件發(fā)生處理記錄情況通報(bào)單 維護(hù)服務(wù)應(yīng)急處理流程 4.2 預(yù)防措施 針對上門服務(wù)過程中可能遇到的各種各樣的風(fēng)險(xiǎn),針對一些可能出現(xiàn)的情況,制定了一系列預(yù)防處理措施,舉例如下:
類型 事件 預(yù)防措施 處理 應(yīng)用軟件 無法啟動軟件可執(zhí)行文件 上門人員提前準(zhǔn)備好各類需維護(hù)軟件安裝程序 將應(yīng)用軟件數(shù)據(jù)文件備份后,重新安裝 軟件打開過程中或運(yùn)行中異常錯誤關(guān)閉 上門人員準(zhǔn)備好安裝程序,操作系統(tǒng)優(yōu)化和修補(bǔ)軟件,查殺病毒軟件 判斷出錯原因,備份數(shù)據(jù),采取相關(guān)修復(fù)措施 操作系統(tǒng) 使用者本機(jī)操作系統(tǒng)異;蛳到y(tǒng)資源占用嚴(yán)重 準(zhǔn)備好系統(tǒng)檢查程序及修補(bǔ)程序,以及查殺病毒告知使用者錯誤原因可能類型,提出解決方案,
類型 事件 預(yù)防措施 處理 軟件 經(jīng)使用者認(rèn)可后采取相應(yīng)措施 B/S 結(jié)構(gòu)系統(tǒng),IE 瀏覽器異;驘o法下載控件 準(zhǔn)備流氓軟件清理程序、修復(fù)瀏覽器軟件、查殺病毒軟件 檢查 IE 瀏覽器選項(xiàng)設(shè)置,分析原因進(jìn)行修復(fù) 網(wǎng)絡(luò)或服務(wù)器 B/S 結(jié)構(gòu)系統(tǒng)網(wǎng)絡(luò)流量異;蚍⻊(wù)器登錄異常 判斷服務(wù)器是否異常,否則準(zhǔn)備殺毒軟件 檢查網(wǎng)絡(luò)流量,流量異常小則報(bào)修網(wǎng)絡(luò)服務(wù)商,流量異常大則查殺病毒
4.3 突發(fā)事件應(yīng)急策略 系統(tǒng)運(yùn)維應(yīng)急方案是對中斷或嚴(yán)重影響業(yè)務(wù)的故障,如宕機(jī)、數(shù)據(jù)丟失、業(yè)務(wù)中斷等,進(jìn)行快速響應(yīng)和處理,在最短時(shí)間內(nèi)恢復(fù)業(yè)務(wù)系統(tǒng),將損失降到最低。在系統(tǒng)維護(hù)過程中,突發(fā)事件的出現(xiàn)將是很難完全避免的,針對這種情況,設(shè)計(jì)了完善的突發(fā)事件應(yīng)急策略。
系統(tǒng)巡檢人員要定期規(guī)范檢查各硬件設(shè)備的運(yùn)轉(zhuǎn)情況和應(yīng)用軟件運(yùn)行情況,同時(shí)做好日常的數(shù)據(jù)增量備份和定期全備份。對發(fā)現(xiàn)的問題在報(bào)各級負(fù)責(zé)人的同時(shí),要協(xié)調(diào)相關(guān)資源分析問題根源,確定解決方案和臨時(shí)解決措施,避免造成更大的影響。問題得到穩(wěn)定或徹底解決后,要形成問題匯報(bào),避免以后類似重大緊急情況的發(fā)生。
對發(fā)現(xiàn)的問題在報(bào)負(fù)責(zé)人的同時(shí),要協(xié)調(diào)相關(guān)資源分析問題根源,確定解決方案和臨時(shí)解決措施,避免造成更大的影響。問題得到穩(wěn)定或徹底解決后,要形成問題匯報(bào),避免以后類似重大緊急情況的發(fā)生。
當(dāng)獲悉出現(xiàn)突發(fā)事件時(shí),技術(shù)支持人員可以立即從知識庫中獲取相應(yīng)的應(yīng)急策略,并綜合用戶方的具體情況,給出相關(guān)解決方案,然后在第一時(shí)間以電話、郵件支持或現(xiàn)場服務(wù)的方式幫助用戶解決問題,盡最大努力減小突發(fā)事件對用戶日常應(yīng)用的影響。
緊急情況 預(yù)防措施 應(yīng)急策略 硬件損壞 項(xiàng)目單位操作用電腦硬件損壞 在磁盤數(shù)據(jù)未丟失情況下,保證數(shù)據(jù)安全性,建議項(xiàng)目單位替換相關(guān)硬件。
操作失誤 加強(qiáng)培訓(xùn)力度,掌握培訓(xùn)效果,檢驗(yàn)操作人員操作水準(zhǔn),提示注意事項(xiàng)。
操作失誤未造成即成結(jié)果或數(shù)據(jù)未丟失情況下,保障數(shù)據(jù)安全,反之,協(xié)調(diào)相關(guān)部門,進(jìn)行補(bǔ)救。對操作人員強(qiáng)調(diào)注意事項(xiàng) 配置丟失 培訓(xùn)時(shí)強(qiáng)調(diào)使用前配置方法和步驟,并特別提示需在使用前按要求操作 派出上門維護(hù)、培訓(xùn)人員重新配置,并耐心講解。
數(shù)據(jù)丟失 培訓(xùn)時(shí)強(qiáng)調(diào)使用過程中注意定期備份重要數(shù)據(jù),日常維護(hù)過程中,上門服務(wù)人員實(shí)時(shí)備份數(shù)據(jù)并告知用戶 協(xié)調(diào)有關(guān)部門,進(jìn)行補(bǔ)救,無法補(bǔ)救,提交報(bào)告說明原因。
突發(fā)事件應(yīng)急策略服務(wù)流程圖如下:
技術(shù)故障客戶服務(wù)中心專職服務(wù)人員項(xiàng)目單位電話、傳真、 郵件等方式客戶服務(wù)中心技術(shù)人員診斷報(bào)告判斷故障類型配置問題線路問題操作問題軟件問題設(shè)備問題聯(lián)系相關(guān)線路提供商提供正確的操作建議采取相關(guān)維護(hù)措施核實(shí)配置內(nèi)容,提供恢復(fù)手段轉(zhuǎn)入設(shè)備保修流程派出技術(shù)人員現(xiàn)場診斷故障核實(shí)技術(shù)故障現(xiàn)象問題解決否其他問題 提供相應(yīng)的應(yīng)急策略向項(xiàng)目單位提供有關(guān)故障的解決的詳細(xì)說明是派出資深技術(shù)人員或書面報(bào)告項(xiàng)目單位否遠(yuǎn)程或現(xiàn)場協(xié)助故障解決方法報(bào)告
相關(guān)熱詞搜索:信息系統(tǒng) 方案
熱點(diǎn)文章閱讀