政務(wù)服務(wù)信息技術(shù)崗位做什么 [論新信息技術(shù)對政務(wù)革新的作用]
發(fā)布時(shí)間:2020-02-16 來源: 短文摘抄 點(diǎn)擊:
摘要:信息技術(shù)越來越多地應(yīng)用于社會多種領(lǐng)域,政務(wù)處理當(dāng)然也不例外。本文討論了政務(wù)處理方法的歷程,重點(diǎn)突出了新的信息技術(shù)對政務(wù)的革新作用。最后以檢察院為例提出具體應(yīng)用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的有效方法,輔助政府獲得潛在的知識信息。
關(guān)鍵詞:信息技術(shù);數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;政務(wù)
中圖分類號:TP399 文獻(xiàn)標(biāo)識碼:A
在信息時(shí)代,信息技術(shù)的快速發(fā)展對社會各個(gè)領(lǐng)域都產(chǎn)生了一定的影響,在電子商務(wù)中反映尤為突出。電子政務(wù)的出現(xiàn)相對較晚,但據(jù)國外學(xué)者研究表明大約80%以上的重要信息資源掌握在政府手中,所以許多國家都將電子政務(wù)作為本國在信息技術(shù)應(yīng)用領(lǐng)域的首要任務(wù)。
1 政務(wù)狀況分析
政府不僅是處理人民群眾日常事務(wù)的單位,它更重要的作用體現(xiàn)在可以反映群眾的多數(shù)意見和分析社會大范圍的特征,并以此幫助人民群眾和社會向更好的方向發(fā)展。政府對這些事務(wù)的處理到目前為止經(jīng)歷了人工和計(jì)算機(jī)處理的兩大階段。
。ㄒ唬┤斯ぬ幚黼A段
為了反映較大范圍人民群眾的整體特征,政府經(jīng)常要付出龐大的人力和物力收集大量數(shù)據(jù)。這個(gè)數(shù)據(jù)的收集通常要經(jīng)歷一個(gè)較長的時(shí)間,間隔一段時(shí)間還必須重復(fù)執(zhí)行。比如犯罪規(guī)律調(diào)查、經(jīng)濟(jì)普查、群眾意向調(diào)查等。然而,分析收集來的海量數(shù)據(jù)更是政府頭疼的一件事。
還沒有出現(xiàn)計(jì)算機(jī)前,光靠人工來處理數(shù)據(jù)有時(shí)還會面臨這樣的窘境:上一期的數(shù)據(jù)結(jié)果還沒分析出來,下一期的數(shù)據(jù)收集又要開始了,因此整個(gè)數(shù)據(jù)收集和分析工作變得沒有任何意義。另外,有些數(shù)據(jù)需要間隔一段時(shí)間重新收集,然后分析短期和長期的數(shù)據(jù)。比如經(jīng)濟(jì)普查,若政府制定每5年一次經(jīng)濟(jì)普查,則每5年政府就可以做一次短期經(jīng)濟(jì)狀況分析。但是政府不僅只要知道近5年來的經(jīng)濟(jì)狀況,還需知道近10年、近20年、50年甚至更長時(shí)間的經(jīng)濟(jì)發(fā)展?fàn)顩r,那么光靠人工去翻閱以前的數(shù)據(jù)就是件很困難的工作了。所以人工處理數(shù)據(jù)階段,有許多政務(wù)受到很大的限制。
。ǘ┯(jì)算機(jī)處理階段
自計(jì)算機(jī)出現(xiàn)后,許多領(lǐng)域的工作發(fā)生了翻天覆地的變化,政務(wù)處理同樣也不會忽略如此有效的手段。隨著計(jì)算機(jī)在各政府部分的使用,逐漸出現(xiàn)了“電子政務(wù)(Electronic Government,即EG)”。20世紀(jì)80年代以來,我國一直關(guān)注電子政務(wù),2001年電子政務(wù)被列入國家“十五”發(fā)展規(guī)劃。電子政務(wù)的發(fā)展大致經(jīng)歷了以下三個(gè)階段:面向數(shù)據(jù)處理的第一代電子政務(wù)、面向信息處理的第二代電子政務(wù)、面向知識處理的第三代電子政務(wù)。在前兩個(gè)階段中,許多政務(wù)工作確實(shí)提高了效率,但是政府海量數(shù)據(jù)中隱含的價(jià)值仍不能被有效發(fā)掘。正如在一大座金山中,獲取更有價(jià)值的黃金還需更細(xì)致更有效的清理和挖掘。
雖然在前些年,各級政府部門具備了一定的信息化基礎(chǔ)設(shè)施,為構(gòu)建電子政務(wù)系統(tǒng)奠定了基礎(chǔ)。但是,由于缺乏統(tǒng)一的規(guī)劃,各政務(wù)系統(tǒng)成了一個(gè)個(gè)“信息孤島”,也沒有有效的方法從海量數(shù)據(jù)資源中快速挖掘有價(jià)值的知識信息。因此,耗費(fèi)成本收集的數(shù)據(jù)沒有利用就被棄置了,政府也不能夠發(fā)揮出更多潛在的社會價(jià)值。
由于信息技術(shù)的發(fā)展,電子政務(wù)逐漸進(jìn)入第三代發(fā)展中,即有效應(yīng)用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)挖掘知識。
2 DW和DM技術(shù)
數(shù)據(jù)倉庫(DataWare,即DW)是指一個(gè)面向主題的、集成的、非易失的且隨時(shí)間變化的數(shù)據(jù)集合,用來支持管理人員的決策[1]。當(dāng)大量的數(shù)據(jù)被整合在一起后,從用戶分析角度來看,使用這些數(shù)據(jù)的手段是多方面和多層次的。面向知識處理的EG系統(tǒng)應(yīng)能夠自動剔除掉不需要的數(shù)據(jù),按照用戶的要求整合雜亂的數(shù)據(jù)資源,獲取某些可用的屬性。而且,政府的決策通常是經(jīng)過觀察長期社會發(fā)展的狀況而制定的。這其間,需要分析5年、10年,甚至幾十年的大量相關(guān)數(shù)據(jù)資源。因此,政府?dāng)?shù)據(jù)需要被長期、且穩(wěn)定的存儲。在日常收集數(shù)據(jù)和整理數(shù)據(jù)時(shí),利用數(shù)據(jù)倉庫的思想來進(jìn)行有利于我們充分發(fā)揮數(shù)據(jù)挖掘技術(shù)進(jìn)行知識的挖掘。
數(shù)據(jù)挖掘(Data Mining,即DM)是指從大量的數(shù)據(jù)中,抽取出潛在的、有價(jià)值的知識(模型或規(guī)則)的過程。數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識。
首先,我們要確定數(shù)據(jù)挖掘的對象有哪些。數(shù)據(jù)資源可以從多種方面獲得,如系統(tǒng)分析設(shè)計(jì)人員向不同范圍的業(yè)務(wù)對象調(diào)研獲得,或反之業(yè)務(wù)對象主動向系統(tǒng)設(shè)計(jì)人員提出;在互聯(lián)網(wǎng)時(shí)代,從網(wǎng)絡(luò)中獲得數(shù)據(jù)資源更快更多了。
其次,要有效地應(yīng)用數(shù)據(jù)挖掘技術(shù),就要遵循科學(xué)的應(yīng)用流程。一般的挖掘流程是:(1)確定挖掘?qū)ο螅唬?)數(shù)據(jù)準(zhǔn)備;(3)數(shù)據(jù)挖掘,即模式提;(4)結(jié)果分析,即模式評估。[2]
數(shù)據(jù)挖掘功能用于指定數(shù)據(jù)挖掘任務(wù)中要找的模式類型。數(shù)據(jù)挖掘任務(wù)一般可以分為兩類:描述和預(yù)測。描述性挖掘任務(wù)刻畫數(shù)據(jù)庫中數(shù)據(jù)的一般特性。預(yù)測性挖掘任務(wù)在當(dāng)前數(shù)據(jù)上進(jìn)行推斷,以進(jìn)行預(yù)測。數(shù)據(jù)挖掘系統(tǒng)要能夠挖掘多種類型的模式,以適應(yīng)不同的用戶需求或不同的應(yīng)用。數(shù)據(jù)挖掘功能以及它們可以發(fā)現(xiàn)的模式類型包括:class/concept description、Association analysis、Classification and prediction、Clustering、Outlier analysis等。
3 建立面向知識處理的政務(wù)系統(tǒng)
按照上述數(shù)據(jù)挖掘的基本流程,以檢察院為例介紹如何讓EG系統(tǒng)真正實(shí)現(xiàn)面向知識的處理。
。ㄒ唬(gòu)建EG系統(tǒng)的數(shù)據(jù)倉庫
這部分主要分為四個(gè)任務(wù):確定檢察院EG系統(tǒng)中的數(shù)據(jù)源;Web日志數(shù)據(jù)的預(yù)處理;多維Web數(shù)據(jù)模式的建立;應(yīng)用OLAP技術(shù)。
1.確定檢察院EG系統(tǒng)中的數(shù)據(jù)源
檢察院EG系統(tǒng)的數(shù)據(jù)主要從兩個(gè)方面獲得:
(1)調(diào)研和用戶主動提供的數(shù)據(jù)資源;
。2)EG系統(tǒng)從其門戶網(wǎng)站中獲得數(shù)據(jù)源。
在原來的檢察院系統(tǒng)中,大量數(shù)據(jù)資源主要從第一方面獲得。當(dāng)實(shí)施了EG后,政府將從其門戶網(wǎng)站中獲取更多、更豐富的數(shù)據(jù)資源。因?yàn)闄z察院對第一種數(shù)據(jù)來源已形成了較成熟的數(shù)據(jù)庫,只需直接導(dǎo)入數(shù)據(jù)倉庫。那么如何對龐大的Web日志數(shù)據(jù)建立數(shù)據(jù)倉庫呢?
2.Web日志數(shù)據(jù)的預(yù)處理
Web服務(wù)器日志文件中的數(shù)據(jù)稱之為原始數(shù)據(jù),管理員可根據(jù)需要用某些日志字段記錄相關(guān)數(shù)據(jù)。[3]如:用戶的域名或IP地址,用戶的Login ID,訪問日期和時(shí)間,訪問的方法,被訪問頁的文件名和參數(shù)等。對Web日志數(shù)據(jù)的預(yù)處理包括兩步。第一步:清除噪音,即去掉對知識挖掘無關(guān)的數(shù)據(jù)。第二步:轉(zhuǎn)化數(shù)據(jù),即將原始數(shù)據(jù)按照挖掘需求通過重新組織或簡單計(jì)算轉(zhuǎn)換成規(guī)范模式。
3.多維Web數(shù)據(jù)模式的建立
分為三步進(jìn)行。第一步,選取維。多維數(shù)據(jù)便于我們從多個(gè)角度、多個(gè)側(cè)面對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行觀察、分析,以深入了解包含在數(shù)據(jù)中的信息和內(nèi)涵。N維數(shù)據(jù)矩陣用C(A1, A2,……, Am ,count)模式表示,其中A??i代表第i維,i=1,2,……,n, count是變量,反映數(shù)據(jù)的實(shí)際意義。
數(shù)據(jù)單元用r[A1:a1,……,An:an,count]模式表示,即為維Ai選定一個(gè)維成員a??i,i=l,…,n,這些維成員的組合唯一確定了變量count的一個(gè)值。通常,需要了解用戶對門戶網(wǎng)站中文件資源的訪問行為,可以選取用戶維、時(shí)間維、文件維構(gòu)建數(shù)據(jù)矩陣,以形成多維視圖。
第二步,構(gòu)造檢察院門戶網(wǎng)站訪問數(shù)據(jù)的多維視圖。先選取data維(按季度組織)、file維(按文件類型組織)用2-D形式表示用戶對檢察院門戶網(wǎng)站的訪問行為。然后加入第三維location(按用戶所在區(qū)組織),進(jìn)一步構(gòu)建用戶訪問行為的三維視圖。視圖顯示的事實(shí)是visit_count(訪問次數(shù))。
第三步,創(chuàng)建多維數(shù)據(jù)模式。最流行的數(shù)據(jù)倉庫數(shù)據(jù)模型是多維數(shù)據(jù)模型。最常見的模型范例是星型模式。
4.應(yīng)用OLAP技術(shù)
OLAP,即在線聯(lián)機(jī)處理。應(yīng)用OLAP技術(shù)可以很方便地從Web日志數(shù)據(jù)矩陣中作出一些簡單的結(jié)論性分析,如回答一些問題:(1)哪些資源訪問情況最好,哪些最差?(2)用戶的地域分布情況如何?我們可以充分利用多維數(shù)據(jù)模型上的OLAP操作,如下鉆(drill-down)、上卷(roll-up)、切片分析(slice)和切塊分析(dice)等技術(shù)對問題進(jìn)行求解。
(二)挖掘模式的有效應(yīng)用
應(yīng)用數(shù)據(jù)挖掘技術(shù)可以自動發(fā)現(xiàn)用戶的行為特征和系統(tǒng)的訪問模式。
1.?dāng)?shù)據(jù)挖掘技術(shù)應(yīng)用的范圍
雖然現(xiàn)在已有很多地方級政府部門都建立了自己的門戶網(wǎng)站,但公眾只能在這些網(wǎng)站上瀏覽少量的政府職能和部門介紹。這樣的政府門戶網(wǎng)站沒有根本上體現(xiàn)本身應(yīng)有的應(yīng)用價(jià)值。檢察院構(gòu)建其門戶網(wǎng)站,需要向公眾、企業(yè)和其他政府部門提供盡可能多相關(guān)信息和服務(wù)。同時(shí),檢察院通過門戶網(wǎng)站也要有能力獲悉訪問用戶的訪問行為和動機(jī)、趨勢。在服務(wù)器以及瀏覽器日志記錄的數(shù)據(jù)中隱藏著模式信息,結(jié)合網(wǎng)絡(luò)技術(shù)應(yīng)用數(shù)據(jù)挖掘技術(shù)可以自動發(fā)現(xiàn)系統(tǒng)的訪問模式和用戶的行為特征,從而進(jìn)行預(yù)測分析。
2.應(yīng)用挖掘模式提取和分析知識
根據(jù)不同的應(yīng)用要求,在數(shù)據(jù)挖掘模式中選擇合適的方法進(jìn)行計(jì)算,提取有效數(shù)據(jù),得出知識。對于檢察院,可以應(yīng)用聚類方法確定特定用戶的地域分布,從而識別出一些問題:
(1)哪些分區(qū)在一段時(shí)間內(nèi)網(wǎng)上舉報(bào)情況較集中。
。2)網(wǎng)上舉報(bào)較集中的地區(qū)是因?yàn)榘讣l(fā)生頻繁,還是因?yàn)榫W(wǎng)絡(luò)普及范圍廣。
(3)對比網(wǎng)上舉報(bào)和非網(wǎng)上舉報(bào)的用戶群,以輔助政府決策對不同地區(qū)采取不同的情報(bào)收集手段。
關(guān)于新的信息技術(shù)對政務(wù)處理的革新作用,還有許多值得繼續(xù)深入研究的。但是,不論從那個(gè)方向進(jìn)行研究,都必須要以提高政務(wù)處理能力為宗旨,將先進(jìn)的信息技術(shù)有效的應(yīng)用于政務(wù)處理上,讓政府資源發(fā)揮最大的社會價(jià)值。
參考文獻(xiàn)
[1]Colin White. Data Warehousing. Cleaning and Transforming Data [M]. InfoDB,2002.
[2]林宇.數(shù)據(jù)倉庫原理與實(shí)踐[M]. 北京: 人民郵電出版社,2003.
[3]杜國寧, 朱仲英. 基于Web技術(shù)的數(shù)據(jù)挖掘系統(tǒng)研究與設(shè)計(jì)[J]. 微型電腦應(yīng)用,2005, (1).
相關(guān)熱詞搜索:革新 信息技術(shù) 政務(wù) 論新信息技術(shù)對政務(wù)革新的作用 政務(wù)信息的作用 什么是政務(wù)信息工作
熱點(diǎn)文章閱讀