[信息化測(cè)評(píng)可視化研究]數(shù)據(jù)可視化測(cè)評(píng)原則
發(fā)布時(shí)間:2020-03-07 來源: 歷史回眸 點(diǎn)擊:
[摘 要]用信息可視化方法對(duì)信息化測(cè)評(píng)進(jìn)行研究。根據(jù)信息可視化流程,利用C#.NET開發(fā)工具,開發(fā)出信息化測(cè)評(píng)可視化系統(tǒng)。對(duì)此系統(tǒng)的特點(diǎn)進(jìn)行說明,給出系統(tǒng)開發(fā)的關(guān)鍵步驟。指出如何利用此系統(tǒng)發(fā)現(xiàn)信息以及這些信息對(duì)政府信息化問題決策制定的影響。
[關(guān)鍵詞]信息可視化 信息可視化流程 平行坐標(biāo)系 信息化測(cè)評(píng) 多維信息
[分類號(hào)]G350.7
可視化的目的是洞察數(shù)據(jù),發(fā)現(xiàn)信息、做出決策或解釋數(shù)據(jù),本文用信息可視化方法,對(duì)信息化測(cè)評(píng)進(jìn)行了研究,這是研究信息化測(cè)評(píng)的新視角。根據(jù)信息可視化流程,筆者利用C#.NET開發(fā)工具,開發(fā)出了信息化測(cè)評(píng)可視化系統(tǒng)。
1 信息可視化流程
信息可視化流程是將信息轉(zhuǎn)換為能夠與用戶交互的可視形式的計(jì)算過程。具體步驟,如圖1所示。圖1給出的流程模式是文獻(xiàn)中給出的流程模式的改進(jìn),雖然文獻(xiàn)中的流程模式流傳較廣,在我國學(xué)術(shù)界也有介紹,筆者更欣賞文獻(xiàn)中的模式圖1。
下面對(duì)圖1中的步驟做一些說明:
第1步,將原始信息轉(zhuǎn)換為組織良好的規(guī)范的數(shù)據(jù)形式,這種形式通常構(gòu)成包含數(shù)據(jù)實(shí)體的數(shù)據(jù)集,每個(gè)數(shù)據(jù)實(shí)體具有多個(gè)屬性值。根據(jù)需要,各種數(shù)據(jù)處理步驟(如:數(shù)據(jù)挖掘)可用于處理數(shù)據(jù),導(dǎo)出數(shù)據(jù)往往對(duì)于洞察結(jié)果有幫助。
第2步,將數(shù)據(jù)集映射為可視形式,是可視化過程的主要步驟,可視形式包含對(duì)應(yīng)于數(shù)據(jù)集實(shí)體的標(biāo)記(glyphs)。
第3步,將可視形式嵌入到視圖,視圖顯示在屏幕上,并提供各種視圖變換,如:導(dǎo)航。視圖通過人的視覺系統(tǒng)呈現(xiàn)給用戶。
第4步,用戶能夠與上述任何一步進(jìn)行交互,以改變可視化結(jié)果并做進(jìn)一步解釋。
上述第2步中的可視映射是可視化的核心,應(yīng)小心設(shè)計(jì)。此映射的作用是人機(jī)通訊,通訊的媒介是信息的可視表示。通過某函數(shù)F,數(shù)據(jù)集被映射為可視形式,此函數(shù)將數(shù)據(jù)集作為輸入,將可視表示作為輸出。當(dāng)可視表示傳遞給用戶時(shí),他們必須能從認(rèn)知上對(duì)可視映射求逆,以從可視表示解碼信息。
2 信息化指標(biāo)體系
中國信息化指標(biāo)體系由國家信息化測(cè)評(píng)中心發(fā)布,這套指標(biāo)體系設(shè)置了6個(gè)大類,共25個(gè)指標(biāo)。該體系主要用于國家信息化發(fā)展水平地區(qū)間橫向比較,并在此基礎(chǔ)上拓展到縱向比較。指標(biāo)的數(shù)據(jù)絕大部分在現(xiàn)有的統(tǒng)計(jì)數(shù)據(jù)中可以獲得,個(gè)別沒有的,做特定調(diào)查也比較容易獲得,基本上可以反映一個(gè)國家、地區(qū)或部門的信息化水平與發(fā)展態(tài)勢(shì)。具體指標(biāo)如表1所示:
3 信息化測(cè)評(píng)可視化
信息化指標(biāo)原始信息是25維,由于缺少4維數(shù)據(jù),可認(rèn)為是21維,我們采用多維信息可視化的平行坐標(biāo)系法,對(duì)其進(jìn)行可視化研究。
3.1平行坐標(biāo)系法
平行坐標(biāo)系法是多維信息可視化的有效方法,此方法將多維信息,映射到二維平面,且沒有信息丟失。
笛卡兒坐標(biāo)系使用垂直坐標(biāo)軸表示2維與3維數(shù)據(jù),垂直坐標(biāo)軸表示的維數(shù)有限,對(duì)多維信息的表示基本無能為力,因此,人們想到使用平行坐標(biāo)系來對(duì)多維信息進(jìn)行可視化。平行坐標(biāo)系中的坐標(biāo)軸是平面上的一組平行的豎直直線,多維信息可表示為該坐標(biāo)系中的一條折線,折線連接了多維信息各分量在各自坐標(biāo)軸上的對(duì)應(yīng)點(diǎn)。使用平行坐標(biāo)系進(jìn)行可視化沒有信息丟失,并有下面的性質(zhì):
?表示復(fù)雜度低。由于坐標(biāo)軸的個(gè)數(shù)N等于維數(shù),復(fù)雜度為O(N)。
?對(duì)于N沒有限制。
?每個(gè)分量被平等對(duì)待。
?展示的對(duì)象在射影變換(比如:旋轉(zhuǎn)、平移、縮放、透視)下能夠被識(shí)別。
?圖中的特征可以容易地/直觀地被轉(zhuǎn)換為其代表的N維對(duì)象的特征信息。
?平行坐標(biāo)系法基于嚴(yán)格的數(shù)學(xué)與算法結(jié)果。
平行坐標(biāo)系將多維信息關(guān)系轉(zhuǎn)變?yōu)?D模式,這很適用于可視數(shù)據(jù)挖掘。
3.2信息化測(cè)評(píng)可視化系統(tǒng)
在國家信息化測(cè)評(píng)中心的官方網(wǎng)站上,能找到中國各地區(qū)信息化指標(biāo)原始數(shù)據(jù)。在這些數(shù)據(jù)中1998年的數(shù)據(jù)最完整,本文正是用1998年的數(shù)據(jù)進(jìn)行可視化研究的。筆者根據(jù)信息可視化流程,使用C#.NET開發(fā)工具,開發(fā)出了信息化測(cè)評(píng)可視化系統(tǒng)。
國家信息化測(cè)評(píng)中心公布的1998年信息化指標(biāo)原始數(shù)據(jù)是Excel格式,為了更好地進(jìn)行可視化研究,也為了數(shù)據(jù)管理的方便,首先將這些數(shù)據(jù)轉(zhuǎn)換成了Access數(shù)據(jù)庫格式,這就是本系統(tǒng)的數(shù)據(jù)集。數(shù)據(jù)集中的數(shù)據(jù)實(shí)體是某年、某地區(qū)的信息化指標(biāo),選定的數(shù)據(jù)實(shí)體對(duì)應(yīng)平行坐標(biāo)系中的一條折線(標(biāo)記),折線連接了信息各分量在各自坐標(biāo)軸上的對(duì)應(yīng)點(diǎn),這就是流程中的可視映射F。
圖2是1998年全部數(shù)據(jù)的對(duì)應(yīng)結(jié)果,圖中豎線共21條,是平行坐標(biāo)系的坐標(biāo)軸,它們與信息化指標(biāo)相對(duì)應(yīng)。坐標(biāo)軸兩端的數(shù)字是對(duì)應(yīng)指標(biāo)的最大值(上端)與最小值(下端),它們是由系統(tǒng)動(dòng)態(tài)生成的,即通過程序比較數(shù)據(jù)集的各維數(shù)據(jù)得到。坐標(biāo)軸下方有各坐標(biāo)軸的名字,就是其對(duì)應(yīng)的信息化指標(biāo)。由于各個(gè)指標(biāo)的值均非負(fù),各個(gè)坐標(biāo)軸上的坐標(biāo)值從o開始,在其最下方。
圖中的坐標(biāo)系與全部折線是流程中的可視形式,整個(gè)圖是流程中的視圖。用戶可多方位與系統(tǒng)交互,下面做一些介紹:
?可以添加、修改數(shù)據(jù)集中的數(shù)據(jù)。比如:增加其它年份的數(shù)據(jù)。
?可以對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行選擇。系統(tǒng)提供以下選擇方式:①對(duì)每個(gè)維(x1-x25、年份)可以進(jìn)行范圍限定,在圖2的左下方有一個(gè)組合框,可在其中選擇一個(gè)參數(shù)(x1x25、年份),然后在隨后的兩個(gè)文本框中給出此參數(shù)的范圍。選出的數(shù)據(jù)可以指定顯示顏色(缺省為藍(lán)色),選出的數(shù)據(jù)將
4 信息發(fā)現(xiàn)
通過對(duì)圖2的觀察,可以對(duì)各個(gè)指標(biāo)分量數(shù)據(jù)的分布情況有一個(gè)整體的把握,比如:x1與x25在其范圍內(nèi)分布較均勻;x13除少數(shù)幾個(gè)外,大部分?jǐn)?shù)據(jù)集中在一起,并取較小的值。我們可以重點(diǎn)觀察這些集中在一起的數(shù)據(jù),限定x13的范圍為2到11可以得到這組數(shù)據(jù)的可視化結(jié)果(見圖3)。從圖3可以看出當(dāng)x13較小時(shí),x12與x3的值也較小并聚集在一起。這說明x13、x12及x3之間也許有一定的聯(lián)系,有可能是因果關(guān)系。這些地區(qū)要提高信息化水平,應(yīng)該重點(diǎn)關(guān)注x13、x12Nx3的提高。其中x1~x25的含義見表1。
可以將某地區(qū)的信息重點(diǎn)顯示,以與其它數(shù)據(jù)進(jìn)行對(duì)比。比如,將北京地區(qū)的信息重點(diǎn)顯示得到圖4,圖中較寬的折線對(duì)應(yīng)北京(考慮到是黑白印刷,沒有使用其他顏色)。從圖4可以看出北京的信息化水平較高,除x1,x7,x8,x25外,其它指標(biāo)均名列前茅,許多指標(biāo)遙遙領(lǐng)先。北京地區(qū)要進(jìn)一步提高信息化水平,工作的重點(diǎn)可以從提高x1,x7,x8,x25入手。
5 結(jié) 語
本文詳細(xì)探討了信息測(cè)評(píng)可視化系統(tǒng)的建立,可視化是研究信息化測(cè)評(píng)的全新手段。從上面的探討我們知道,通過可視化可以清楚地把握信息化測(cè)評(píng)數(shù)據(jù),能夠比較容易地發(fā)現(xiàn)數(shù)據(jù)中隱含的規(guī)律,這正是信息可視化的作用。對(duì)本系統(tǒng)進(jìn)行更加細(xì)致的使用,還可以發(fā)現(xiàn)更多隱含在信息化測(cè)評(píng)信息中的規(guī)律,得出更多結(jié)論?梢赃M(jìn)一步完善本信息化測(cè)評(píng)可視化系統(tǒng),進(jìn)而獲得更多的發(fā)現(xiàn)。比如可以將不同年代的數(shù)據(jù)添加到系統(tǒng)中,以考察信息化測(cè)評(píng)數(shù)據(jù)隨年代的變化情況等。還可以與信息化測(cè)評(píng)專家共同探討與研究,進(jìn)而完善系統(tǒng),以得出更多、更確切與更深入的結(jié)論。一般說來,可視化系統(tǒng)是為領(lǐng)域?qū)<医⒌,系統(tǒng)的使用可以促進(jìn)專家們?cè)诟髯灶I(lǐng)域的研究。
相關(guān)熱詞搜索:可視化 測(cè)評(píng) 信息化 信息化測(cè)評(píng)可視化研究 信息化研究 信息化作戰(zhàn)研究
熱點(diǎn)文章閱讀