數(shù)字圖書(shū)館網(wǎng)格信息資源組織模式研究:數(shù)字圖書(shū)館的信息資源數(shù)字化
發(fā)布時(shí)間:2020-03-07 來(lái)源: 歷史回眸 點(diǎn)擊:
〔摘要〕從網(wǎng)格資源構(gòu)成的角度,分析比較數(shù)字圖書(shū)館網(wǎng)格信息資源、數(shù)字圖書(shū)館非網(wǎng)格信息資源,通過(guò)對(duì)Digital Library Grid信息資源管理模型的解讀,提出在網(wǎng)格環(huán)境下,數(shù)字圖書(shū)館信息資源管理、信息資源組織的概念模型,并在此基礎(chǔ)上分析、討論網(wǎng)格環(huán)境下DL信息資源發(fā)現(xiàn)、信息資源描述、信息資源命名和信息資源發(fā)布等主要環(huán)節(jié)。
〔關(guān)鍵詞〕網(wǎng)格數(shù)字圖書(shū)館信息資源組織
〔分類號(hào)〕G250.76
Resarch on Digital Library Grid Information Resource Organization Pattern
Bi QiangShen Yong
Management College of Jilin University, Changchun130022
〔Abstract〕From the perspective of grid resources constitution, this paper compares DL grid information resources with DL non-grid information resources. Then it proposes the conceptual model of information resource management and organization for digital library in the grid environment by unscrambling the model of DL grid information resources management, and on the basis of that discusses the main procedures including digital library information resource discovery, information resource description,information resource naming and information resource publishing.
〔Keywords〕griddigital libraryinformation resource organization
1引言
挺進(jìn)網(wǎng)絡(luò)研究領(lǐng)域,已經(jīng)成為國(guó)際和國(guó)內(nèi)信息資源組織管理研究領(lǐng)域的共識(shí)。網(wǎng)格環(huán)境下的數(shù)字圖書(shū)館(Digital Library,以下簡(jiǎn)稱“DL”),以無(wú)所不在的分布式的網(wǎng)絡(luò)和計(jì)算環(huán)境作為技術(shù)支持和應(yīng)用基礎(chǔ),具有對(duì)于海量的、多媒體的信息資源進(jìn)行制作、組織、存儲(chǔ)和發(fā)布的能力,還可以針對(duì)不同需求的用戶群體提供主動(dòng)的、個(gè)性化的終極信息服務(wù)[1]。網(wǎng)格技術(shù)作為DL信息資源(Information Resource,以下簡(jiǎn)稱“IR”)組織模式變革的思想平臺(tái)和技術(shù)支撐,為DL信息資源組織提供實(shí)踐理性化的操作樣式。
2數(shù)字圖書(shū)館網(wǎng)格信息資源
2.1網(wǎng)格信息資源的構(gòu)成
傳統(tǒng)因特網(wǎng)實(shí)現(xiàn)了計(jì)算機(jī)硬件的連通,Web實(shí)現(xiàn)了網(wǎng)頁(yè)的連通,網(wǎng)格將實(shí)現(xiàn)互聯(lián)網(wǎng)上所有資源的連通,包括計(jì)算資源、存儲(chǔ)資源、通信資源、軟件資源、信息資源、知識(shí)資源等[2](見(jiàn)圖1),網(wǎng)格能讓人們透明地使用這些資源[3]。
2.2DL網(wǎng)格信息資源與DL非網(wǎng)格信息資源
DL網(wǎng)格信息資源和DL非網(wǎng)格信息資源的異同如表1所示:
DL的網(wǎng)格信息資源與非網(wǎng)格信息資源的本質(zhì)區(qū)別就是信息資源所處環(huán)境的異構(gòu)。在網(wǎng)格環(huán)境下,DL信息資源管理系統(tǒng)所管理的IR不僅是屬于一個(gè)管理域,而是跨越多個(gè)管理域[6-7]。各個(gè)域中構(gòu)成網(wǎng)格系統(tǒng)的計(jì)算機(jī)在體系結(jié)構(gòu),操作系統(tǒng)、數(shù)據(jù)庫(kù)管理系統(tǒng)及元數(shù)據(jù)模式等多個(gè)方面均存在異構(gòu)。這就造成來(lái)自不同管理域的相似或同類IR的異構(gòu)性。
DL非網(wǎng)格信息資源提供者僅限于本地的DL,DL網(wǎng)格信息資源的提供者既有本地的DL又有異地的各個(gè)IR的所有者。
DL非網(wǎng)格信息資源的組織不需要重新命名,DL網(wǎng)格信息資源的組織必須重新命名。
3網(wǎng)格環(huán)境下DL信息資源組織概念模型
信息資源組織即IR的有序化的活動(dòng):利用一定科學(xué)規(guī)則和方法,通過(guò)對(duì)信息外在特征和內(nèi)容特征的描述和序化,實(shí)現(xiàn)無(wú)序信息流向有序信息流的轉(zhuǎn)換,從而保證用戶對(duì)信息的有效獲取和利用及信息的有效流通和組合。網(wǎng)絡(luò)環(huán)境下,數(shù)字圖書(shū)館IR組織模式如圖2所示:
從圖2可以看出,該模式僅適用于互聯(lián)互通有限容量的IR。但要互聯(lián)互通海量的、分布異構(gòu)的IR,該模式就受到了現(xiàn)有技術(shù)的約束。引入網(wǎng)格技術(shù),應(yīng)用信息網(wǎng)格則能夠?qū)崿F(xiàn)DL組織建設(shè)所需的各種數(shù)字信息資源的互聯(lián)互通。信息網(wǎng)格已成為國(guó)內(nèi)外DL信息組織管理研究領(lǐng)域的共識(shí)。
Digital Library Grid是美國(guó)Andrew W. Mellon 基金會(huì)由Old Dominion大學(xué)DL研究組在其原有的OAI(Open Archives Initiative)系統(tǒng)(即ARC系統(tǒng))研究和實(shí)踐基礎(chǔ)上所提出的項(xiàng)目,圖3是Digital Library Grid信息資源管理模型。
在圖3中,DL的數(shù)字資源分布在DL網(wǎng)格中的數(shù)據(jù)提供者節(jié)點(diǎn)中,采集節(jié)點(diǎn)負(fù)責(zé)對(duì)數(shù)據(jù)提供者節(jié)點(diǎn)的信息資源內(nèi)容進(jìn)行元數(shù)據(jù)采集,然后經(jīng)由元數(shù)據(jù)收集和傳輸服務(wù)機(jī)制,整合由采集節(jié)點(diǎn)獲得的全部元數(shù)據(jù),按照一定的規(guī)則和機(jī)制,對(duì)這些元數(shù)據(jù)進(jìn)行分發(fā),將其分別存儲(chǔ)在各個(gè)檢索服務(wù)器節(jié)點(diǎn)(D1....D3)中,I1…I3負(fù)責(zé)對(duì)D1...D3上的元數(shù)據(jù)進(jìn)行索引管理,可以針對(duì)新增的元數(shù)據(jù)進(jìn)行增加索引,更新D1...D3中儲(chǔ)存的索引。用戶向跨庫(kù)檢索節(jié)點(diǎn)提出檢索請(qǐng)求,跨庫(kù)檢索節(jié)點(diǎn)提供用戶檢索接口,并將收到的請(qǐng)求分發(fā)到D1…D3節(jié)點(diǎn),并執(zhí)行檢索請(qǐng)求,檢索結(jié)果由調(diào)度服務(wù)進(jìn)行排序執(zhí)行,將匹配的信息資源返回給用戶。調(diào)度服務(wù)存儲(chǔ)一個(gè)包含數(shù)據(jù)提供者列表的配置文件,向任務(wù)節(jié)點(diǎn)分配任務(wù),任務(wù)完成后還要記錄節(jié)點(diǎn)和信息資源的參數(shù),為新的任務(wù)分配提供參考。
在網(wǎng)格信息資源管理模式的基礎(chǔ)上,結(jié)合DL的應(yīng)用特點(diǎn),借鑒國(guó)外DL網(wǎng)格項(xiàng)目的經(jīng)驗(yàn),構(gòu)建了網(wǎng)格環(huán)境下DL信息資源管理系統(tǒng)抽象模型。
如圖4[10]所示,虛線所框的部分是網(wǎng)格環(huán)境下DL信息資源組織概念模型。與網(wǎng)絡(luò)環(huán)境下的信息資源組織相比,有以下幾點(diǎn)差異:
●在網(wǎng)絡(luò)環(huán)境下,DL所包含的信息源是已經(jīng)確定的若干個(gè)信息資源數(shù)據(jù)庫(kù);網(wǎng)格環(huán)境下的信息源是可擴(kuò)展的有限多個(gè)信息資源數(shù)據(jù)庫(kù)和信息資源節(jié)點(diǎn)。
●對(duì)于網(wǎng)格環(huán)境下的有限多個(gè)信息資源數(shù)據(jù)庫(kù)和信息資源節(jié)點(diǎn)的增加和擴(kuò)充,除了特定的情況下需要工作人員的參與,大多數(shù)情況下是通過(guò)被動(dòng)發(fā)現(xiàn)信息資源機(jī)制完成的;網(wǎng)絡(luò)環(huán)境下,新的IR數(shù)據(jù)庫(kù)的加入只有依靠人工才能完成。
●在網(wǎng)格環(huán)境下,DL為用戶查找IR除了IR發(fā)現(xiàn)機(jī)制之外,還有IR發(fā)布。
●在網(wǎng)格環(huán)境下,新加入的IR要進(jìn)行重新命名,用戶無(wú)需知道資源的所屬數(shù)據(jù)庫(kù)或節(jié)點(diǎn),就可以下載使用IR;網(wǎng)絡(luò)環(huán)境下,DL系統(tǒng)中IR的名字和在其所屬數(shù)據(jù)庫(kù)中的名字是一樣的,無(wú)需重新命名。
用戶利用網(wǎng)格環(huán)境下DL信息資源管理系統(tǒng)獲取研究所需的IR的過(guò)程,簡(jiǎn)單概括為以下兩個(gè)步驟:
●DL網(wǎng)格的各個(gè)節(jié)點(diǎn)上有類型內(nèi)容各異的IR。首先通過(guò)IR發(fā)現(xiàn)機(jī)制(主動(dòng)發(fā)現(xiàn)和被動(dòng)發(fā)現(xiàn))尋找到DL所需的IR,主動(dòng)發(fā)現(xiàn)是基于用戶的需求進(jìn)行,被動(dòng)發(fā)現(xiàn)是系統(tǒng)在IR提供者提供的IR屬性狀態(tài)中根據(jù)系統(tǒng)需求(潛規(guī)則)選擇合適的IR,并對(duì)IR進(jìn)行描述、索引和命名,然后將索引信息匯總到數(shù)字圖書(shū)館IR索引中心,通過(guò)IR發(fā)布機(jī)制呈現(xiàn)給用戶。
●DL用戶發(fā)出IR請(qǐng)求,IR管理系統(tǒng)將根據(jù)用戶的請(qǐng)求在索引中心內(nèi)查找匹配的IR索引,然后追根溯源,找到IR所在的網(wǎng)格節(jié)點(diǎn);根據(jù)節(jié)點(diǎn)和資源的狀態(tài)信息參數(shù)進(jìn)行IR預(yù)置(IR預(yù)置通常用來(lái)實(shí)現(xiàn)對(duì)IR的保證存取或?qū)Χ鄠(gè)IR的并發(fā)存取,它的作用類似于一個(gè)記錄器,記錄目前所有的用戶需要的IR,確保用戶所需要的IR全部都被安排執(zhí)行傳輸)、狀態(tài)估計(jì)(即依據(jù)IR當(dāng)前的狀態(tài)信息和歷史數(shù)據(jù)庫(kù)、傳送時(shí)間等為任務(wù)調(diào)度提供信息)、任務(wù)調(diào)度(確定任務(wù)執(zhí)行的相關(guān)順序)等一系列環(huán)節(jié),確保將用戶所需求的IR提交給用戶。
3.1信息資源描述
信息資源描述是根據(jù)一定的規(guī)則和標(biāo)準(zhǔn),對(duì)IR的形式特征和部分內(nèi)容特征進(jìn)行描述并給予記錄的過(guò)程[5]。 信息資源描述為IR共享、IR發(fā)現(xiàn)等關(guān)鍵環(huán)節(jié)提供必要的信息。信息資源描述信息把不同的用戶、不同的應(yīng)用、不同的IR聯(lián)系起來(lái)[11]。
在介紹信息資源描述的作用之前,先引入三個(gè)概念:IR請(qǐng)求者:一般情況下就是指用戶,在這里就指DL用戶;IR中介者:網(wǎng)格環(huán)境下DL的IR管理器;IR提供者:IR的所有者,DL本地/遠(yuǎn)程數(shù)據(jù)庫(kù),或網(wǎng)站、個(gè)人。IR描述的作用如圖5所示。
① IR請(qǐng)求者應(yīng)用IR描述機(jī)制來(lái)描述自己所需求的IR,向IR中介者提出需求;② IR提供者通過(guò)IR描述機(jī)制,按照統(tǒng)一的規(guī)范(如DC)提供關(guān)于自身資源的元數(shù)據(jù)給IR中介者;③ IR中介者通過(guò)IR提供者的IR描述信息,判斷是否匹配,將匹配的IR提供給IR請(qǐng)求者。
無(wú)論在網(wǎng)絡(luò)環(huán)境下,還是在網(wǎng)格環(huán)境下,元數(shù)據(jù)都是IR組織的有效工具[12]。元數(shù)據(jù)描述的是關(guān)于數(shù)據(jù)的who, what, when, where, why, and how[13]。在網(wǎng)絡(luò)環(huán)境下,以DC(都柏林核心數(shù)據(jù),Dublin Core)元數(shù)據(jù)為例,DC由15個(gè)元素組成:標(biāo)題、作者、主題、說(shuō)明、出版者、其他責(zé)任者、日期、類型、格式、標(biāo)識(shí)符、來(lái)源、語(yǔ)言、關(guān)聯(lián)、覆蓋范圍、權(quán)限。
在網(wǎng)格環(huán)境下,元數(shù)據(jù)除了上述的15項(xiàng)之外,還要包含距離、區(qū)域、數(shù)量和精確位置[12](見(jiàn)圖6)。本文2.2部分提到,DL網(wǎng)格信息資源提供者不同,所處環(huán)境異構(gòu),因此在對(duì)網(wǎng)格IR進(jìn)行描述時(shí),就必須要對(duì)IR所處的空間位置進(jìn)行必要的描述。在DL網(wǎng)格信息資源組織中的IR描述階段,元數(shù)據(jù)利用HTML、SGML(Standard Generalized Markup Language--標(biāo)準(zhǔn)的通用置標(biāo)語(yǔ)言)等標(biāo)記語(yǔ)言將其嵌入在IR中。在網(wǎng)格IR的整個(gè)生命期內(nèi),元數(shù)據(jù)要隨著IR的狀態(tài)發(fā)生變化而不斷地更新,確保網(wǎng)格系統(tǒng)迅速準(zhǔn)確地查找到所需的IR。
至今為止,還沒(méi)有一種通用的IR描述方法得到廣泛的應(yīng)用,隨著網(wǎng)格技術(shù)的應(yīng)用發(fā)展,IR描述方法將告別“百花齊放”的現(xiàn)象,產(chǎn)生一種通用的IR描述方法和規(guī)范。
3.2信息資源命名
在DL網(wǎng)格系統(tǒng)中,每個(gè)IR對(duì)應(yīng)一個(gè)屬于自己的地址,這個(gè)地址的特點(diǎn)就是便于機(jī)器識(shí)別,但是用戶記憶和使用這個(gè)IR地址都比較困難。用戶訪問(wèn)IR的時(shí)候是通過(guò)一個(gè)中介,來(lái)連接IR的地址,這個(gè)中介就是IR的名字。IR命名,就是給網(wǎng)格中的IR重新取個(gè)名字。IR的舊名字是由IR提供者選定的,在網(wǎng)格中難免會(huì)出現(xiàn)重名現(xiàn)象,如果對(duì)名字為X的IR發(fā)出呼叫,有多個(gè)IR應(yīng)答,就會(huì)導(dǎo)致用戶不知如何選擇自己最終需要的IR。IR的命名和IR本身必須一一對(duì)應(yīng)。另外,命名后的IR也方便用戶使用。我們知道,網(wǎng)絡(luò)上的每個(gè)主機(jī)除了自己的IP之外還有一個(gè)域名,域名便于用戶記憶和使用,例如,www.省略是搜狐網(wǎng)站主機(jī)的域名,但是用戶不需要知道實(shí)際的IP是多少,只要知道域名就可以方便地使用。同理,給網(wǎng)格中的每個(gè)IR都取個(gè)名字,用戶就可以根據(jù)IR的名字方便的訪問(wèn)IR。
IR命名的意義和作用在于[11]:
●IR命名可以把IR進(jìn)一步的抽象,將IR的標(biāo)識(shí)和IR的位置分離開(kāi)來(lái)。
●IR命名機(jī)制可以建立虛擬的空間,擴(kuò)大和縮小用戶空間。
●實(shí)現(xiàn)IR的按名訪問(wèn),方便用戶使用。
DL中網(wǎng)格系統(tǒng)涵蓋的IR數(shù)量巨大,IR命名需要遵循一定的原則。系統(tǒng)可以根據(jù)IR之間的內(nèi)在關(guān)系為IR命名。例如:包含關(guān)系,層次關(guān)系,并列關(guān)系(見(jiàn)圖7)。
A包含A.a、A.b和A.c,所以A和A.a,A和A.b,A和A.c是包含關(guān)系,但是這種情況也滿足層次關(guān)系,所以包含關(guān)系和層次關(guān)系經(jīng)常混合出現(xiàn)。A.a和A.b和A.c是并列關(guān)系。A.a和A.a.x,A.b和A.b.y,A.c和A.c.z是層次關(guān)系。他們之間的層次關(guān)系是單一的,并沒(méi)有混合包含關(guān)系。按照這樣的關(guān)系命名可以有效地避免IR的名字的重復(fù),進(jìn)而有效的幫助網(wǎng)格系統(tǒng)提高任務(wù)作業(yè)完成的效率。IR命名還要規(guī)定命名的字符要求,如同網(wǎng)絡(luò)域名中有英文字母、圓點(diǎn)等規(guī)定字符一樣。例如,規(guī)定IR的名字字符中只能包含英文字母、中文漢字、阿拉伯?dāng)?shù)字、圓點(diǎn)“•”、斜杠線“\”和“/”。那么@、#、$等其它的字符對(duì)于IR命名來(lái)說(shuō)就是非法字符。
3.3信息資源發(fā)現(xiàn)
分為主動(dòng)發(fā)現(xiàn)信息資源和被動(dòng)發(fā)現(xiàn)信息資源。
主動(dòng)發(fā)現(xiàn)信息資源是IR請(qǐng)求者和IR之間進(jìn)行聯(lián)系必不可少的環(huán)節(jié),如果沒(méi)有主動(dòng)發(fā)現(xiàn)機(jī)制,網(wǎng)格環(huán)境下DL的IR數(shù)量巨大,IR請(qǐng)求者就不能確定自己可以使用哪些IR,也就滿足不了請(qǐng)求者獲得IR的需求。如圖8所示,設(shè)定一個(gè)IR描述信息,IR發(fā)現(xiàn)能夠根據(jù)IR描述的信息在DL的網(wǎng)格節(jié)點(diǎn)中查找到與需求匹配的IR并將IR的信息返回給IR請(qǐng)求者,就可以選擇使用自己需要的IR。
被動(dòng)發(fā)現(xiàn)IR機(jī)制運(yùn)作在IR和網(wǎng)格系統(tǒng)之間,可以在網(wǎng)格系統(tǒng)原有IR數(shù)量的基礎(chǔ)上,擴(kuò)展網(wǎng)格資源系統(tǒng)所包含的網(wǎng)格節(jié)點(diǎn)的數(shù)量和范圍。如圖9所示,網(wǎng)格節(jié)點(diǎn)將自己擁有的,卻沒(méi)有被系統(tǒng)收納的IR的描述信息提交給系統(tǒng),系統(tǒng)選擇其中自身需求的IR,對(duì)該資源進(jìn)行描述命名,并將描述信息存入系統(tǒng)數(shù)據(jù)庫(kù),使其成為系統(tǒng)資源的新成員。
用公式F=f(xreq) [11]描述IR發(fā)現(xiàn)機(jī)制更為形象。如表2所示,針對(duì)被動(dòng)發(fā)現(xiàn)機(jī)制或主動(dòng)發(fā)現(xiàn)機(jī)制,公式中元素的含義也是不同的。
網(wǎng)格發(fā)現(xiàn)機(jī)制的優(yōu)劣,直接影響網(wǎng)格的整體性能。
織女星網(wǎng)格是中國(guó)科學(xué)院計(jì)算技術(shù)研究所2001年開(kāi)始研究的項(xiàng)目。織女星網(wǎng)格的資源發(fā)現(xiàn)機(jī)制的體系結(jié)構(gòu)由三個(gè)層次組成,它們自左向右依次為:用戶層、資源路由器層和資源層(見(jiàn)圖10)。
織女星網(wǎng)格的資源發(fā)現(xiàn)屬于主動(dòng)發(fā)現(xiàn)IR機(jī)制,其過(guò)程包括以下5 個(gè)步驟[14]:
第一步:資源信息通過(guò)路由器網(wǎng)絡(luò)進(jìn)行傳播。
第二步:網(wǎng)格用戶向相鄰的資源路由器發(fā)出資源請(qǐng)求。
第三步:資源路由器根據(jù)用戶資源請(qǐng)求尋找匹配資源,同時(shí)完成請(qǐng)求在路由器網(wǎng)絡(luò)內(nèi)的轉(zhuǎn)發(fā)。
第四步:路由器為資源請(qǐng)求尋找一個(gè)能滿足需要的物理資源,找到則完成資源的定位,找不到則認(rèn)為用戶的資源請(qǐng)求不能在本網(wǎng)格中得到滿足。
第五步:路由器將資源發(fā)現(xiàn)的結(jié)果返回給用戶。
主動(dòng)發(fā)現(xiàn)IR機(jī)制是IR和IR請(qǐng)求者之間必要的橋梁,能夠根據(jù)用戶的請(qǐng)求尋找匹配的IR,優(yōu)質(zhì)的完成用戶提交的檢索任務(wù)。被動(dòng)發(fā)現(xiàn)IR機(jī)制是DL網(wǎng)格系統(tǒng)和與未被利用的網(wǎng)格節(jié)點(diǎn)及其資源之間的紐帶,利用該機(jī)制可以挖掘新的IR,納入DL網(wǎng)格系統(tǒng)為用戶所使用。資源發(fā)現(xiàn)機(jī)制的優(yōu)劣,直接影響網(wǎng)格的整體性能。
3.4信息資源發(fā)布
在網(wǎng)格環(huán)境下,DL為用戶查找信息資源除了信息資源發(fā)現(xiàn)機(jī)制之外,還有一種方法就是信息資源發(fā)布。信息資源發(fā)布,是信息資源尋找某個(gè)用戶可以提供給自己一個(gè)匹配的應(yīng)用[10],是從信息資源出發(fā),試圖去發(fā)現(xiàn)能夠利用該信息資源的合適的應(yīng)用。換句話說(shuō),具有某信息資源的終端系統(tǒng)為A,有關(guān)該信息資源的信息為B,信息資源發(fā)布就是把來(lái)自于A的B推(push)到可應(yīng)用該信息資源的節(jié)點(diǎn)[15]。
IR發(fā)布與IR的更新密切相關(guān)。
如果按照批次或者周期性的方法對(duì)IR信息進(jìn)行更新,也稱為定時(shí)更新,IR發(fā)布也就要批次地或者周期性的通過(guò)DL網(wǎng)格進(jìn)行,即定時(shí)發(fā)布。這種方法的好處就是不會(huì)給網(wǎng)格環(huán)境下DLIR管理器帶來(lái)很大的壓力,但是可能導(dǎo)致IR的信息的滯后,也可能影響任務(wù)調(diào)度及用戶應(yīng)用等一系列進(jìn)程。
如果按照在線或者按需的方法對(duì)IR信息進(jìn)行更新,可稱為時(shí)時(shí)更新,也就是說(shuō),只要IR的信息有所變化,就要進(jìn)行一次更新,然后通過(guò)IR發(fā)布,將IR信息從源機(jī)器發(fā)布到DL網(wǎng)格信息資源管理器中,等待匹配的應(yīng)用,即時(shí)時(shí)發(fā)布。這種方法的益處就是IR的信息時(shí)刻保持最新?tīng)顟B(tài),但是這會(huì)給IR管理器帶來(lái)很大的壓力。
兩種方法各有利弊,網(wǎng)格環(huán)境下的DL在應(yīng)用時(shí)可根據(jù)IR信息變化頻率的大小選擇不同的IR發(fā)布方式。如針對(duì)信息狀態(tài)經(jīng)常發(fā)生變化的IR,就應(yīng)該選擇網(wǎng)格IR定時(shí)發(fā)布;針對(duì)信息狀態(tài)較少發(fā)生變化的IR,就可以選擇網(wǎng)格IR時(shí)時(shí)發(fā)布。
根據(jù)IR主體在發(fā)布過(guò)程中的作用不同,可以將IR發(fā)布的機(jī)制分為兩種類型:被動(dòng)發(fā)布和主動(dòng)發(fā)布。
IR的被動(dòng)發(fā)布方式,強(qiáng)調(diào)用戶的主動(dòng)性,而且資源自身缺乏安全控制能力;相比較來(lái)看,IR的主動(dòng)發(fā)布方式,由于強(qiáng)調(diào)了資源自身的主動(dòng)性,可以很容易地實(shí)施對(duì)性能和安全性的控制,從而根據(jù)不同的資源和不同的用戶采用不同的策略,提高資源的利用率和安全性。
綜上所述,在網(wǎng)格環(huán)境下,數(shù)字圖書(shū)館IR組織的概念模型包括4個(gè)步驟:信息資源描述、信息資源命名、信息資源發(fā)現(xiàn)、信息資源發(fā)布。這些步驟在組織管理過(guò)程中無(wú)明顯的界限,它們之間相互融合、相輔相成。
4結(jié)語(yǔ)
DL是以知識(shí)概念為支撐的一種信息服務(wù)和知識(shí)服務(wù)環(huán)境,也是重要的社會(huì)信息基礎(chǔ)設(shè)施之一。未來(lái)基于網(wǎng)格和DL的應(yīng)用研究應(yīng)該加強(qiáng)以下幾個(gè)方面:①網(wǎng)格技術(shù)與DL信息資源管理結(jié)合的技術(shù)策略研究,探討主要技術(shù)和系統(tǒng)開(kāi)發(fā)方法;②應(yīng)用網(wǎng)格技術(shù)進(jìn)行DL信息資源組織的實(shí)施研究,驗(yàn)證理論的可執(zhí)行性;③網(wǎng)格環(huán)境下DL信息資源管理的發(fā)展趨勢(shì)研究,不斷結(jié)合新型的技術(shù)改善管理方法和模式。
雖然,DL網(wǎng)格信息資源組織管理尚處于初級(jí)階段,但是,如果在一個(gè)合理科學(xué)的環(huán)境支撐體系下,正確、科學(xué)地運(yùn)用信息網(wǎng)格與知識(shí)網(wǎng)格,DL信息資源組織管理有望跨越傳統(tǒng)的、初級(jí)的互聯(lián)互通理念、結(jié)構(gòu)和模式,而進(jìn)入深層組織管理,并能夠使它在一定條件下向知識(shí)網(wǎng)格轉(zhuǎn)化。
參考文獻(xiàn):
[1]李亮先.網(wǎng)格技術(shù)在數(shù)字圖書(shū)館的應(yīng)用.情報(bào)科學(xué),2004(6):703-706.
[2]張俊.網(wǎng)格環(huán)境下的應(yīng)用模式的研究[學(xué)位論文].北京:北京理工大學(xué), 2003.
[3]王麗華.基于網(wǎng)格技術(shù)的虛擬圖書(shū)館.情報(bào)科學(xué),2004(4):482-487.
[4]王艷峰,王峰,王恩海,等.網(wǎng)格資源描述與發(fā)現(xiàn).[2005-11-21]. http://www.省略/grid/paperppt/gct/gct08.ppt.
[5]楊玉麟.信息描述.北京:高等教育出版社,2004:4-5.
[6]Froster I,Kesselman C.網(wǎng)絡(luò)計(jì)算(第二版).金海,袁平鵬,石柯,譯.北京:電子工業(yè)出版社,2004:149-162.
[7]柯青.網(wǎng)絡(luò)環(huán)境下異構(gòu)信息檢索標(biāo)準(zhǔn)體系研究[學(xué)位論文].武漢:武漢大學(xué), 2004.
[8]龍朝陽(yáng),秦素娥.數(shù)字圖書(shū)館個(gè)性化信息組織模式構(gòu)建.情報(bào)理論與實(shí)踐,2006(3):355-357.
[9]Digital Library Grid 項(xiàng)目組. Digital library grid. [2006-11-15]. http://128.82.7.230/grid/status/architecture.doc.
[10]丁箐.網(wǎng)格環(huán)境下資源管理的研究[學(xué)位論文].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2002.
[11]徐志偉,馮百明,李偉.網(wǎng)格計(jì)算技術(shù).北京:電子工業(yè)出版社, 2004:104-112.
[12]National Information Standards Organization. Understanding metadata. [2006-12-25]. http://www.省略/standards/resources/Understanding Metadata. PDF.
[13]What is metadata. [2006-03-23] http://www.csc.noaa.gov/metadata.
[14]董方鵬,龔奕利,李偉,等.網(wǎng)格環(huán)境中資源發(fā)現(xiàn)機(jī)制的研究.計(jì)算機(jī)研究與發(fā)展,2003(12):1749-1755.
[15]杭小勇.網(wǎng)格資源的安全主動(dòng)發(fā)布機(jī)制[學(xué)位論文].天津:天津大學(xué),2005.
畢 強(qiáng) 沈 涌
吉林大學(xué)管理學(xué)院長(zhǎng)春 130022
相關(guān)熱詞搜索:網(wǎng)格 信息資源 數(shù)字圖書(shū)館 數(shù)字圖書(shū)館網(wǎng)格信息資源組織模式研究 數(shù)字圖書(shū)館運(yùn)作模式研究 研究的運(yùn)作模式
熱點(diǎn)文章閱讀