【中國(guó)科學(xué)院聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)系統(tǒng)的開發(fā)與建設(shè)】 中國(guó)科學(xué)院基因檢測(cè)機(jī)構(gòu)
發(fā)布時(shí)間:2020-03-07 來源: 感恩親情 點(diǎn)擊:
[摘要]對(duì)中國(guó)科學(xué)院聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)系統(tǒng)的建設(shè)思路和實(shí)施過程中遇到的主要問題進(jìn)行討論,包括如何選擇合適的機(jī)構(gòu)進(jìn)行試點(diǎn)和示范,以推動(dòng)機(jī)構(gòu)倉(cāng)儲(chǔ)的實(shí)施;如何進(jìn)行中文機(jī)構(gòu)倉(cāng)儲(chǔ)軟件系統(tǒng)的定制和擴(kuò)展開發(fā);如何集成現(xiàn)有系統(tǒng)和組織機(jī)構(gòu)倉(cāng)儲(chǔ)服務(wù);如何建立聯(lián)合倉(cāng)儲(chǔ)系統(tǒng)等。
[關(guān)鍵詞]中國(guó)科學(xué)院 國(guó)家科學(xué)圖書館 機(jī)構(gòu)信息環(huán)境 聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)
[分類號(hào)]G250.73
1 前言
不斷增長(zhǎng)的研發(fā)投入為中國(guó)科學(xué)界帶來了豐碩的成果,在全球的科學(xué)研究中,中國(guó)科學(xué)院的科學(xué)家們扮演著越來越重要的角色。但是,由于書刊價(jià)格上漲及其他方面的因素,中國(guó)科學(xué)院的研究人員已經(jīng)在國(guó)外發(fā)表的許多高水平論文卻往往不能為本國(guó)的科學(xué)家所容易地查看或者獲得,如何充分利用這些高水平的學(xué)術(shù)資源已成為當(dāng)前中國(guó)科學(xué)院的科學(xué)家、政策制定者和圖書館人要面對(duì)的一個(gè)大問題。2005年,針對(duì)中國(guó)科學(xué)院內(nèi)一些代表性研究所開展的調(diào)查顯示:中國(guó)科學(xué)院的科研機(jī)構(gòu)迫切需要實(shí)現(xiàn)對(duì)數(shù)字資產(chǎn)的管理,以便進(jìn)一步提升機(jī)構(gòu)的社會(huì)形象和擴(kuò)大機(jī)構(gòu)的學(xué)術(shù)影響,重用已有科研成果,實(shí)現(xiàn)成果的長(zhǎng)期保存。
這種形勢(shì)下,將中國(guó)科學(xué)院作為一個(gè)整體性的研究機(jī)構(gòu)來規(guī)劃和建設(shè)一個(gè)統(tǒng)一綜合的機(jī)構(gòu)倉(cāng)儲(chǔ)系統(tǒng),實(shí)現(xiàn)對(duì)全院數(shù)字科研資產(chǎn)的統(tǒng)一管理和利用,從表面看來,應(yīng)是一種比較理想的選擇。但根據(jù)中國(guó)科學(xué)院在組織結(jié)構(gòu)和管理模式上的特點(diǎn),這種單一性的方案將在可行性和實(shí)效性方面存在很大的疑問。中國(guó)科學(xué)院由分布于全國(guó)各地的89個(gè)研究所組成,各研究所以相對(duì)獨(dú)立和自主的方式確定自己的研究方向與發(fā)展目標(biāo),開展有關(guān)的科研活動(dòng),并且都有自己的圖書館室。因此,各研究所是全院范圍內(nèi)組織和開展具體科研活動(dòng)的基本單元,也應(yīng)該是對(duì)科研產(chǎn)出進(jìn)行積累和管理的基本單元。而且,研究所已經(jīng)開始認(rèn)識(shí)到對(duì)其數(shù)字科研產(chǎn)出進(jìn)行管理在促進(jìn)其共享利用、擴(kuò)大學(xué)術(shù)影響等方面的重要意義和作用。據(jù)此,中國(guó)科學(xué)院國(guó)家科學(xué)圖書館提出了充分利用和調(diào)動(dòng)研究所的積極性,構(gòu)建全院聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)體系的構(gòu)想。即:首先,以研究所為單元構(gòu)建各所的IR系統(tǒng);然后,依托分布于各研究所的IR系統(tǒng),通過元數(shù)據(jù)開放獲取和內(nèi)容聚合的方式,建立起全院聯(lián)合的機(jī)構(gòu)倉(cāng)儲(chǔ)服務(wù)體系,從而發(fā)展和建立起:①全院的知識(shí)中心,支持全院范圍內(nèi)數(shù)字資產(chǎn)的匯集和管理;⑦全院研究成果有效分發(fā)、傳播和共享利用的機(jī)制與平臺(tái);③對(duì)正式出版渠道的補(bǔ)充,逐步形成全院整體的e-Scholarship倉(cāng)儲(chǔ)和交流平臺(tái),④全院知識(shí)產(chǎn)出的長(zhǎng)期數(shù)字保存機(jī)制。
目前,按照上述構(gòu)想,中國(guó)科學(xué)院國(guó)家科學(xué)圖書館已經(jīng)啟動(dòng)了全院聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)體系的研究和實(shí)施計(jì)劃,并取得了初步的成果。下文將對(duì)建設(shè)過程的主要環(huán)節(jié)和涉及的主要問題進(jìn)行討論。
2 研究所IR系統(tǒng)的開發(fā)建設(shè)
研究所IR的建設(shè)是整個(gè)計(jì)劃實(shí)施的第一階段,也是最重要的基礎(chǔ)環(huán)節(jié),主要通過試點(diǎn)和示范的模式進(jìn)行開發(fā)建設(shè)。目前,我們通過選擇中國(guó)科學(xué)院力學(xué)研究所作為試點(diǎn)和合作單位,已經(jīng)部署并建立起了該所的IR服務(wù)示范系統(tǒng)。
2.1 試點(diǎn)研究所的選擇
選擇試點(diǎn)研究所的目的,一方面,是為了能夠準(zhǔn)確了解和把握研究所對(duì)IR的建設(shè)需求;另一方面,也希望通過在試點(diǎn)研究所進(jìn)行IR的部署,為其他研究所樹立榜樣,發(fā)揮示范效應(yīng),從而帶動(dòng)和吸引其他研究所積極加入全院機(jī)構(gòu)倉(cāng)儲(chǔ)建設(shè)體系中來。為了達(dá)到這樣的目的和效果,在試點(diǎn)研究所的選擇過程中,我們主要考慮了以下因素:
2.1.1 研究所對(duì)IR建設(shè)有較高的積極性 一方面,研究所的管理層,特別是主管信息化工作的領(lǐng)導(dǎo)要對(duì)IR建設(shè)的作用和意義有明確的認(rèn)識(shí),對(duì)IR的建設(shè)持歡迎和積極的態(tài)度,已經(jīng)打算或愿意支持IR的規(guī)劃建設(shè)。某種程度上,這是決定是否能夠啟動(dòng)IR規(guī)劃建設(shè)的先決條件,也是IR建設(shè)所需要的各種政策環(huán)境、設(shè)備條件、人員等得到持續(xù)有效支持的保障。另一方面,研究所圖書館的領(lǐng)導(dǎo)和有關(guān)工作人員將是本所IR規(guī)劃與建設(shè)的主要執(zhí)行者,因此他們是否有足夠的積極性和熱情,對(duì)于IR的建設(shè)成敗也有著重要的影響。
2.1.2 研究所能夠保障IR實(shí)施的必要投入 包括研究所是否已經(jīng)具備IR實(shí)施所要求的基礎(chǔ)軟硬件環(huán)境,或者能夠保證進(jìn)行投入和重新建設(shè);是否能保證IR建設(shè)的人員投入,特別是在計(jì)劃實(shí)施的初期,應(yīng)能夠保證科研管理部門的有關(guān)人員和圖書館管理者有一定的時(shí)間和精力投入IR的規(guī)劃與建設(shè),并且能夠指派專職的人員,專門負(fù)責(zé)IR的具體建設(shè)實(shí)施以及其他方面的經(jīng)費(fèi)投入的保證等。
2.1.3 研究所的信息環(huán)境有相對(duì)較為豐富的應(yīng)用 IR做為研究所整體信息環(huán)境發(fā)展和構(gòu)建的重要“組件”,要能夠適應(yīng)與其他相關(guān)系統(tǒng)進(jìn)行互聯(lián)互通的要求。如果研究所的信息環(huán)境過于簡(jiǎn)單或單一,將不利于識(shí)別、捕獲和形成一個(gè)相對(duì)完善的功能需求集合,也不便于對(duì)IR進(jìn)行實(shí)際運(yùn)行和測(cè)試,并可能影響到IR應(yīng)用軟件在全院范圍內(nèi)的通用性和適用性。
2.2 特殊功能和服務(wù)需求的識(shí)別
從IR的發(fā)展來看,采用成熟的開源軟件已經(jīng)成為一種主流的選擇。因此,我們采取了基于開源軟件DSpace建立原型系統(tǒng),與試點(diǎn)研究所進(jìn)行交流和溝通,以進(jìn)一步捕獲與明確需求的方法。事實(shí)證明,這是一種非常行之有效的方法。它不僅提供了一個(gè)對(duì)IR通用功能需求和服務(wù)進(jìn)行分析的基礎(chǔ),而且也有助于快速地確定功能改進(jìn)的需求、發(fā)現(xiàn)和捕獲新的功能需求。按照這一過程和方法,我們發(fā)現(xiàn)除了通用功能和服務(wù)外,合作研究所提出了一些新的服務(wù)需求,與新型機(jī)構(gòu)信息環(huán)境中有關(guān)IR建設(shè)的情景描述不謀而合。這些新的或特殊的功能和服務(wù)需求包括:
?IR是機(jī)構(gòu)整體信息環(huán)境的一部分,需要與其他系統(tǒng)有機(jī)地集成,能夠從其他系統(tǒng),如圖書館自動(dòng)化系統(tǒng)、ARP系統(tǒng)等數(shù)據(jù)信息系統(tǒng)中自動(dòng)地提取有關(guān)的信息,減少數(shù)據(jù)加工的重復(fù)和人工操作,提高系統(tǒng)之間的協(xié)同工作能力和效率。
?盡可能減少由科研人員以自助提交方式進(jìn)行內(nèi)容提交和加工描述的要求,避免使科研人員對(duì)IR產(chǎn)生使用繁瑣、信息描述加工量大的印象,從而降低對(duì)系統(tǒng)使用的期望和使用頻率。
?IR應(yīng)能夠提供對(duì)常見格式內(nèi)容的自動(dòng)分析和識(shí)別,從中抽取并形成有關(guān)的元數(shù)據(jù)描述信息,從而最大程度地減少人工描述和加工的要求。
?IR應(yīng)該有靈活完善的訪問控制策略,比如基于IP地址的全文內(nèi)容訪問控制以及面向特定用戶或用戶組的全文內(nèi)容訪問和存取策略等。這雖然有違于IR實(shí)踐開放存取的初衷,但確是機(jī)構(gòu)的實(shí)際需求。
?支持信息的多維組織、瀏覽、導(dǎo)航和檢索,如基于研究室、內(nèi)容類型、學(xué)科方向、主題、作者等的信息組織與瀏覽,提供全文檢索、檢索結(jié)果的鏈接檢索、二次檢索、相關(guān)檢索等。
?IR不僅要能夠與研究所內(nèi)的各相關(guān)系統(tǒng)之間集成,還應(yīng)該支持與外部的應(yīng)用系統(tǒng)之間的開放集成,方便系統(tǒng)之間的數(shù)據(jù)交換和共享。這就要求IR必須支持多種開放接口, 如RSS內(nèi)容聚合接口、OAI元數(shù)據(jù)開放獲取接口、SRW/U標(biāo)準(zhǔn)檢索接口、OpenURL開放鏈接接口等。
2.3 IR的開發(fā)建設(shè)
2.3.1 開發(fā)策略 由于IR的建設(shè)和發(fā)展在近年來得到了國(guó)內(nèi)外特別是國(guó)外各著名大學(xué)和研究機(jī)構(gòu)的普遍重視,支持IR構(gòu)建的應(yīng)用軟件平臺(tái)也開始逐步走向成熟,特別是以DSpace、Eprints等為代表的開源IR軟件,基本上已經(jīng)成為國(guó)際上IR建設(shè)和部署的主要技術(shù)選擇。因此,我們也采取了基于此類開源軟件進(jìn)行定制和擴(kuò)展開發(fā)的策略。
根據(jù)對(duì)一些已得到廣泛應(yīng)用的開源IR軟件的比較和分析,結(jié)合我院知識(shí)倉(cāng)儲(chǔ)系統(tǒng)建設(shè)的需求,我們認(rèn)為DSpace具有系統(tǒng)結(jié)構(gòu)比較合理、功能較為完善、支持任意類型的內(nèi)容存儲(chǔ)等特點(diǎn),適合作為我院IR應(yīng)用軟件系統(tǒng)定制和擴(kuò)展開發(fā)的基礎(chǔ)。
2.3.2 基于DSpace的IR系統(tǒng)功能結(jié)構(gòu)總體上,研究所IR將不僅考慮作為研究所獨(dú)立運(yùn)行的知識(shí)資產(chǎn)管理系統(tǒng),同時(shí)也將支持其作為研究所信息基礎(chǔ)設(shè)施環(huán)境構(gòu)建的重要組成部分,支持與其他相關(guān)信息系統(tǒng)之間的關(guān)聯(lián)和集成。
結(jié)合前述對(duì)IR系統(tǒng)功能和服務(wù)需求的分析,這里給出我院基于DSpace的IR系統(tǒng)的功能。
其中,用戶服務(wù)子系統(tǒng)為用戶提供:①多維的信息瀏覽和導(dǎo)航途徑;②簡(jiǎn)單檢索、高級(jí)檢索、全文檢索等靈活多樣的信息檢索方式;③內(nèi)容訂閱與推送服務(wù),④按照一定的條件組合,進(jìn)行相關(guān)信息內(nèi)容的分析與匯總、結(jié)果的可視化展現(xiàn)等擴(kuò)展服務(wù)。
信息攝取子系統(tǒng)支持任何授權(quán)用戶以自助提交和存檔的方式,按照一定的工作流程和內(nèi)容描述要求對(duì)提交內(nèi)容進(jìn)行描述和編輯,并提交到IR中。同時(shí),也支持以批量導(dǎo)入的方式將符合系統(tǒng)數(shù)據(jù)格式要求的內(nèi)容導(dǎo)入到系統(tǒng)中。
信息存檔子系統(tǒng)由提交的數(shù)字對(duì)象(內(nèi)容)及其元數(shù)據(jù)組成,支持對(duì)數(shù)字對(duì)象的長(zhǎng)期保存、管理及存取利用服務(wù)。
開放接口子系統(tǒng)主要通過實(shí)現(xiàn)OAIData Provider,支持聯(lián)合機(jī)構(gòu)知識(shí)倉(cāng)儲(chǔ)系統(tǒng)實(shí)施元數(shù)據(jù)或數(shù)字對(duì)象的聚合,并根據(jù)與其他應(yīng)用系統(tǒng)集成的要求,提供SRW/SRU、OpenURL等服務(wù)接口。
公共服務(wù)子系統(tǒng)提供系統(tǒng)運(yùn)行和服務(wù)過程中的各種公共服務(wù)與管理維護(hù)功能的支持,如分類表的管理、元數(shù)據(jù)及內(nèi)容的維護(hù)與管理、用戶管理、訪問統(tǒng)計(jì)分析等。
2.3.3 主要的定制和擴(kuò)展開發(fā)工作 包括DSpace的本地化以及針對(duì)特定功能需求的定制和擴(kuò)展開發(fā)。DSpace的設(shè)計(jì)具有良好的分層架構(gòu),支持基于公共API進(jìn)行功能和服務(wù)的擴(kuò)展開發(fā)方式。在開發(fā)過程中,盡管我們盡量通過對(duì)其API的調(diào)用和擴(kuò)展來進(jìn)行功能的定制和開發(fā),但在很多情況下,還是需要對(duì)其底層代碼進(jìn)行修改才能完成一些特定的功能開發(fā)需求。
?DSpace的本地化及界面定制。主要包括以下方面:
――DSpace默認(rèn)界面為英文界面,根據(jù)中文信息顯示和處理的習(xí)慣,對(duì)各有關(guān)頁(yè)面顯示、處理過程、在線幫助等方面的顯示信息進(jìn)行了全面的中文化。
――通過對(duì)相關(guān)jsp文件及CSS文件的修改和調(diào)整,對(duì)各級(jí)頁(yè)面從內(nèi)容布局、色彩搭配等方面進(jìn)行了美化設(shè)計(jì)和調(diào)整,提供顯示主題和風(fēng)格的定制和切換的功能擴(kuò)展。并在首頁(yè)增加了有關(guān)最新提交、RSS訂閱等方面的功能。
――作者姓名處理的本地化。DSpace在對(duì)作者姓名的處理上,將“姓”和“名”進(jìn)行了分解和分別存儲(chǔ)的處理,這對(duì)于西方作者來說是合適的,但并不符合中文姓名的處理和顯示習(xí)慣。在不改變數(shù)據(jù)邏輯的基礎(chǔ)上,對(duì)有關(guān)提交和顯示過程的程序進(jìn)行了修改,以使中英文姓名都能以比較習(xí)慣的方式得到顯示和處理。
――中文排序的支持。DSpace通過支持Unicode編碼標(biāo)準(zhǔn)以實(shí)現(xiàn)國(guó)際化設(shè)計(jì)和支持,但這樣帶來的問題是無法支持按照漢語拼音順序來對(duì)顯示結(jié)果進(jìn)行排序。集成有關(guān)的開源軟件包以及對(duì)結(jié)果顯示處理的程序進(jìn)行了修改,實(shí)現(xiàn)了按照漢語拼音順序顯示瀏覽和檢索結(jié)果的功能。
?元數(shù)據(jù)應(yīng)用規(guī)范的擴(kuò)展。DSpace支持以基于擴(kuò)展的DC元數(shù)據(jù)標(biāo)準(zhǔn)為基礎(chǔ)的元數(shù)據(jù)應(yīng)用規(guī)范,我們主要從適應(yīng)研究所提出的對(duì)多種類型的數(shù)字內(nèi)容類型的描述和顯示的要求基礎(chǔ)上,通過元素修飾符擴(kuò)展的方式進(jìn)行了擴(kuò)展,如根據(jù)學(xué)位論文、會(huì)議論文等的特殊描述和顯示需求,做了10多項(xiàng)有關(guān)的擴(kuò)展。
?提交流程和界面的調(diào)整。DSpace默認(rèn)的內(nèi)容提交流程步驟較為繁瑣,有關(guān)的提交界面也常常被分解到幾個(gè)頁(yè)面中。我們?cè)诒A裟J(rèn)提交流程及界面的情況下,提供了一套簡(jiǎn)化的流程及界面,以滿足一般的內(nèi)容提交和編輯習(xí)慣。
?數(shù)據(jù)的批量導(dǎo)入功能。主要進(jìn)行了從研究所ARP、圖書館自動(dòng)化系統(tǒng)等系統(tǒng)中將有關(guān)數(shù)據(jù)導(dǎo)出和導(dǎo)入IR的專門工具的擴(kuò)展開發(fā)。對(duì)有一定通用性的工具,將考慮集成到DSpace系統(tǒng)中,方便用戶的使用。對(duì)于那些只是在系統(tǒng)初裝過程中等場(chǎng)合使用的一次性數(shù)據(jù)導(dǎo)入導(dǎo)出工具,則主要以外部程序的方式提供使用。
?存取控制的強(qiáng)化。擴(kuò)展了基于IP地址和用戶組的數(shù)字對(duì)象訪問控制功能,以滿足研究所制定靈活的IR內(nèi)容訪問許可策略。
?數(shù)字對(duì)象的訪問統(tǒng)計(jì)功能。擴(kuò)展實(shí)現(xiàn)了基于信息條目級(jí)的訪問利用統(tǒng)計(jì)功能,可以方便作者對(duì)發(fā)布在IR中的科研和學(xué)術(shù)成果的訪問與下載情況進(jìn)行及時(shí)了解和掌握,IR管理者也可以據(jù)此對(duì)任一數(shù)字對(duì)象或所有數(shù)字對(duì)象的訪問和利用情況進(jìn)行統(tǒng)計(jì)分析。
?開放接口的定制和擴(kuò)展。首先,DSpace已經(jīng)提供了OAI Data Provider接口,這也是我們構(gòu)建全院聯(lián)合知識(shí)倉(cāng)儲(chǔ)服務(wù)系統(tǒng)必需的接口。同時(shí),基于OCIC發(fā)布的SRW/U開源軟件,我們也為DSpace擴(kuò)展了SRW/U接口,可以方便地支持以標(biāo)準(zhǔn)的方式與各種檢索應(yīng)用服務(wù)系統(tǒng)的集成。
2.4 協(xié)助研究所進(jìn)行IR的規(guī)劃和實(shí)施
對(duì)于我院大部分的研究所來說,IR的規(guī)劃和實(shí)施還屬于新生事物。針對(duì)這一點(diǎn),我們編寫了有關(guān)IR規(guī)劃和實(shí)施的參考文檔,擬提供給研究所使用,以促進(jìn)IR概念、作用和職能的宣傳和推介,幫助研究所進(jìn)行IR的規(guī)劃實(shí)施,包括IR建設(shè)的投入分析、實(shí)施團(tuán)隊(duì)的組建、內(nèi)容建設(shè)保障機(jī)制和政策的制定、內(nèi)容組織和提交流程的設(shè)計(jì)、內(nèi)容的安全和長(zhǎng)期保存機(jī)制的建立等。
在具體的實(shí)施過程中,則主要通過遠(yuǎn)程或現(xiàn)場(chǎng)方式,為研究所進(jìn)行IR應(yīng)用系統(tǒng)的安裝、部署,實(shí)現(xiàn)上線使用。
2.5 IR與相關(guān)服務(wù)的集成
目前,研究所IR系統(tǒng)主要實(shí)現(xiàn)了與研究所范圍內(nèi)的圖書館自動(dòng)化系統(tǒng)、ARP系統(tǒng)之間的數(shù)據(jù)轉(zhuǎn)換和集成。如在針對(duì)中國(guó)科學(xué)院力學(xué)所的IR實(shí)施過程中,已經(jīng)實(shí)現(xiàn)了從其圖書館自動(dòng)化系統(tǒng)中提取和導(dǎo)出學(xué)位論文的數(shù)據(jù)以及從ARP系統(tǒng)中導(dǎo)出科研論文、會(huì)議論文、專著等產(chǎn)出物信息,并將這些數(shù)據(jù)轉(zhuǎn)換和導(dǎo)入IR的處理。在與研究所圖書館網(wǎng)站、研究所門戶網(wǎng)站的鏈接和集成方面,也提供了基于IR公共檢索API及SRW/U標(biāo)準(zhǔn)的嵌入和集成機(jī)制。隨著IR應(yīng)用的逐步 深入,將進(jìn)一步對(duì)IR的SRW/U接口進(jìn)行優(yōu)化,并啟動(dòng)OpenURL的支持,逐步以標(biāo)準(zhǔn)的方式集成到有關(guān)的公共檢索和服務(wù)系統(tǒng)中,如與中國(guó)科學(xué)院國(guó)家科學(xué)圖書館的集成檢索服務(wù)平臺(tái)的集成,使IR中有關(guān)的知識(shí)信息能在更大的范圍內(nèi)被檢索、發(fā)現(xiàn)和利用。
3 全院聯(lián)合的機(jī)構(gòu)倉(cāng)儲(chǔ)服務(wù)系統(tǒng)建設(shè)
這是整個(gè)計(jì)劃實(shí)施的第二階段,將包括兩方面的工作:第一,在全院范圍內(nèi)開展IR的推廣和部署。即:根據(jù)第一階段IR的試點(diǎn)應(yīng)用和部署,在形成功能完善、性能穩(wěn)定的IR應(yīng)用軟件基礎(chǔ)上,舉辦面向研究所科技管理人員、圖書信息管理及應(yīng)用人員的集中培訓(xùn),并針對(duì)不同研究所的情況,通過現(xiàn)場(chǎng)安裝、自助安裝或者遠(yuǎn)程安裝方式進(jìn)行系統(tǒng)的安裝、部署和上線應(yīng)用。
第二,開發(fā)OAI元數(shù)據(jù)收割系統(tǒng),對(duì)逐步部署和應(yīng)用起來的研究所IR實(shí)施元數(shù)據(jù)收割與再組織,建立起全院聯(lián)合的機(jī)構(gòu)倉(cāng)儲(chǔ)服務(wù)系統(tǒng)。
在全院聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)服務(wù)系統(tǒng)的建設(shè)過程中,我們?nèi)匀灰訢Space系統(tǒng)作為基礎(chǔ),通過擴(kuò)展OAI元數(shù)據(jù)收割功能的支持,以形成全院聯(lián)合的機(jī)構(gòu)知識(shí)門戶服務(wù)系統(tǒng)。在OAI元數(shù)據(jù)收割系統(tǒng)的擴(kuò)展開發(fā)過程中,也沿用了基于開源軟件以加快開發(fā)進(jìn)度和節(jié)省開發(fā)成本的策略,選擇了OCLC發(fā)布的開源軟件OAI Hal"vester2.0,并通過定制開發(fā)實(shí)現(xiàn)了與DSpace系統(tǒng)的集成。
在集成的過程中,涉及的關(guān)鍵問題包括:①元數(shù)據(jù)收割器的定制。其中涉及對(duì)目標(biāo)倉(cāng)儲(chǔ)系統(tǒng)列表的維護(hù),元數(shù)據(jù)獲取的控制,增量更新獲取的調(diào)度與控制以及基于多線程的多目標(biāo)倉(cāng)儲(chǔ)的并發(fā)搜尋與元數(shù)據(jù)獲取等。②:XMIL數(shù)據(jù)解析器的實(shí)現(xiàn)。即通過從OAIHarvester獲取的XMIL格式的數(shù)據(jù)文件將需要的元數(shù)據(jù)信息解析出來,進(jìn)行必要的規(guī)范化和歸并處理,為載入DSpace做好準(zhǔn)備。③數(shù)據(jù)批量導(dǎo)入接口的實(shí)現(xiàn)。即將解析并規(guī)范化處理后的元數(shù)據(jù)按照DSpace系統(tǒng)可以接受的格式,載入DSpace系統(tǒng)。
同時(shí),聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)服務(wù)系統(tǒng)繼續(xù)保持對(duì)OAI、SRW/U、RSS等開放接口的支持,保證其與全院層面上有關(guān)信息服務(wù)系統(tǒng)的方便集成。如與中國(guó)科學(xué)院國(guó)家科學(xué)圖書館的集成檢索系統(tǒng)是基于SRW/U的標(biāo)準(zhǔn)化檢索集成等。
4 結(jié)語
到目前為止,我們已經(jīng)完成了示范性IR的構(gòu)建和部署,全院聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)服務(wù)實(shí)驗(yàn)系統(tǒng)也正在開發(fā)完善之中,而且很多研究所對(duì)IR的建設(shè)都積極響應(yīng),愿意早日實(shí)施本所的IR。
在建設(shè)過程中,我們也吸取了許多的經(jīng)驗(yàn)和教訓(xùn)。例如:
?研究所的機(jī)構(gòu)倉(cāng)儲(chǔ)建設(shè),技術(shù)手段不是關(guān)鍵問題,了解研究所需求,按照研究所的相關(guān)機(jī)制定制和擴(kuò)展相應(yīng)的倉(cāng)儲(chǔ)系統(tǒng)才是重中之重。特別是在當(dāng)前一個(gè)中國(guó)科學(xué)院研究所圖書館(室)的工作人員平均不到3人的情況下,研究所IR的提交和管理流程需要大力簡(jiǎn)化。
?研究所IR的建設(shè)必須考慮到研究所已有的信息系統(tǒng)。在當(dāng)前研究所中存在著ARP系統(tǒng)、圖書館自動(dòng)化系統(tǒng)等,IR的建設(shè)必須與這些系統(tǒng)實(shí)現(xiàn)有機(jī)的集成和共享,一方面避免數(shù)據(jù)的重復(fù)錄入;另一方面要避免構(gòu)建一個(gè)個(gè)孤立的系統(tǒng)。
?提前規(guī)劃十分重要。在研究所IR的建設(shè)中,需要提前為研究所規(guī)劃。在實(shí)踐中,我們提出了包括政策、流程、機(jī)制、技術(shù)、管理各個(gè)環(huán)節(jié)在內(nèi)的一系列建設(shè)指南和最佳實(shí)踐方案,供研究所參考。
?研究所IR應(yīng)當(dāng)是一個(gè)開放系統(tǒng)。國(guó)家科學(xué)圖書館構(gòu)建聯(lián)合的機(jī)構(gòu)倉(cāng)儲(chǔ)系統(tǒng),目標(biāo)在于提升全院的信息服務(wù)能力,為此我們?yōu)檠芯克鵌R提供了SRU等檢索接口,使授權(quán)用戶能夠通過SRU規(guī)范檢索倉(cāng)儲(chǔ)系統(tǒng),提高倉(cāng)儲(chǔ)系統(tǒng)的集成能力。
盡管走了一些彎路,但是通過實(shí)踐,我們也增強(qiáng)了信心,希望進(jìn)一步了解和把握研究所的需求,爭(zhēng)取他們的支持和配合,盡快在全院范圍內(nèi)逐步推廣和部署,并最終形成有一定規(guī)模的聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)服務(wù)系統(tǒng)。
相關(guān)熱詞搜索:中國(guó)科學(xué)院 倉(cāng)儲(chǔ) 機(jī)構(gòu) 中國(guó)科學(xué)院聯(lián)合機(jī)構(gòu)倉(cāng)儲(chǔ)系統(tǒng)的開發(fā)與建設(shè) 中國(guó)科學(xué)院機(jī)構(gòu)倉(cāng)儲(chǔ)的建設(shè) 倉(cāng)儲(chǔ)論文題目
熱點(diǎn)文章閱讀