www.日本精品,久久中文视频,中文字幕第一页在线播放,香蕉视频免费网站,老湿机一区午夜精品免费福利,91久久综合精品国产丝袜长腿,欧美日韩视频精品一区二区

【中國科學院聯(lián)合機構(gòu)倉儲系統(tǒng)的開發(fā)與建設(shè)】 中國科學院基因檢測機構(gòu)

發(fā)布時間:2020-03-07 來源: 感恩親情 點擊:

  [摘要]對中國科學院聯(lián)合機構(gòu)倉儲系統(tǒng)的建設(shè)思路和實施過程中遇到的主要問題進行討論,包括如何選擇合適的機構(gòu)進行試點和示范,以推動機構(gòu)倉儲的實施;如何進行中文機構(gòu)倉儲軟件系統(tǒng)的定制和擴展開發(fā);如何集成現(xiàn)有系統(tǒng)和組織機構(gòu)倉儲服務;如何建立聯(lián)合倉儲系統(tǒng)等。
  [關(guān)鍵詞]中國科學院 國家科學圖書館 機構(gòu)信息環(huán)境 聯(lián)合機構(gòu)倉儲
  [分類號]G250.73
  
  1 前言
  
  不斷增長的研發(fā)投入為中國科學界帶來了豐碩的成果,在全球的科學研究中,中國科學院的科學家們扮演著越來越重要的角色。但是,由于書刊價格上漲及其他方面的因素,中國科學院的研究人員已經(jīng)在國外發(fā)表的許多高水平論文卻往往不能為本國的科學家所容易地查看或者獲得,如何充分利用這些高水平的學術(shù)資源已成為當前中國科學院的科學家、政策制定者和圖書館人要面對的一個大問題。2005年,針對中國科學院內(nèi)一些代表性研究所開展的調(diào)查顯示:中國科學院的科研機構(gòu)迫切需要實現(xiàn)對數(shù)字資產(chǎn)的管理,以便進一步提升機構(gòu)的社會形象和擴大機構(gòu)的學術(shù)影響,重用已有科研成果,實現(xiàn)成果的長期保存。
  這種形勢下,將中國科學院作為一個整體性的研究機構(gòu)來規(guī)劃和建設(shè)一個統(tǒng)一綜合的機構(gòu)倉儲系統(tǒng),實現(xiàn)對全院數(shù)字科研資產(chǎn)的統(tǒng)一管理和利用,從表面看來,應是一種比較理想的選擇。但根據(jù)中國科學院在組織結(jié)構(gòu)和管理模式上的特點,這種單一性的方案將在可行性和實效性方面存在很大的疑問。中國科學院由分布于全國各地的89個研究所組成,各研究所以相對獨立和自主的方式確定自己的研究方向與發(fā)展目標,開展有關(guān)的科研活動,并且都有自己的圖書館室。因此,各研究所是全院范圍內(nèi)組織和開展具體科研活動的基本單元,也應該是對科研產(chǎn)出進行積累和管理的基本單元。而且,研究所已經(jīng)開始認識到對其數(shù)字科研產(chǎn)出進行管理在促進其共享利用、擴大學術(shù)影響等方面的重要意義和作用。據(jù)此,中國科學院國家科學圖書館提出了充分利用和調(diào)動研究所的積極性,構(gòu)建全院聯(lián)合機構(gòu)倉儲體系的構(gòu)想。即:首先,以研究所為單元構(gòu)建各所的IR系統(tǒng);然后,依托分布于各研究所的IR系統(tǒng),通過元數(shù)據(jù)開放獲取和內(nèi)容聚合的方式,建立起全院聯(lián)合的機構(gòu)倉儲服務體系,從而發(fā)展和建立起:①全院的知識中心,支持全院范圍內(nèi)數(shù)字資產(chǎn)的匯集和管理;⑦全院研究成果有效分發(fā)、傳播和共享利用的機制與平臺;③對正式出版渠道的補充,逐步形成全院整體的e-Scholarship倉儲和交流平臺,④全院知識產(chǎn)出的長期數(shù)字保存機制。
  目前,按照上述構(gòu)想,中國科學院國家科學圖書館已經(jīng)啟動了全院聯(lián)合機構(gòu)倉儲體系的研究和實施計劃,并取得了初步的成果。下文將對建設(shè)過程的主要環(huán)節(jié)和涉及的主要問題進行討論。
  
  2 研究所IR系統(tǒng)的開發(fā)建設(shè)
  
  研究所IR的建設(shè)是整個計劃實施的第一階段,也是最重要的基礎(chǔ)環(huán)節(jié),主要通過試點和示范的模式進行開發(fā)建設(shè)。目前,我們通過選擇中國科學院力學研究所作為試點和合作單位,已經(jīng)部署并建立起了該所的IR服務示范系統(tǒng)。
  
  2.1 試點研究所的選擇
  選擇試點研究所的目的,一方面,是為了能夠準確了解和把握研究所對IR的建設(shè)需求;另一方面,也希望通過在試點研究所進行IR的部署,為其他研究所樹立榜樣,發(fā)揮示范效應,從而帶動和吸引其他研究所積極加入全院機構(gòu)倉儲建設(shè)體系中來。為了達到這樣的目的和效果,在試點研究所的選擇過程中,我們主要考慮了以下因素:
  2.1.1 研究所對IR建設(shè)有較高的積極性 一方面,研究所的管理層,特別是主管信息化工作的領(lǐng)導要對IR建設(shè)的作用和意義有明確的認識,對IR的建設(shè)持歡迎和積極的態(tài)度,已經(jīng)打算或愿意支持IR的規(guī)劃建設(shè)。某種程度上,這是決定是否能夠啟動IR規(guī)劃建設(shè)的先決條件,也是IR建設(shè)所需要的各種政策環(huán)境、設(shè)備條件、人員等得到持續(xù)有效支持的保障。另一方面,研究所圖書館的領(lǐng)導和有關(guān)工作人員將是本所IR規(guī)劃與建設(shè)的主要執(zhí)行者,因此他們是否有足夠的積極性和熱情,對于IR的建設(shè)成敗也有著重要的影響。
  2.1.2 研究所能夠保障IR實施的必要投入 包括研究所是否已經(jīng)具備IR實施所要求的基礎(chǔ)軟硬件環(huán)境,或者能夠保證進行投入和重新建設(shè);是否能保證IR建設(shè)的人員投入,特別是在計劃實施的初期,應能夠保證科研管理部門的有關(guān)人員和圖書館管理者有一定的時間和精力投入IR的規(guī)劃與建設(shè),并且能夠指派專職的人員,專門負責IR的具體建設(shè)實施以及其他方面的經(jīng)費投入的保證等。
  2.1.3 研究所的信息環(huán)境有相對較為豐富的應用 IR做為研究所整體信息環(huán)境發(fā)展和構(gòu)建的重要“組件”,要能夠適應與其他相關(guān)系統(tǒng)進行互聯(lián)互通的要求。如果研究所的信息環(huán)境過于簡單或單一,將不利于識別、捕獲和形成一個相對完善的功能需求集合,也不便于對IR進行實際運行和測試,并可能影響到IR應用軟件在全院范圍內(nèi)的通用性和適用性。
  
  2.2 特殊功能和服務需求的識別
  從IR的發(fā)展來看,采用成熟的開源軟件已經(jīng)成為一種主流的選擇。因此,我們采取了基于開源軟件DSpace建立原型系統(tǒng),與試點研究所進行交流和溝通,以進一步捕獲與明確需求的方法。事實證明,這是一種非常行之有效的方法。它不僅提供了一個對IR通用功能需求和服務進行分析的基礎(chǔ),而且也有助于快速地確定功能改進的需求、發(fā)現(xiàn)和捕獲新的功能需求。按照這一過程和方法,我們發(fā)現(xiàn)除了通用功能和服務外,合作研究所提出了一些新的服務需求,與新型機構(gòu)信息環(huán)境中有關(guān)IR建設(shè)的情景描述不謀而合。這些新的或特殊的功能和服務需求包括:
  ?IR是機構(gòu)整體信息環(huán)境的一部分,需要與其他系統(tǒng)有機地集成,能夠從其他系統(tǒng),如圖書館自動化系統(tǒng)、ARP系統(tǒng)等數(shù)據(jù)信息系統(tǒng)中自動地提取有關(guān)的信息,減少數(shù)據(jù)加工的重復和人工操作,提高系統(tǒng)之間的協(xié)同工作能力和效率。
  ?盡可能減少由科研人員以自助提交方式進行內(nèi)容提交和加工描述的要求,避免使科研人員對IR產(chǎn)生使用繁瑣、信息描述加工量大的印象,從而降低對系統(tǒng)使用的期望和使用頻率。
  ?IR應能夠提供對常見格式內(nèi)容的自動分析和識別,從中抽取并形成有關(guān)的元數(shù)據(jù)描述信息,從而最大程度地減少人工描述和加工的要求。
  ?IR應該有靈活完善的訪問控制策略,比如基于IP地址的全文內(nèi)容訪問控制以及面向特定用戶或用戶組的全文內(nèi)容訪問和存取策略等。這雖然有違于IR實踐開放存取的初衷,但確是機構(gòu)的實際需求。
  ?支持信息的多維組織、瀏覽、導航和檢索,如基于研究室、內(nèi)容類型、學科方向、主題、作者等的信息組織與瀏覽,提供全文檢索、檢索結(jié)果的鏈接檢索、二次檢索、相關(guān)檢索等。
  ?IR不僅要能夠與研究所內(nèi)的各相關(guān)系統(tǒng)之間集成,還應該支持與外部的應用系統(tǒng)之間的開放集成,方便系統(tǒng)之間的數(shù)據(jù)交換和共享。這就要求IR必須支持多種開放接口, 如RSS內(nèi)容聚合接口、OAI元數(shù)據(jù)開放獲取接口、SRW/U標準檢索接口、OpenURL開放鏈接接口等。
  
  2.3 IR的開發(fā)建設(shè)
  2.3.1 開發(fā)策略 由于IR的建設(shè)和發(fā)展在近年來得到了國內(nèi)外特別是國外各著名大學和研究機構(gòu)的普遍重視,支持IR構(gòu)建的應用軟件平臺也開始逐步走向成熟,特別是以DSpace、Eprints等為代表的開源IR軟件,基本上已經(jīng)成為國際上IR建設(shè)和部署的主要技術(shù)選擇。因此,我們也采取了基于此類開源軟件進行定制和擴展開發(fā)的策略。
  根據(jù)對一些已得到廣泛應用的開源IR軟件的比較和分析,結(jié)合我院知識倉儲系統(tǒng)建設(shè)的需求,我們認為DSpace具有系統(tǒng)結(jié)構(gòu)比較合理、功能較為完善、支持任意類型的內(nèi)容存儲等特點,適合作為我院IR應用軟件系統(tǒng)定制和擴展開發(fā)的基礎(chǔ)。
  2.3.2 基于DSpace的IR系統(tǒng)功能結(jié)構(gòu)總體上,研究所IR將不僅考慮作為研究所獨立運行的知識資產(chǎn)管理系統(tǒng),同時也將支持其作為研究所信息基礎(chǔ)設(shè)施環(huán)境構(gòu)建的重要組成部分,支持與其他相關(guān)信息系統(tǒng)之間的關(guān)聯(lián)和集成。
  結(jié)合前述對IR系統(tǒng)功能和服務需求的分析,這里給出我院基于DSpace的IR系統(tǒng)的功能。
  其中,用戶服務子系統(tǒng)為用戶提供:①多維的信息瀏覽和導航途徑;②簡單檢索、高級檢索、全文檢索等靈活多樣的信息檢索方式;③內(nèi)容訂閱與推送服務,④按照一定的條件組合,進行相關(guān)信息內(nèi)容的分析與匯總、結(jié)果的可視化展現(xiàn)等擴展服務。
  信息攝取子系統(tǒng)支持任何授權(quán)用戶以自助提交和存檔的方式,按照一定的工作流程和內(nèi)容描述要求對提交內(nèi)容進行描述和編輯,并提交到IR中。同時,也支持以批量導入的方式將符合系統(tǒng)數(shù)據(jù)格式要求的內(nèi)容導入到系統(tǒng)中。
  信息存檔子系統(tǒng)由提交的數(shù)字對象(內(nèi)容)及其元數(shù)據(jù)組成,支持對數(shù)字對象的長期保存、管理及存取利用服務。
  開放接口子系統(tǒng)主要通過實現(xiàn)OAIData Provider,支持聯(lián)合機構(gòu)知識倉儲系統(tǒng)實施元數(shù)據(jù)或數(shù)字對象的聚合,并根據(jù)與其他應用系統(tǒng)集成的要求,提供SRW/SRU、OpenURL等服務接口。
  公共服務子系統(tǒng)提供系統(tǒng)運行和服務過程中的各種公共服務與管理維護功能的支持,如分類表的管理、元數(shù)據(jù)及內(nèi)容的維護與管理、用戶管理、訪問統(tǒng)計分析等。
  2.3.3 主要的定制和擴展開發(fā)工作 包括DSpace的本地化以及針對特定功能需求的定制和擴展開發(fā)。DSpace的設(shè)計具有良好的分層架構(gòu),支持基于公共API進行功能和服務的擴展開發(fā)方式。在開發(fā)過程中,盡管我們盡量通過對其API的調(diào)用和擴展來進行功能的定制和開發(fā),但在很多情況下,還是需要對其底層代碼進行修改才能完成一些特定的功能開發(fā)需求。
  ?DSpace的本地化及界面定制。主要包括以下方面:
  ――DSpace默認界面為英文界面,根據(jù)中文信息顯示和處理的習慣,對各有關(guān)頁面顯示、處理過程、在線幫助等方面的顯示信息進行了全面的中文化。
  ――通過對相關(guān)jsp文件及CSS文件的修改和調(diào)整,對各級頁面從內(nèi)容布局、色彩搭配等方面進行了美化設(shè)計和調(diào)整,提供顯示主題和風格的定制和切換的功能擴展。并在首頁增加了有關(guān)最新提交、RSS訂閱等方面的功能。
  ――作者姓名處理的本地化。DSpace在對作者姓名的處理上,將“姓”和“名”進行了分解和分別存儲的處理,這對于西方作者來說是合適的,但并不符合中文姓名的處理和顯示習慣。在不改變數(shù)據(jù)邏輯的基礎(chǔ)上,對有關(guān)提交和顯示過程的程序進行了修改,以使中英文姓名都能以比較習慣的方式得到顯示和處理。
  ――中文排序的支持。DSpace通過支持Unicode編碼標準以實現(xiàn)國際化設(shè)計和支持,但這樣帶來的問題是無法支持按照漢語拼音順序來對顯示結(jié)果進行排序。集成有關(guān)的開源軟件包以及對結(jié)果顯示處理的程序進行了修改,實現(xiàn)了按照漢語拼音順序顯示瀏覽和檢索結(jié)果的功能。
  ?元數(shù)據(jù)應用規(guī)范的擴展。DSpace支持以基于擴展的DC元數(shù)據(jù)標準為基礎(chǔ)的元數(shù)據(jù)應用規(guī)范,我們主要從適應研究所提出的對多種類型的數(shù)字內(nèi)容類型的描述和顯示的要求基礎(chǔ)上,通過元素修飾符擴展的方式進行了擴展,如根據(jù)學位論文、會議論文等的特殊描述和顯示需求,做了10多項有關(guān)的擴展。
  ?提交流程和界面的調(diào)整。DSpace默認的內(nèi)容提交流程步驟較為繁瑣,有關(guān)的提交界面也常常被分解到幾個頁面中。我們在保留默認提交流程及界面的情況下,提供了一套簡化的流程及界面,以滿足一般的內(nèi)容提交和編輯習慣。
  ?數(shù)據(jù)的批量導入功能。主要進行了從研究所ARP、圖書館自動化系統(tǒng)等系統(tǒng)中將有關(guān)數(shù)據(jù)導出和導入IR的專門工具的擴展開發(fā)。對有一定通用性的工具,將考慮集成到DSpace系統(tǒng)中,方便用戶的使用。對于那些只是在系統(tǒng)初裝過程中等場合使用的一次性數(shù)據(jù)導入導出工具,則主要以外部程序的方式提供使用。
  ?存取控制的強化。擴展了基于IP地址和用戶組的數(shù)字對象訪問控制功能,以滿足研究所制定靈活的IR內(nèi)容訪問許可策略。
  ?數(shù)字對象的訪問統(tǒng)計功能。擴展實現(xiàn)了基于信息條目級的訪問利用統(tǒng)計功能,可以方便作者對發(fā)布在IR中的科研和學術(shù)成果的訪問與下載情況進行及時了解和掌握,IR管理者也可以據(jù)此對任一數(shù)字對象或所有數(shù)字對象的訪問和利用情況進行統(tǒng)計分析。
  ?開放接口的定制和擴展。首先,DSpace已經(jīng)提供了OAI Data Provider接口,這也是我們構(gòu)建全院聯(lián)合知識倉儲服務系統(tǒng)必需的接口。同時,基于OCIC發(fā)布的SRW/U開源軟件,我們也為DSpace擴展了SRW/U接口,可以方便地支持以標準的方式與各種檢索應用服務系統(tǒng)的集成。
  
  2.4 協(xié)助研究所進行IR的規(guī)劃和實施
  對于我院大部分的研究所來說,IR的規(guī)劃和實施還屬于新生事物。針對這一點,我們編寫了有關(guān)IR規(guī)劃和實施的參考文檔,擬提供給研究所使用,以促進IR概念、作用和職能的宣傳和推介,幫助研究所進行IR的規(guī)劃實施,包括IR建設(shè)的投入分析、實施團隊的組建、內(nèi)容建設(shè)保障機制和政策的制定、內(nèi)容組織和提交流程的設(shè)計、內(nèi)容的安全和長期保存機制的建立等。
  在具體的實施過程中,則主要通過遠程或現(xiàn)場方式,為研究所進行IR應用系統(tǒng)的安裝、部署,實現(xiàn)上線使用。
  
  2.5 IR與相關(guān)服務的集成
  目前,研究所IR系統(tǒng)主要實現(xiàn)了與研究所范圍內(nèi)的圖書館自動化系統(tǒng)、ARP系統(tǒng)之間的數(shù)據(jù)轉(zhuǎn)換和集成。如在針對中國科學院力學所的IR實施過程中,已經(jīng)實現(xiàn)了從其圖書館自動化系統(tǒng)中提取和導出學位論文的數(shù)據(jù)以及從ARP系統(tǒng)中導出科研論文、會議論文、專著等產(chǎn)出物信息,并將這些數(shù)據(jù)轉(zhuǎn)換和導入IR的處理。在與研究所圖書館網(wǎng)站、研究所門戶網(wǎng)站的鏈接和集成方面,也提供了基于IR公共檢索API及SRW/U標準的嵌入和集成機制。隨著IR應用的逐步 深入,將進一步對IR的SRW/U接口進行優(yōu)化,并啟動OpenURL的支持,逐步以標準的方式集成到有關(guān)的公共檢索和服務系統(tǒng)中,如與中國科學院國家科學圖書館的集成檢索服務平臺的集成,使IR中有關(guān)的知識信息能在更大的范圍內(nèi)被檢索、發(fā)現(xiàn)和利用。
  
  3 全院聯(lián)合的機構(gòu)倉儲服務系統(tǒng)建設(shè)
  
  這是整個計劃實施的第二階段,將包括兩方面的工作:第一,在全院范圍內(nèi)開展IR的推廣和部署。即:根據(jù)第一階段IR的試點應用和部署,在形成功能完善、性能穩(wěn)定的IR應用軟件基礎(chǔ)上,舉辦面向研究所科技管理人員、圖書信息管理及應用人員的集中培訓,并針對不同研究所的情況,通過現(xiàn)場安裝、自助安裝或者遠程安裝方式進行系統(tǒng)的安裝、部署和上線應用。
  第二,開發(fā)OAI元數(shù)據(jù)收割系統(tǒng),對逐步部署和應用起來的研究所IR實施元數(shù)據(jù)收割與再組織,建立起全院聯(lián)合的機構(gòu)倉儲服務系統(tǒng)。
  在全院聯(lián)合機構(gòu)倉儲服務系統(tǒng)的建設(shè)過程中,我們?nèi)匀灰訢Space系統(tǒng)作為基礎(chǔ),通過擴展OAI元數(shù)據(jù)收割功能的支持,以形成全院聯(lián)合的機構(gòu)知識門戶服務系統(tǒng)。在OAI元數(shù)據(jù)收割系統(tǒng)的擴展開發(fā)過程中,也沿用了基于開源軟件以加快開發(fā)進度和節(jié)省開發(fā)成本的策略,選擇了OCLC發(fā)布的開源軟件OAI Hal"vester2.0,并通過定制開發(fā)實現(xiàn)了與DSpace系統(tǒng)的集成。
  在集成的過程中,涉及的關(guān)鍵問題包括:①元數(shù)據(jù)收割器的定制。其中涉及對目標倉儲系統(tǒng)列表的維護,元數(shù)據(jù)獲取的控制,增量更新獲取的調(diào)度與控制以及基于多線程的多目標倉儲的并發(fā)搜尋與元數(shù)據(jù)獲取等。②:XMIL數(shù)據(jù)解析器的實現(xiàn)。即通過從OAIHarvester獲取的XMIL格式的數(shù)據(jù)文件將需要的元數(shù)據(jù)信息解析出來,進行必要的規(guī)范化和歸并處理,為載入DSpace做好準備。③數(shù)據(jù)批量導入接口的實現(xiàn)。即將解析并規(guī)范化處理后的元數(shù)據(jù)按照DSpace系統(tǒng)可以接受的格式,載入DSpace系統(tǒng)。
  同時,聯(lián)合機構(gòu)倉儲服務系統(tǒng)繼續(xù)保持對OAI、SRW/U、RSS等開放接口的支持,保證其與全院層面上有關(guān)信息服務系統(tǒng)的方便集成。如與中國科學院國家科學圖書館的集成檢索系統(tǒng)是基于SRW/U的標準化檢索集成等。
  
  4 結(jié)語
  
  到目前為止,我們已經(jīng)完成了示范性IR的構(gòu)建和部署,全院聯(lián)合機構(gòu)倉儲服務實驗系統(tǒng)也正在開發(fā)完善之中,而且很多研究所對IR的建設(shè)都積極響應,愿意早日實施本所的IR。
  在建設(shè)過程中,我們也吸取了許多的經(jīng)驗和教訓。例如:
  ?研究所的機構(gòu)倉儲建設(shè),技術(shù)手段不是關(guān)鍵問題,了解研究所需求,按照研究所的相關(guān)機制定制和擴展相應的倉儲系統(tǒng)才是重中之重。特別是在當前一個中國科學院研究所圖書館(室)的工作人員平均不到3人的情況下,研究所IR的提交和管理流程需要大力簡化。
  ?研究所IR的建設(shè)必須考慮到研究所已有的信息系統(tǒng)。在當前研究所中存在著ARP系統(tǒng)、圖書館自動化系統(tǒng)等,IR的建設(shè)必須與這些系統(tǒng)實現(xiàn)有機的集成和共享,一方面避免數(shù)據(jù)的重復錄入;另一方面要避免構(gòu)建一個個孤立的系統(tǒng)。
  ?提前規(guī)劃十分重要。在研究所IR的建設(shè)中,需要提前為研究所規(guī)劃。在實踐中,我們提出了包括政策、流程、機制、技術(shù)、管理各個環(huán)節(jié)在內(nèi)的一系列建設(shè)指南和最佳實踐方案,供研究所參考。
  ?研究所IR應當是一個開放系統(tǒng)。國家科學圖書館構(gòu)建聯(lián)合的機構(gòu)倉儲系統(tǒng),目標在于提升全院的信息服務能力,為此我們?yōu)檠芯克鵌R提供了SRU等檢索接口,使授權(quán)用戶能夠通過SRU規(guī)范檢索倉儲系統(tǒng),提高倉儲系統(tǒng)的集成能力。
  盡管走了一些彎路,但是通過實踐,我們也增強了信心,希望進一步了解和把握研究所的需求,爭取他們的支持和配合,盡快在全院范圍內(nèi)逐步推廣和部署,并最終形成有一定規(guī)模的聯(lián)合機構(gòu)倉儲服務系統(tǒng)。

相關(guān)熱詞搜索:中國科學院 倉儲 機構(gòu) 中國科學院聯(lián)合機構(gòu)倉儲系統(tǒng)的開發(fā)與建設(shè) 中國科學院機構(gòu)倉儲的建設(shè) 倉儲論文題目

版權(quán)所有 蒲公英文摘 www.newchangjing.com