數(shù)字圖書館系統(tǒng) 利用開放存取資源建立個(gè)人數(shù)字圖書館
發(fā)布時(shí)間:2020-03-07 來源: 日記大全 點(diǎn)擊:
[摘要]從開放存取與個(gè)人數(shù)字圖書館的關(guān)系出發(fā),按照個(gè)人數(shù)字圖書館建立步驟,構(gòu)建其應(yīng)有的模塊。在此基礎(chǔ)上分析個(gè)人數(shù)字圖書館開源軟件的選擇、個(gè)人數(shù)字圖書館中開放存取資源的采集、與自建數(shù)字資源的整合,最后闡述如何利用個(gè)人數(shù)字圖書館及其中的開放存取資源服務(wù)于個(gè)人。
[關(guān)鍵詞]開放存取資源 個(gè)人數(shù)字圖書館 開源軟件
[分類號(hào)]G253
1945年,被譽(yù)為“信息科學(xué)之父”的Vannevar Bush在“誠(chéng)如所思”一文中描述了一個(gè)個(gè)人圖書館Memex,個(gè)人將自己的圖書、記錄和交流信息存儲(chǔ)在Memex設(shè)備中,進(jìn)行組織,以便于快速查找。該文被尊稱為情報(bào)學(xué)誕生的標(biāo)志。個(gè)人數(shù)字圖書館就是其實(shí)現(xiàn)方式之一。
個(gè)人數(shù)字圖書館早在上個(gè)世紀(jì)90年代就引起了一些專家的注意,如國(guó)外的Cathy Marshall在個(gè)人數(shù)字文檔的服務(wù)模型、評(píng)價(jià)、保存和利用方面做了大量的調(diào)查,對(duì)其中存在的挑戰(zhàn)提出了自己的看法。也有一些學(xué)者建立了個(gè)人數(shù)字圖書館促進(jìn)個(gè)人的研究、工作和生活質(zhì)量的提高。開放存取運(yùn)動(dòng)的發(fā)展則為個(gè)人數(shù)字圖書館的建立提供了更多的便利。本文擬討論如何利用OA資源建立個(gè)人數(shù)字圖書館。
1 從個(gè)人數(shù)字圖書館概念看開放存取資源與個(gè)人數(shù)字圖書館的關(guān)系
個(gè)人數(shù)字圖書館,是指?jìng)(gè)人為了讀書治學(xué)的目的,在自己的計(jì)算機(jī)上采用免費(fèi)的或基本免費(fèi)的全文數(shù)據(jù)庫(kù)軟件,將有關(guān)的網(wǎng)上信息和自創(chuàng)的數(shù)字化信息資源進(jìn)行采集、存儲(chǔ),使之成為有組織的信息集合,以供個(gè)人有效利用。該定義有3個(gè)關(guān)鍵點(diǎn):
第一,個(gè)人數(shù)字圖書館軟件為免費(fèi)的或基本免費(fèi)的。開源軟件是開放存取資源的重要類型,它不限制用戶的使用權(quán)限,允許用戶更改、復(fù)制和傳播開放源代碼。從用戶角度而言,開源軟件不需要付費(fèi),還能根據(jù)個(gè)人的需求更改設(shè)置。很多數(shù)字圖書館開源軟件已經(jīng)得到應(yīng)用,如Eprint、Dspace、Fedora、Greenstone和CWIS,其功能基本可滿足個(gè)人數(shù)字圖書館的需要。因而,開源軟件是建立個(gè)人數(shù)字圖書館相對(duì)理想的軟件。
第二,個(gè)人數(shù)字圖書館中的信息資源由兩部分構(gòu)成――可以采集與存儲(chǔ)的網(wǎng)上信息和自創(chuàng)的數(shù)字化信息資源。后者數(shù)量有限,且因人而異,因而前者應(yīng)該是個(gè)人數(shù)字圖書館信息資源的主體,即個(gè)人生活、工作、學(xué)習(xí)與研究所需的大量資源要依靠網(wǎng)絡(luò)進(jìn)行采集。絕大多數(shù)商用數(shù)字資源需要付費(fèi)或者授權(quán)方可獲得,一般的個(gè)人用戶不可能像圖書館那樣能夠購(gòu)買或者擁有很多學(xué)術(shù)資源,對(duì)這些資源的獲取和利用相對(duì)困難,開放存取資源(open access resources,以下簡(jiǎn)稱OA資源)則可在很大程度上解決該問題。OA資源最大的優(yōu)勢(shì)就在于其免費(fèi)性,用戶只要遵循相應(yīng)的協(xié)議,就可任意復(fù)制、打印或下載這些資源。國(guó)際上著名的OA資源目錄、OA資源注冊(cè)站點(diǎn)和ISI等機(jī)構(gòu)的統(tǒng)計(jì)與調(diào)查表明,OA資源來源廣泛、形式與涉及的主題多樣,數(shù)量在不斷增加,質(zhì)量也在不斷提高,故其有充分的理由成為個(gè)人數(shù)字圖書館重要的信息資源。
第三,個(gè)人數(shù)字圖書館中的資源要經(jīng)過組織才能被個(gè)人有效利用。個(gè)人對(duì)信息資源的內(nèi)容、形態(tài)以及個(gè)人數(shù)字圖書館功能的需求千差萬別,開源數(shù)字圖書館軟件具有的可以根據(jù)個(gè)人需要進(jìn)行設(shè)置的功能以及上文所述的OA資源的特點(diǎn)可以滿足用戶的差異性需求。
因此,利用開放存取資源建立個(gè)人數(shù)字圖書館是必要的、也是可行的。
2 個(gè)人數(shù)字圖書館的功能及模塊構(gòu)建
2.1 個(gè)人數(shù)字圖書館的功能
從上述個(gè)人數(shù)字圖書館定義可以看出,個(gè)人數(shù)字圖書館應(yīng)該含有適合人們的行為、技能、習(xí)慣的靈活的工具,允許人們按照自己的意愿聚集、管理和共享他們的信息資源。它是一系列資源和服務(wù)的結(jié)合,能夠支撐創(chuàng)造、利用、再利用、保存或者處理的信息生命周期和資源查找、組織、利用和共享的學(xué)習(xí)周期。但同時(shí)個(gè)人數(shù)字圖書館使用應(yīng)該盡量簡(jiǎn)單方便,不需要人們花費(fèi)太多的時(shí)間來管理,否則人們會(huì)淹沒在大多數(shù)沒有經(jīng)過整理的資源中而無所適從。
2.2個(gè)人數(shù)字圖書館的模塊構(gòu)建
綜合上述個(gè)人數(shù)字圖書館功能,結(jié)合一般用戶的學(xué)習(xí)與研究習(xí)慣和對(duì)學(xué)習(xí)資源利用的特點(diǎn),從資源搜集、整理到利用的需要出發(fā),筆者認(rèn)為,個(gè)人數(shù)字圖書館應(yīng)該具備的功能模塊如圖1所示:
在圖1中,資源層主要收集從網(wǎng)絡(luò)上獲得的OA資源;資源層與服務(wù)層之間的組織層整合從網(wǎng)上采集的信息資源和自創(chuàng)的數(shù)字信息資源;經(jīng)過組織整理后通過服務(wù)層查詢和共享;輔助層為資源層和服務(wù)層提供必要的支持,包括數(shù)據(jù)備份、數(shù)據(jù)移植、個(gè)性化界面設(shè)置、實(shí)時(shí)幫助等。交互層則支持個(gè)人數(shù)字圖書館與他人的個(gè)人數(shù)字圖書館、公共數(shù)字圖書館和數(shù)字倉(cāng)儲(chǔ)通過互操作協(xié)議進(jìn)行交互或者共享資源和服務(wù)。
3 選擇開源軟件作為個(gè)人數(shù)字圖書館的建設(shè)軟件
構(gòu)建好個(gè)人數(shù)字圖書館模塊之后,需要選擇合適的軟件進(jìn)行具體的操作。如前所述,出于經(jīng)濟(jì)上的考慮,開源軟件是建立個(gè)人數(shù)字圖書館相對(duì)理想的軟件。在眾多的開源軟件中選擇一款合適者需要考慮一些因素。
3.1 選擇個(gè)人數(shù)字圖書館開源軟件應(yīng)考慮的因素
個(gè)人數(shù)字圖書館軟件是構(gòu)建個(gè)人數(shù)字圖書館的基礎(chǔ),尤其是建立于個(gè)人計(jì)算機(jī)之上的個(gè)人數(shù)字圖書館,個(gè)人信息資源組織和檢索也依賴于軟件所支持的功能。軟件選擇的合適與否直接關(guān)系到以后的利用是否便利。目前適合構(gòu)建個(gè)人數(shù)字圖書館的開源軟件主要是開源數(shù)字圖書館軟件。
《開源數(shù)字圖書館軟件評(píng)價(jià)一覽表》一文從內(nèi)容管理、用戶界面、用戶管理、系統(tǒng)管理和其他要求5個(gè)方面對(duì)目前流行的4種開源軟件(CDSware、Eprints、Fedora和Greenstone)進(jìn)行了比較分析,認(rèn)為Greenstone是最好的開源數(shù)字圖書館軟件!皵(shù)字機(jī)構(gòu)倉(cāng)儲(chǔ)學(xué)習(xí)研討項(xiàng)目”(Learning About Digital Institutional Repositories Seminars programme,簡(jiǎn)稱LEADIRS)在機(jī)構(gòu)倉(cāng)儲(chǔ)軟件平臺(tái)部分詳細(xì)說明了選擇軟件應(yīng)該考慮的因素,包括:基本技術(shù)構(gòu)建模塊、產(chǎn)品特色模塊、技術(shù)產(chǎn)品模型、運(yùn)行服務(wù)要求的其他技術(shù)、主要研究提供者等。開源數(shù)字圖書館軟件主要是為圖書館、機(jī)構(gòu)等建立大型數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)儲(chǔ)而設(shè)計(jì)的,如將其運(yùn)用于個(gè)人數(shù)字圖書館中則還有一些特殊的要求。在選擇個(gè)人數(shù)字圖書館軟件時(shí)應(yīng)該考慮的因素如下:
3.1.1 軟件功能 軟件是為個(gè)人服務(wù)的,軟件功能是否齊全并符合個(gè)人需求就成為用戶考慮的重點(diǎn)因素。具體細(xì)節(jié)如:元數(shù)據(jù)能否自動(dòng)生成;用戶能否選擇元數(shù)據(jù)格式并對(duì)其進(jìn)行分類、瀏覽和檢索;用戶可否添加、刪除元數(shù)據(jù)元素,等等。
3.1.2 語種及本地化程度 是否提供了多語種、軟件是否本地化也是用戶考慮的因素。目前一些開源軟件建立了自己的聯(lián)盟,世界各地的人都可以成為其開發(fā)者。如果軟件能 提供用戶熟悉的語言,用戶選擇的余地會(huì)更大。
3.1.3 軟件支撐技術(shù) 是否支持通用的操作系統(tǒng)、安裝是否便利、軟件更新是否會(huì)給原有數(shù)據(jù)帶來麻煩、是否提供數(shù)據(jù)備份及恢復(fù)也是用戶在選擇軟件時(shí)考慮的因素。
3.2 易用的Greenstone可作為個(gè)人數(shù)字圖書館軟件的優(yōu)先選擇
根據(jù)上述考慮因素和開源軟件的性能以及Greenstone開發(fā)者的介紹,著重考察功能的全面性、易用性、靈活性和可擴(kuò)展性,筆者選擇Greenstone軟件建立了微型的個(gè)人數(shù)字圖書館。筆者在使用中發(fā)現(xiàn),Greenstone具備了個(gè)人數(shù)字圖書館的主要功能:
資源采集服務(wù)。①幫助用戶將個(gè)人計(jì)算機(jī)上的自創(chuàng)數(shù)字資源直接導(dǎo)入到數(shù)據(jù)庫(kù)中;②提供搜索下載界面,運(yùn)用HTTP協(xié)議從網(wǎng)上下載資源,支持下載遵循OAI協(xié)議、Z39.50/SRW等互操作協(xié)議的數(shù)字倉(cāng)儲(chǔ)中的資源;③內(nèi)嵌有MideaWiki開源搜索引擎軟件,在檢索框中輸入關(guān)鍵詞,就可以在網(wǎng)絡(luò)上搜索。當(dāng)然,開放存取資源的收集、評(píng)價(jià)與知識(shí)產(chǎn)權(quán)保護(hù)等問題都是開放存取資源采集工作中需要考慮的,本專題其他論文分別進(jìn)行了專門的討論,這里不再贅述。
資源組織服務(wù)。允許用戶采用文件夾的方式組織信息,用戶可以新建文件夾,建立文件夾等級(jí)結(jié)構(gòu)。文件夾內(nèi)的文獻(xiàn)采用元數(shù)據(jù)進(jìn)行組織,提供多種元數(shù)據(jù)格式供用戶選擇,默認(rèn)的元數(shù)據(jù)格式為DC元數(shù)據(jù)?梢詫煞N不同的元數(shù)據(jù)集融合,也可以運(yùn)用輔助工具Greenstone元數(shù)據(jù)集編輯器(Greenstone Editor for Metadata Sets,GEMS)修改現(xiàn)在的元數(shù)據(jù)。
查詢服務(wù)。①允許用戶像平時(shí)瀏覽硬盤文件那樣瀏覽該系統(tǒng)的文件,也可以按照作者、題名、日期、文件夾等瀏覽;②可以同時(shí)在多個(gè)文件夾中檢索,也可以檢索元數(shù)據(jù)的某一具體元素;③支持全文檢索;④支持信息過濾功能,如可選擇只顯示某一格式如HTML、XML的文件;⑤提供插件供用戶自行設(shè)置,擴(kuò)展符合用戶需要的特定檢索功能需求。
支持與其他數(shù)據(jù)倉(cāng)儲(chǔ)之間及元數(shù)據(jù)層面的共享。用戶可以通過StoneD將Greenstone的內(nèi)容導(dǎo)入Dspace中,也可以將Dspaee的內(nèi)容導(dǎo)入到Greenstone中。Greenstone使用的特殊格式遵循元數(shù)據(jù)編碼與傳輸標(biāo)準(zhǔn)(Metadata Enco-ding and Transmission Standard,簡(jiǎn)稱METS),其元數(shù)據(jù)可以導(dǎo)出到METS中,也可從METS中導(dǎo)入元數(shù)據(jù)。用戶還可以將個(gè)人數(shù)字圖書館中的資源發(fā)布到網(wǎng)絡(luò)上。
其他功能。包括界面?zhèn)性化設(shè)置、支持多種文件格式、隨時(shí)都有幫助功能、軟件更新不會(huì)影響數(shù)據(jù)的使用等。
從前文所述不難看出,Greenstone基本上可滿足用戶建立個(gè)人數(shù)字圖書館的需求,并且功能可以根據(jù)用戶自身的需求設(shè)置,有較強(qiáng)的靈活性,操作簡(jiǎn)單,適合各類人群使用。不過,與上述個(gè)人數(shù)字圖書館功能需求還有一定的差距,用戶在選擇時(shí)可以根據(jù)自身需求和使用習(xí)慣選擇貼近自己需求、功能齊全的軟件。
4 采集開放存取資源作為個(gè)人數(shù)字圖書館的主要信息資源
“巧婦難為無米之炊”,個(gè)人數(shù)字圖書館要滿足個(gè)人的需要,信息資源建設(shè)是基礎(chǔ)。如前所述,個(gè)人數(shù)字圖書館信息資源的主體是開放存取資源。搜索引擎是人們獲取OA資源的重要途徑。個(gè)人數(shù)字圖書館可以將搜索工具欄嵌入到系統(tǒng)中,用戶直接從個(gè)人數(shù)字圖書館就可以搜索下載外部的OA資源。RSS訂閱功能夠免除用戶登陸各個(gè)信息提供網(wǎng)站的麻煩,使用戶能了解該領(lǐng)域的最新信息,這也是資源采集的重要來源。越來越多的開放存取站點(diǎn)開始提供RSS訂閱功能。用戶可將專門的開放存取資源RSS閱讀器嵌入到軟件中,每天都能及時(shí)看到該學(xué)科最新的OA資源。用戶還可以通過互操作協(xié)議對(duì)其他個(gè)人數(shù)字圖書館或者OA倉(cāng)儲(chǔ)的資源直接進(jìn)行采集。
5 整合個(gè)人數(shù)字圖書館中的開放存取資源與自創(chuàng)的數(shù)字信息資源
有組織的信息集合才能實(shí)現(xiàn)個(gè)人數(shù)字圖書館的功能。個(gè)人自創(chuàng)的數(shù)字信息資源采用不同的軟件,有不同的格式。OA資源來源廣泛,類型多樣,既有文本資源,也有網(wǎng)頁(yè)資源,有時(shí)甚至是某一博客或者學(xué)科倉(cāng)儲(chǔ)的具體網(wǎng)址。如何對(duì)它們進(jìn)行有效的整合,使其既能符合用戶的資源組織習(xí)慣又能方便用戶查詢與共享,是一道難題。
國(guó)外對(duì)一些用戶的調(diào)查表明,用戶在網(wǎng)絡(luò)時(shí)代還是更傾向于采用文件夾等級(jí)結(jié)構(gòu)的形式管理自己的資源。《個(gè)人信息管理組織結(jié)構(gòu)述評(píng)》一文對(duì)用戶經(jīng)常使用的幾種組織方式如等級(jí)結(jié)構(gòu)、線性結(jié)構(gòu)、扁平結(jié)構(gòu)等進(jìn)行了具體分析,認(rèn)為等級(jí)結(jié)構(gòu)是用戶目前使用最多的個(gè)人信息組織方式。使用文件夾等級(jí)結(jié)構(gòu)符合用戶的使用習(xí)慣,組織形式簡(jiǎn)單快捷,可存儲(chǔ)多種類型的信息資源。
隨著個(gè)人數(shù)字圖書館OA資源與自創(chuàng)數(shù)字資源的不斷豐富,用戶希望盡快找到自己所需的特定文獻(xiàn)單元甚至知識(shí)單元,但是利用文件夾組織資源不能深層次地揭示文獻(xiàn)的內(nèi)容,如果文件過多,要進(jìn)行有效地揭示和組織較困難,也不利于檢索。元數(shù)據(jù)已經(jīng)成為揭示網(wǎng)絡(luò)資源的首選方式,它簡(jiǎn)單方便,又能深層次揭示資源內(nèi)容,便于用戶對(duì)自創(chuàng)數(shù)字資源與OA資源進(jìn)行揭示。許多OA資源列表和登記機(jī)構(gòu)都采用元數(shù)據(jù)來描述資源,而這些資源正是用戶采集的來源。將個(gè)人數(shù)字圖書館中的OA資源用元數(shù)據(jù)來描述,不僅能夠直接從OA資源列表中下載,也能方便用戶按照自己的習(xí)慣選擇合適的元數(shù)據(jù)元素。METS的出現(xiàn)也為實(shí)現(xiàn)元數(shù)據(jù)層面的共享提供了條件。它采用XML形式表示,可將有關(guān)數(shù)字化資源的元數(shù)據(jù)打包,包括所有描述性和管理性的元數(shù)據(jù)。與OA資源揭示密切相關(guān)的標(biāo)準(zhǔn)之一OAI-PMH協(xié)議也對(duì)XML形式的元數(shù)據(jù)進(jìn)行采集,對(duì)實(shí)現(xiàn)元數(shù)據(jù)層面的資源共享具有很好的促進(jìn)作用。
因此,用戶可以根據(jù)自己的使用習(xí)慣和需要,將個(gè)人數(shù)字圖書館中的OA資源和自創(chuàng)數(shù)字資源利用文件夾進(jìn)行簡(jiǎn)單的學(xué)科分類,文件夾中的具體內(nèi)容則按照元數(shù)據(jù)來描述,既方便資源的組織與管理,也便于查詢和共享。
6 利用個(gè)人數(shù)字圖書館及其中的開放存取資源服務(wù)于個(gè)人
開放存取運(yùn)動(dòng)提供了免費(fèi)、開放的學(xué)術(shù)信息自由存取的環(huán)境,這為個(gè)人進(jìn)行學(xué)術(shù)研究提供了條件,為用戶在第一時(shí)間了解該領(lǐng)域最新開展的研究及其成果提供了可能。用戶在建立個(gè)人數(shù)字圖書館學(xué)術(shù)館藏時(shí),以自己的需要為基準(zhǔn),按照某一主題或者研究領(lǐng)域進(jìn)行搜集,將網(wǎng)上的OA資源進(jìn)行整理并加以利用。因此,個(gè)人數(shù)字圖書館的館藏質(zhì)量高、針對(duì)性強(qiáng),收錄信息范圍專深,是個(gè)人的知識(shí)倉(cāng)儲(chǔ),能充分滿足個(gè)性化學(xué)習(xí)的需求。
個(gè)人數(shù)字圖書館中的OA資源便于用戶進(jìn)行知識(shí)創(chuàng)新。信息的獲取是創(chuàng)新的基礎(chǔ)。創(chuàng)新需要人們從多種渠道收集多種類型的信息,有時(shí)甚至是收集多個(gè)學(xué)科的知識(shí)。用戶可利用這些知識(shí)擴(kuò)大自己的視野,將其和自己的學(xué)習(xí)相結(jié)合,從而創(chuàng)造出自己的新觀點(diǎn)、框架和模型等。OA資源類型的多樣性和個(gè)人數(shù)字圖書館內(nèi)容的多元化為知識(shí)創(chuàng)新提供了條件。個(gè)人數(shù)字圖書館為這些多來源多類型的信息提供了聚集之地,為他們的科研成果產(chǎn)出提供了便利。它允許人們以一種新的、有效的方式對(duì)知識(shí)進(jìn)行選擇、組織、利用和再利用。個(gè)人數(shù)字圖書館是許多工具的集成,能夠讓我們管理創(chuàng)造性的知識(shí)。
綜上所述,個(gè)人數(shù)字圖書館的建設(shè)軟件、其信息資源的主體都是開放存取資源,利用OA資源建立個(gè)人數(shù)字圖書館可在不增加開支的情況下,使個(gè)人的生活、學(xué)習(xí)與研究資源大大增加。隨著開放存取資源的不斷增多以及Web2.O和Library2.0等開放理念的不斷深入人心,這種增長(zhǎng)是可持續(xù)的,也會(huì)使OA資源得到更廣泛的傳播。可以預(yù)見,利用開放存取資源建立個(gè)人數(shù)字圖書館具有廣闊的前景,可加速個(gè)人與社會(huì)知識(shí)創(chuàng)新的進(jìn)程,促進(jìn)全社會(huì)個(gè)性化學(xué)習(xí)環(huán)境的發(fā)展,有助于形成泛在的學(xué)習(xí)環(huán)境。
責(zé)任編輯:易 飛
相關(guān)熱詞搜索:存取 數(shù)字圖書館 利用 利用開放存取資源建立個(gè)人數(shù)字圖書館 開放存取資源圖書館 oalib開放存取資源圖書館
熱點(diǎn)文章閱讀