[知識(shí)組織最新研究與實(shí)踐進(jìn)展]請(qǐng)組織在實(shí)踐中考驗(yàn)我
發(fā)布時(shí)間:2020-03-07 來源: 人生感悟 點(diǎn)擊:
[摘要]選取知識(shí)組織領(lǐng)域的幾個(gè)前沿問題,反映其在理論研究和實(shí)踐應(yīng)用方面的最新進(jìn)展。首先,書目記錄功能需求(FRBR)深刻影響著AACR2和ISBD的發(fā)展,并促進(jìn)了全球智力資源的共享;本體作為一種工具廣泛應(yīng)用于知識(shí)組織乃至信息檢索領(lǐng)域,使用本體改造受控詞表成為熱點(diǎn)問題之一;受控語言與自然語言的融合,網(wǎng)絡(luò)環(huán)境下傳統(tǒng)知識(shí)組織工具的改造與應(yīng)用亦為這一領(lǐng)域研究的前沿和重點(diǎn);隨著草根理論的興起,大眾分類法也逐漸進(jìn)入研究者的視野,在促進(jìn)用戶信息交流和知識(shí)共享中起著重要的作用。
[關(guān)鍵詞]書目記錄功能需求 本體 網(wǎng)絡(luò)分類法 術(shù)語 自由分類法
[分類號(hào)]G352
知識(shí)組織是情報(bào)學(xué)的重要前沿領(lǐng)域之一,所覆蓋的范圍十分廣闊,本文僅選取近5―10年來發(fā)展迅速的幾個(gè)分支進(jìn)行評(píng)述。同時(shí),這一領(lǐng)域體現(xiàn)出明顯的理論和實(shí)踐相互影響促進(jìn)的特征。理論方面,書目記錄功能需求和本體是這一時(shí)期研究的重點(diǎn);實(shí)踐方面,對(duì)網(wǎng)絡(luò)知識(shí)組織工具,尤其是自Web2.0誕生以來,對(duì)自由分類法的研究成為領(lǐng)域的前沿和熱點(diǎn)。此外,作為理論和實(shí)踐連接的橋梁,自然語言與受控語言融合的研究一直為研究者所關(guān)注。本文選取上述方面,以從“精英”到“草根”為邏輯線索,對(duì)這一領(lǐng)域進(jìn)行評(píng)述。
1 關(guān)于“書目記錄功能需求”的研究
“書目記錄功能需求”(FRBR)是IFLA在20世紀(jì)末推出的一個(gè)概念框架,旨在提供一個(gè)明確定義的、將書目記錄中的數(shù)據(jù)與用戶需求關(guān)聯(lián)起來的結(jié)構(gòu)化框架。它向國家書目機(jī)構(gòu)推薦書目記錄所應(yīng)具有的基本功能。FRBR提出10年來,對(duì)圖書情報(bào)界的影響日益增大,其概念結(jié)點(diǎn)和關(guān)系的定義對(duì)知識(shí)組織系統(tǒng)的完善有十分重要的作用,導(dǎo)致AACR2和ISBD也根據(jù)FRBR的概念框架進(jìn)行了修訂。這是IFLA長期致力于改善書目工作,促進(jìn)全球編目統(tǒng)一化的必然結(jié)果,將有助于全球知識(shí)的無障礙共享。
目前,對(duì)FRBR的研究主要側(cè)重在以下三個(gè)方面:①FRBR的適用性研究。FRBR是一個(gè)概念框架,其適用性仍然有待時(shí)間來檢驗(yàn)。國內(nèi)對(duì)FRBR的適用性研究逐漸增多,為其應(yīng)用奠定了一定的基礎(chǔ)。②FR-BR對(duì)編目工作的影響研究。Mimno等人研究了FRBR在書目記錄中的實(shí)現(xiàn)問題,認(rèn)為基于FRBR的等級(jí)目錄結(jié)構(gòu)在數(shù)字圖書館中具有很大的優(yōu)勢(shì),但同時(shí)也可能增加檢索的復(fù)雜程度。他們還認(rèn)為,標(biāo)識(shí)符在這樣的(等級(jí))目錄中起到了非常重要的作用。③文獻(xiàn)編目的發(fā)展研究。FRBR的出現(xiàn)引發(fā)人們思考一個(gè)問題:編目工作將向何處去?對(duì)AACR2的修訂和對(duì)RDA的研究能說明一些問題。RDA的目的是支持FRBR用戶任務(wù),提供FRBR用戶任務(wù)無法提供的服務(wù),幫助用戶恰當(dāng)?shù)匕l(fā)現(xiàn)和使用資源。
我們發(fā)現(xiàn),F(xiàn)RBR所影響的不僅僅是編目工作本身,而且,通過書目關(guān)系的深刻揭示和書目控制的進(jìn)一步強(qiáng)化,可以促進(jìn)全球知識(shí)資源的共享。其具體理由是:①FRBR對(duì)書目關(guān)系的揭示。由于FRBR采用ER模型而非全部依賴描述性分析,F(xiàn)RBR中的實(shí)體通過等級(jí)結(jié)構(gòu)和關(guān)系構(gòu)成概念網(wǎng)絡(luò),實(shí)體成為概念網(wǎng)絡(luò)中的結(jié)點(diǎn),具有自身的屬性,實(shí)體之間通過關(guān)系構(gòu)成網(wǎng)絡(luò)的邊。這樣,就使得它對(duì)書目關(guān)系的揭示更為深刻,就有可能為用戶提供更為準(zhǔn)確、全面的檢索結(jié)果。②FRBR對(duì)書目控制的強(qiáng)化。在FRBR中,作品與底層的資源實(shí)體相分離,強(qiáng)化了對(duì)智力(或藝術(shù))作品的描述,使書目記錄與規(guī)范文檔的聯(lián)系更加密切,使圖書館和其他的信息資源生產(chǎn)者、持有者能更好地管理和利用隱藏在知識(shí)海洋中的智力資產(chǎn),能更好地反映書目資源、文獻(xiàn)資源和智力資源的配置狀況,并促進(jìn)信息資源共享。
2 關(guān)于本體與傳統(tǒng)知識(shí)組織工具改造的研究
2.1本體最新研究進(jìn)展
本體(論)是一個(gè)古老而又年輕的研究領(lǐng)域。從古希臘時(shí)代開始,各個(gè)時(shí)期的哲學(xué)家對(duì)這一哲學(xué)命題都有較多的討論。到近現(xiàn)代,認(rèn)識(shí)論漸漸取代本體論在哲學(xué)中的主導(dǎo)地位。隨著計(jì)算機(jī)科學(xué)技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,本體開始受到科技界的重視。20世紀(jì)90年代以來,計(jì)算機(jī)科學(xué)、信息科學(xué)和情報(bào)學(xué)對(duì)本體(論)均進(jìn)行不少的研究及應(yīng)用探索。不同的是,這一次本體脫去了形而上學(xué)的神秘面紗,以一種器具的形式為研究者所接受。其中,情報(bào)學(xué)界對(duì)本體的研究側(cè)重于以下三個(gè)方面:①領(lǐng)域本體的構(gòu)造。在數(shù)字圖書館領(lǐng)域,人們研究了如何構(gòu)建面向數(shù)字資源組織的領(lǐng)域本體,用來取代傳統(tǒng)的知識(shí)組織工具和提供檢索服務(wù)。對(duì)于大規(guī)模本體的研究開發(fā)工作,貢獻(xiàn)更多的則是知識(shí)工程領(lǐng)域的專家,以Noy和Gruber的研究為代表。②傳統(tǒng)知識(shí)組織工具的改造研究(見本文2.2小節(jié))。③本體在信息檢索中的應(yīng)用研究。筆者在本刊2008年第3期的一篇文章中討論了本體在情報(bào)檢索中的主要應(yīng)用,包括自然語言語義和跨語言信息檢索等。此外,一些研究人員還探索了本體在網(wǎng)絡(luò)搜索和專門領(lǐng)域信息檢索中的應(yīng)用,取得了一定的效果。
2.2傳統(tǒng)知識(shí)組織工具的改造
隨著本體的研究越來越熱,情報(bào)學(xué)界對(duì)傳統(tǒng)知識(shí)組織工具的本體化改造這一課題也越來越感興趣。這方面的研究者看重的是本體所蘊(yùn)含的豐富的語義關(guān)系和強(qiáng)大的推理功能。與本體相比,傳統(tǒng)的知識(shí)組織系統(tǒng)的語義關(guān)系顯然不夠豐富,推理功能亦受到語義關(guān)系豐富度的限制而難以實(shí)現(xiàn)。在實(shí)踐探索中,傳統(tǒng)知識(shí)組織工具的本體化改造主要有三種模式:①使用本體對(duì)傳統(tǒng)知識(shí)組織工具進(jìn)行表示。曾新紅使用OWL語言對(duì)《中國分類主題詞表》進(jìn)行本體化改造的研究側(cè)重于語義表示層。她詳細(xì)地闡述了在改造過程中如何建立概念模式、定義類和屬性,以及深層語義的表示問題。②使用實(shí)例數(shù)據(jù)豐富現(xiàn)有的知識(shí)組織工具。王軍研究了如何利用題名和文摘中的主題信息和詞匯去豐富原有的知識(shí)組織系統(tǒng)(分類法和主題法)的技術(shù)。他通過挖掘以題名和文摘形式出現(xiàn)的文獻(xiàn)替代品中的詞匯共現(xiàn)信息及其它特征來豐富知識(shí)組織系統(tǒng)的關(guān)系。③在已有知識(shí)組織工具的基礎(chǔ)上豐富其語義關(guān)系和結(jié)構(gòu),進(jìn)而建立本體。這方面的研究和實(shí)踐以UMLS為代表,這是一個(gè)宏大的系統(tǒng)工程。
目前,傳統(tǒng)知識(shí)組織工具的本體化改造已經(jīng)取得了一批重要成果,但尚未確立相應(yīng)的規(guī)范和標(biāo)準(zhǔn),使得已有的理論和實(shí)踐成果難以推廣應(yīng)用和取得更好的應(yīng)用效果。為此,應(yīng)防止為了改造而改造的傾向。傳統(tǒng)的知識(shí)組織系統(tǒng)(分類法和主題法)在圖書館和信息機(jī)構(gòu)中已經(jīng)并將繼續(xù)起到非常重要的作用,其適應(yīng)性亦經(jīng)受了長期的檢驗(yàn)。只有在合適的環(huán)境和需求下,如數(shù)字圖書館和網(wǎng)絡(luò)環(huán)境以及對(duì)智能檢索的需求,它的改造才更有意義。
3 關(guān)于受控語言與自然語言融合的研究
隨著網(wǎng)絡(luò)的興起和網(wǎng)絡(luò)搜索引擎應(yīng)用的普及,編制適用于網(wǎng)絡(luò)信息資源管理的檢索工具和主題詞表或分類表,成為研究熱點(diǎn)。張琪玉先生提出應(yīng)積極為自然語言與情報(bào)檢索語言的結(jié)合創(chuàng)造條件,建議大量編制自然語言詞表。焦玉英和李法運(yùn)嘗試通過使受 控語言兼容化、組配化、標(biāo)準(zhǔn)化和系列化的方法優(yōu)化受控語言,同時(shí)對(duì)自然語言施以控制的方法優(yōu)化自然語言。張俊則通過結(jié)合關(guān)鍵詞和主題詞的方法討論信息檢索系統(tǒng)結(jié)構(gòu)(尤其是詞表結(jié)構(gòu))的優(yōu)化。鑒于為浩繁的網(wǎng)絡(luò)信息資源編制一個(gè)龐大的受控詞表成本過高,并非十分現(xiàn)實(shí),所以,張琪玉先生主張:“自然語言自由標(biāo)引模式是三種語言(類名、主題詞和關(guān)鍵詞,筆者注)一體化系統(tǒng)的較好選擇”。這些理論研究和嘗試為推進(jìn)兩者融合起到了一定作用。
人們普遍認(rèn)為,自然語言中的術(shù)語專指性高,有助于表達(dá)獨(dú)特的檢索需求和提高查準(zhǔn)率。同時(shí),網(wǎng)絡(luò)用戶在進(jìn)行網(wǎng)絡(luò)搜索時(shí)傾向于使用術(shù)語進(jìn)行搜索。對(duì)術(shù)語的研究可以成為自然語言與受控語言融合的突破口。術(shù)語的特征是規(guī)模較為穩(wěn)定,增長和更新速度較之日常生活用詞匯要慢許多。有研究表明,在網(wǎng)絡(luò)環(huán)境下使用術(shù)語做提問詞改善查準(zhǔn)率是可行的。谷歌也使用術(shù)語來優(yōu)化檢索和縮小檢索結(jié)果的范圍,提高查準(zhǔn)率。
但術(shù)語僅為語義檢索提供詞匯基礎(chǔ)。要真正實(shí)現(xiàn)語義檢索,僅依靠術(shù)語是不夠的,還需要有功能更強(qiáng)大的邏輯工具。本體及其他類似的邏輯工具的引入,不僅在傳統(tǒng)的知識(shí)組織工具的改造方面,而且在支持自然語言檢索和促進(jìn)受控語言與自然語言融合方面都有可能起到重要的作用。另外,還要看到,解決自然語言與受控語言融合問題,還需要深入研究邏輯學(xué)和語言學(xué),借鑒和引進(jìn)這兩個(gè)學(xué)科的研究方法和成果,深入分析受控語言的詞匯、句法結(jié)構(gòu)和語義結(jié)構(gòu)。從更基礎(chǔ)和宏觀的視角考察自然語言、受控語言和用戶的查詢語言在信息檢索系統(tǒng)中所起的作用。
4 網(wǎng)絡(luò)環(huán)境下知識(shí)組織研究
4.1網(wǎng)絡(luò)分類法
《中國圖書館分類法》、DDC和LCC等通常都是以一定的哲學(xué)思想為指導(dǎo),以知識(shí)或?qū)W科門類的劃分為基礎(chǔ),逐級(jí)展開的分類體系。這些分類法在圖書情報(bào)界傳統(tǒng)的信息管理中,其優(yōu)勢(shì)無庸置疑。然而,面對(duì)互聯(lián)網(wǎng),其局限性就很明顯了。主要是因?yàn)樾畔①Y源特征不同,網(wǎng)絡(luò)信息資源的異質(zhì)性要遠(yuǎn)高于圖書館館藏資源,網(wǎng)絡(luò)信息資源動(dòng)態(tài)性強(qiáng),使傳統(tǒng)分類法的適用性受到了很大挑戰(zhàn)。
盡管存在上述問題,人們?nèi)栽诓恍傅靥剿鞣诸惙ㄔ诰W(wǎng)絡(luò)中的應(yīng)用可能性的解決方案。其中,較為有效的方案有三類:第一類是使用DDC編制的網(wǎng)絡(luò)信息導(dǎo)航網(wǎng)關(guān),以BUBL LINK和CyberDewey為代表;第二類是提供較為成熟的分類導(dǎo)航(指南)網(wǎng)站,以O(shè)DP為代表;第三類是門戶網(wǎng)站為組織其信息資源并為用戶提供服務(wù)而設(shè)置的導(dǎo)航結(jié)構(gòu)。
4.2網(wǎng)絡(luò)術(shù)語與知識(shí)檢索工具
網(wǎng)絡(luò)分類法在互聯(lián)網(wǎng)中所起的作用與傳統(tǒng)的分類法在圖書情報(bào)機(jī)構(gòu)中起作用有所不同,它的主要功能是分類導(dǎo)航。而傳統(tǒng)的主題法與網(wǎng)絡(luò)中的術(shù)語工具的作用則大不相同,這類術(shù)語工具提供的是知識(shí)和常識(shí)內(nèi)容。對(duì)于這一新興的詞匯控制工具的研究主要集中在兩個(gè)方面:一是對(duì)其中所包含信息交流和協(xié)作機(jī)制以及它的權(quán)威性和對(duì)其它信息服務(wù)的借鑒意義的研究;二是對(duì)其涉及信息和信息檢索服務(wù)的質(zhì)量問題進(jìn)行深入的研究。隨著用戶對(duì)知識(shí)性、常識(shí)性信息的需求增加,這種網(wǎng)絡(luò)術(shù)語工具正成為一種新興的知識(shí)檢索工具,其代表,在國外,有維基百科;在國內(nèi),有百度百科、百度知道、新浪愛問和雅虎知識(shí)堂。這類術(shù)語系統(tǒng)的編輯以網(wǎng)絡(luò)用戶貢獻(xiàn)為主要方式,其內(nèi)容的正確性和更新的及時(shí)性已經(jīng)部分得到了公認(rèn)。這類工具的興起,預(yù)示著網(wǎng)絡(luò)信息檢索服務(wù)的發(fā)展方向:自動(dòng)化的信息處理與網(wǎng)絡(luò)用戶的協(xié)作共同為網(wǎng)絡(luò)資源的豐富、質(zhì)量的提高和服務(wù)的改善貢獻(xiàn)力量。
5 Web2.0與自由分類法
隨著Web2.0的出現(xiàn)和應(yīng)用,標(biāo)簽技術(shù)、網(wǎng)絡(luò)書簽、博客等成為互聯(lián)網(wǎng)中的熱門應(yīng)用或服務(wù)。因?yàn)槭芸卦~表復(fù)雜而且成本高,本體“可操作性欠佳”,2004年8月由信息構(gòu)建專家Vander Wal提出的自由分類法(Folksonomy),因其體現(xiàn)了“有勝于無”的理念而得以廣泛應(yīng)用。
5.1自由分類法及相關(guān)問題
自由分類法是“個(gè)人用戶為了其檢索的需要,對(duì)信息或?qū)ο笞杂商砑訕?biāo)簽的結(jié)果”,用戶添加標(biāo)簽的行為是“在一個(gè)社會(huì)化的環(huán)境中進(jìn)行,即這個(gè)環(huán)境是開放和共享的”。根據(jù)自由分類法的不同應(yīng)用,可以分為“寬自由分類法”和“窄自由分類法”兩種類型。自由分類法可以看作“本體論的新學(xué)派”,因?yàn)樽杂煞诸惙ǹ梢员豢醋魇且环N“社會(huì)化的本體”,本體的構(gòu)建不需要再依賴專家,而可以從豐富的用戶數(shù)據(jù)中提取。同時(shí),自由分類法的表現(xiàn)形式――標(biāo)簽,則是由用戶產(chǎn)生的元數(shù)據(jù),區(qū)別于以往由專家或網(wǎng)站作者產(chǎn)生的元數(shù)據(jù),它能夠直接、迅速反映用戶的詞匯和需求及其變化。
但是,研究發(fā)現(xiàn),由于取消了嚴(yán)格的詞匯控制和等級(jí)結(jié)構(gòu),自由分類法存在語義模糊、檢索的準(zhǔn)確率和查全率低、多語種支持不足以及標(biāo)簽濫用、信息垃圾等問題。還有學(xué)者提出“知識(shí)樹”的概念來描述分類法的不同類型和發(fā)展階段,并將標(biāo)簽和自由分類法比喻為從樹上飄落的“知識(shí)樹葉”。
5.2自由分類法的運(yùn)行機(jī)制及實(shí)例研究
自由分類法是用戶基于個(gè)人信息管理的目的,使用自己的詞匯對(duì)信息進(jìn)行標(biāo)注,以便再次查找和使用。除了準(zhǔn)確定位個(gè)人信息,相同的標(biāo)簽?zāi)軌蚓酆险麄(gè)信息空間中的所有相似內(nèi)容,實(shí)現(xiàn)資源的共享,標(biāo)簽的瀏覽使用戶獲得意外的發(fā)現(xiàn)。用戶在資源的共享過程中能夠找到與自身擁有相同興趣的人群,得到關(guān)于標(biāo)簽使用的反饋,從而影響其未來的行為。自由分類法的形成和發(fā)展具有明顯的社會(huì)化的性質(zhì)。
網(wǎng)絡(luò)書簽是自由分類法的最早應(yīng)用。目前較為成熟的案例主要是對(duì)Del.icio.us或Flickr等的研究。國外的許多學(xué)者從上述書簽網(wǎng)站中抽取一定量的樣本,通過統(tǒng)計(jì)和個(gè)案分析,研究標(biāo)簽詞匯的語言特征、標(biāo)簽使用中存在的規(guī)律、特定系統(tǒng)中用戶、資源或標(biāo)簽的特點(diǎn)及相互關(guān)系,以及用戶行為模式等內(nèi)容。國內(nèi)學(xué)者梁桂英認(rèn)為“開放式標(biāo)簽系統(tǒng)”的工作程序是“若干個(gè)用戶使用若干個(gè)標(biāo)簽,從而逐步形成自由分類法”的過程;周榮庭較為深入地分析了自由分類法有效運(yùn)行背后的主要機(jī)制,將其歸納為兩個(gè)步驟:“開放性元數(shù)據(jù)”和“自然語言社群聚類”。
5.3自由分類法的優(yōu)化及發(fā)展前景
為改善自由分類法的應(yīng)用效果,學(xué)者們提出了自由分類法與分類法或詞表結(jié)合、增加同義詞控制、對(duì)檢索結(jié)果進(jìn)行排序整理等構(gòu)想。同時(shí),學(xué)界提出針對(duì)自由分類法信息組織體系的檢索和排序算法,并通過對(duì)檢索結(jié)果的結(jié)構(gòu)化整理發(fā)現(xiàn)特定的社會(huì)群體。為了彌補(bǔ)自由分類法平面化結(jié)構(gòu)、缺乏詞間關(guān)系揭示的不足,又提出了語義關(guān)系的挖掘方法,包括在自由分類法中發(fā)現(xiàn)等級(jí)式主題關(guān)系的方法、通過自由分類法中詞匯的共現(xiàn)關(guān)系發(fā)現(xiàn)某種等級(jí)結(jié)構(gòu)的方法、自動(dòng)標(biāo)簽聚類法等等。
目前自由分類法的應(yīng)用前景主要有以下幾個(gè)方面:①是對(duì)元數(shù)據(jù)的有力改造和增值;②在有共同知識(shí)背景的企業(yè)層面上支持知識(shí)共享;③基于窄自由分類法構(gòu)建學(xué)科門戶;④利用自由分類法構(gòu)建本體。
6 結(jié)語
知識(shí)組織是情報(bào)學(xué)中最為深厚、實(shí)踐性又十分強(qiáng)的一個(gè)前沿分支。短短的一篇綜述也實(shí)難反應(yīng)這一領(lǐng)域研究的全貌。盡管受到網(wǎng)絡(luò)環(huán)境海量信息資源帶來的極大挑戰(zhàn),知識(shí)組織這一前沿在互聯(lián)網(wǎng)、各類組織機(jī)構(gòu)、圖書館和各類信息中心的業(yè)務(wù)中仍然發(fā)揮著核心作用。對(duì)知識(shí)組織的研究也在不斷豐富、發(fā)展和完善之中。
相關(guān)熱詞搜索:進(jìn)展 實(shí)踐 組織 知識(shí)組織最新研究與實(shí)踐進(jìn)展 教師實(shí)踐性知識(shí)研究 國內(nèi)外知識(shí)組織研究進(jìn)展
熱點(diǎn)文章閱讀