基于內(nèi)容揭示的信息資源控制的演進(jìn)|信息資源規(guī)劃的內(nèi)容
發(fā)布時(shí)間:2020-03-07 來(lái)源: 美文摘抄 點(diǎn)擊:
[摘要]信息資源的內(nèi)容控制是通過信息內(nèi)涵知識(shí)的揭示所進(jìn)行的實(shí)質(zhì)性控制,是信息資源控制的主體和核心。語(yǔ)義web技術(shù)在信息資源控制中的應(yīng)用,使尋求高效化的信息資源控制理論成為可能。信息資源內(nèi)涵的知識(shí)描述與揭示成為信息資源控制理論新的生長(zhǎng)點(diǎn)。信息資源內(nèi)容控制呈現(xiàn)知識(shí)單元化、集成化、多元化和智能化的發(fā)展趨勢(shì)。
[關(guān)鍵詞]知識(shí)描述 內(nèi)容揭示 信息資源控制
[分類號(hào)]G203
信息資源控制是將無(wú)序的信息資源規(guī)范化和有序化的過程,旨在提供可控性的高效信息服務(wù)。網(wǎng)絡(luò)環(huán)境下,不斷增長(zhǎng)的海量文獻(xiàn)信息與人們特定知識(shí)需求之間的矛盾日益尖銳。同時(shí),現(xiàn)代計(jì)算機(jī)技術(shù)、通信技術(shù)和遠(yuǎn)程數(shù)據(jù)處理技術(shù)的發(fā)展,為文獻(xiàn)內(nèi)涵信息的全面提取、組織、加工和利用提供技術(shù)支撐。信息資源控制的內(nèi)容與方法基于環(huán)境的變化而不斷深化發(fā)展。
1 傳統(tǒng)信息資源控制的不足
控制的基本含義不僅僅局限于信息資源客體本身,還包括以信息資源為中心的各種控制,其主要內(nèi)容有:①信息資源客體控制(簡(jiǎn)稱信息資源控制);②信息資源過程控制;③信息系統(tǒng)與工作控制;④信息用戶及其活動(dòng)控制。其中,對(duì)信息資源客體控制是基本的…。在其他信息資源控制中,人們亦采用了類似于文獻(xiàn)信息資源控制的方法。如對(duì)信息過程、信息系統(tǒng)和信息用戶等方面的控制,基本也是以書目控制為核心。
傳統(tǒng)的文獻(xiàn)控制方式可歸納為外部描述控制和內(nèi)容特征控制兩類!巴獠棵枋隹刂啤蓖ㄟ^文獻(xiàn)外表特征的揭示將文獻(xiàn)信息有序化,以達(dá)到控制文獻(xiàn)的目的,其中描述內(nèi)容包括作者、時(shí)間、類型、來(lái)源等。理論研究和實(shí)際工作的結(jié)果表明,這種描述控制是完全可以實(shí)現(xiàn)的。“文獻(xiàn)內(nèi)容控制”遠(yuǎn)比“外部描述控制”復(fù)雜,這是一種通過文獻(xiàn)內(nèi)涵知識(shí)信息的揭示所進(jìn)行的實(shí)質(zhì)性控制,是文獻(xiàn)控制的主體和核心。鑒于知識(shí)結(jié)構(gòu)和演化過程的復(fù)雜性,其基本問題作為傳統(tǒng)目錄學(xué)、文獻(xiàn)學(xué)和現(xiàn)代知識(shí)信息處理理論的中心,是學(xué)術(shù)界和實(shí)際工作部門長(zhǎng)期探討的主要課題。
隨著社會(huì)信息化發(fā)展,社會(huì)對(duì)信息資源控制質(zhì)量提出越來(lái)越高的要求,信息資源內(nèi)容控制作為信息資源控制的核心環(huán)節(jié),其傳統(tǒng)方式正受到來(lái)自各方面的挑戰(zhàn)。傳統(tǒng)分類法和主題法中知識(shí)揭示方式的局限性日益凸顯,表現(xiàn)在:①難以適應(yīng)科學(xué)技術(shù)“微分化”和“積分化”的趨勢(shì);②難以適應(yīng)對(duì)信息內(nèi)涵的全面揭示;③難以適應(yīng)以知識(shí)單元為基礎(chǔ)的計(jì)算機(jī)智能組織系統(tǒng)的信息控制;④難以適應(yīng)知識(shí)形成和演化過程的控制。事實(shí)上,信息資源內(nèi)容控制的工作重心已逐漸轉(zhuǎn)移到高價(jià)值的活動(dòng),特別是通過對(duì)目前未能得到充分利用的信息資源內(nèi)涵知識(shí)的揭示,使之為更多用戶獲取,為信息資源提供更高的價(jià)值。
以上情況表明,研究新的信息資源內(nèi)容控制方式已成為關(guān)系信息資源工作全局的關(guān)鍵課題之一。同時(shí),網(wǎng)絡(luò)技術(shù)的發(fā)展和新的信息處理技術(shù)的出現(xiàn),使尋求高效化的信息資源控制理論成為可能。其中,信息資源內(nèi)涵的知識(shí)描述與揭示成為信息資源控制理論新的生長(zhǎng)點(diǎn)。
2 信息資源控制中知識(shí)描述與揭示的發(fā)展
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,語(yǔ)義互聯(lián)網(wǎng)(semanticweb)正逐漸將Internet變成一個(gè)巨大的全球化知識(shí)庫(kù)。語(yǔ)義互聯(lián)網(wǎng)環(huán)境下,信息資源的內(nèi)容控制可概括為兩點(diǎn):①對(duì)語(yǔ)詞的規(guī)范化處理;②顯示概念之間的關(guān)系。這兩點(diǎn)可通過知識(shí)描述與揭示方法來(lái)實(shí)現(xiàn)。在語(yǔ)義網(wǎng)環(huán)境下,知識(shí)描述與揭示的方法主要有可擴(kuò)展標(biāo)記語(yǔ)言(XML)、資源描述模型(RDF/RDF Schema)、主題圖(XTM)和知識(shí)本體(Ontology)等。這些適合語(yǔ)義Web技術(shù)的知識(shí)描述和揭示方法提供了信息內(nèi)容表示的標(biāo)準(zhǔn)化框架,通過標(biāo)準(zhǔn)的語(yǔ)義規(guī)范使計(jì)算機(jī)自動(dòng)讀取和處理信息資源,為基于Web服務(wù)的智能共享提供基礎(chǔ)。
知識(shí)描述與揭示方法決定了信息資源內(nèi)容控制的精度和深度,只有根據(jù)求解問題的性質(zhì)和方法靈活地選用合適的知識(shí)描述表示方法,才能使信息資源內(nèi)容控制取得較高的效率。表1展示了XML、RDF、XTM、Ontology的技術(shù)根源、數(shù)據(jù)模型、處理信息方式及其應(yīng)用的主要區(qū)別。事實(shí)上,XML、RDF、XTM、Ontology在信息資源的描述與揭示體系中處于不同的層次,對(duì)信息資源內(nèi)容控制發(fā)揮不同的作用。
與分類法、主題法等傳統(tǒng)知識(shí)描述與揭示方法相比,XML、RDF、XTM、本體等知識(shí)描述與揭示方法的根本區(qū)別在于系統(tǒng)中的概念、特性、限制條件等內(nèi)容都是計(jì)算機(jī)可讀(懂)的。同時(shí),在這些知識(shí)描述與揭示方法中,概念之間關(guān)系的表達(dá)要比主題法、分類法更廣更深,這是由于基于語(yǔ)義網(wǎng)的知識(shí)描述與揭示主要是為機(jī)器增加“智能”進(jìn)而實(shí)現(xiàn)自動(dòng)處理信息、知識(shí)分享和再利用而建立,所以在數(shù)據(jù)模型和表述語(yǔ)言方面,它的結(jié)構(gòu)與數(shù)據(jù)庫(kù)很接近,通過簡(jiǎn)單的處理即可以將整個(gè)系統(tǒng)轉(zhuǎn)成數(shù)據(jù)庫(kù)而直接實(shí)施到信息系統(tǒng)的開發(fā)和建設(shè)中,為知識(shí)采集、知識(shí)庫(kù)建立提供框架平臺(tái),這是傳統(tǒng)圖書館主題法、分類法所不能及的。
3 基于內(nèi)容揭示的信息資源控制的深化
由于傳統(tǒng)的書目控制理論運(yùn)用于信息資源內(nèi)容控制存在著局限性,隨著知識(shí)描述與揭示技術(shù)的發(fā)展,信息資源控制的技術(shù)、主體、方法都發(fā)生了變化,主要體現(xiàn)在以下方面:
3.1控制內(nèi)容的知識(shí)單元化發(fā)展
文獻(xiàn)信息資源記錄的知識(shí)內(nèi)涵豐富,從應(yīng)用角度和知識(shí)產(chǎn)生角度看,它并非如布魯克斯所描述的靜態(tài)結(jié)構(gòu),而是具有動(dòng)態(tài)結(jié)構(gòu)的特征。從知識(shí)的性質(zhì)上看,文獻(xiàn)單元是相對(duì)靜止的,而知識(shí)單元是衍變的,一篇文獻(xiàn)不僅包含許多知識(shí)單元,體現(xiàn)知識(shí)單元之間的各種有機(jī)聯(lián)系,而且反映文獻(xiàn)作者對(duì)各種知識(shí)的處理、加工、思維和推理過程,反映了知識(shí)的演化。文獻(xiàn)信息資源所含的這些動(dòng)態(tài)性信息,對(duì)于使用者來(lái)說(shuō)比靜態(tài)知識(shí)結(jié)構(gòu)信息(如結(jié)果)更重要。事實(shí)上,在現(xiàn)代科學(xué)技術(shù)條件下,用戶利用文獻(xiàn)往往不是為了查詢單一的、固定的知識(shí)概念,而是為了借鑒文獻(xiàn)并未明確表達(dá)的作者思維和創(chuàng)造活動(dòng)的方法,從中得到啟示,激發(fā)靈感。對(duì)于這種知識(shí)過程的揭示,任何靜態(tài)控制方式都顯得無(wú)能為力,其問題的解決必然求助于新的模式。
迅速普及的網(wǎng)絡(luò)技術(shù)和數(shù)字技術(shù)使任意層次的任意信息元素、信息單元和信息集合體系正在逐步以計(jì)算機(jī)可識(shí)別和可理解的方式被定義、描述、指向、鏈接、傳遞和動(dòng)態(tài)組織。信息資源內(nèi)容揭示的對(duì)象不僅停留在對(duì)信息特征的描述,而且深入到知識(shí)單元,信息資源內(nèi)容揭示的深度和廣度得到極大拓展,通過多層次、多方位的描述與揭示控制信息資源,促進(jìn)信息資源的合理利用?梢姡(dāng)前信息資源內(nèi)容控制的對(duì)象已從文獻(xiàn)整體控制向知識(shí)單元及其知識(shí)組織控制方面延拓,因知識(shí)產(chǎn)生、老化和利用周期縮短,知識(shí)信息控制已成為信息資源內(nèi)容控制的重點(diǎn)。同時(shí),語(yǔ)義Web技術(shù)的出現(xiàn)及其在信息資源知識(shí)組織與控制中的應(yīng)用,帶來(lái)了知識(shí)揭示與組織工具的變革并重構(gòu)了知識(shí)組織控制 體系,知識(shí)組織控制從物理層次上的文獻(xiàn)單元上升到認(rèn)知層次的知識(shí)單元,從單純的語(yǔ)法處理(主題法、分類法)轉(zhuǎn)變?yōu)檎Z(yǔ)義處理(如本體等語(yǔ)義網(wǎng)絡(luò)表示法),從語(yǔ)義處理到“模擬個(gè)體知識(shí)記憶結(jié)構(gòu)”的考慮語(yǔ)境的語(yǔ)用處理方式;基于內(nèi)容揭示的資源控制必將實(shí)現(xiàn)“語(yǔ)法-語(yǔ)義-語(yǔ)用”的新跨越發(fā)展。
3.2控制方法的集成化發(fā)展
在信息資源內(nèi)容控制中,分類法和主題法(包括由此派生的關(guān)鍵詞法、敘詞法和元詞法等)是文獻(xiàn)信息資源控制通用的基本方法,其要點(diǎn)是按一定的知識(shí)處理法則將文獻(xiàn)有序化。分類法在揭示文獻(xiàn)所含知識(shí)方面,雖然具有較強(qiáng)的系統(tǒng)性,但缺乏應(yīng)有的靈活性和揭示深度;主題法從某種程度上彌補(bǔ)了分類法的缺陷,卻缺乏系統(tǒng)性。當(dāng)前,科學(xué)技術(shù)高度發(fā)展,其知識(shí)領(lǐng)域愈分愈細(xì),愈來(lái)愈專。與此同時(shí),任何一個(gè)狹窄的專門領(lǐng)域又必然涉及多方面的知識(shí)門類。這一現(xiàn)實(shí)在文獻(xiàn)中的體現(xiàn)便是文獻(xiàn)內(nèi)容(知識(shí))的高度專門化與高度綜合化趨勢(shì)的并存。科學(xué)技術(shù)和其他知識(shí)領(lǐng)域?qū)W科發(fā)展中的“微分化”與“積分化”效應(yīng)是人類知識(shí)高速增長(zhǎng)、迅速分化和組合的結(jié)果。面對(duì)人類知識(shí)生產(chǎn)的變化,無(wú)論是分類法還是主題法,分別用于控制信息資源的效果必然會(huì)愈來(lái)愈差。
傳統(tǒng)書目控制的局限性表明,在信息資源內(nèi)容控制中必須借助多種方法和手段的集成運(yùn)用,必須求助于普遍適用的控制理論。信息資源的充分開發(fā)和利用和人類信息實(shí)踐的極大豐富,為信息資源內(nèi)容控制理論和方法的發(fā)展和完善奠定了實(shí)踐基礎(chǔ),現(xiàn)代信息技術(shù)和通信技術(shù)的發(fā)展,以及建立在語(yǔ)義網(wǎng)絡(luò)技術(shù)基礎(chǔ)上的知識(shí)描述與揭示方法的完善,為信息資源的內(nèi)容控制提供了必要的物質(zhì)和技術(shù)條件。
在以本體為核心的語(yǔ)義Web技術(shù)的驅(qū)動(dòng)下,信息資源內(nèi)容控制方法不再僅僅局限于傳統(tǒng)的分類法、敘詞表、編目規(guī)則等,而是出現(xiàn)了能夠更好適應(yīng)數(shù)字環(huán)境的新型知識(shí)組織工具:概念地圖、語(yǔ)義網(wǎng)絡(luò)、實(shí)用分類法等。語(yǔ)義web技術(shù)在信息資源內(nèi)容控制中的應(yīng)用,為資源控制提供了新的思維方式和新的理念,基于信息內(nèi)容揭示的資源控制方法隨著信息資源揭示與組織技術(shù)的發(fā)展而不斷深化拓展,網(wǎng)絡(luò)環(huán)境下信息資源的內(nèi)容控制必然是多種方法的結(jié)合使用。
3.3控制主體的多樣化發(fā)展
在信息資源的內(nèi)容控制中,無(wú)論是傳統(tǒng)的分類法、主題法(關(guān)鍵詞法、單元詞法還是敘詞法等),還是用于數(shù)字資源描述與揭示的元數(shù)據(jù),大多是由專業(yè)人員制定和標(biāo)引。網(wǎng)絡(luò)環(huán)境下,數(shù)字化存貯、網(wǎng)絡(luò)途徑獲取已成為人們利用信息資源的主流方式,信息資源內(nèi)容控制的主體也隨之?dāng)U展到專業(yè)不同、層次各異的各種終端用戶;谛畔(nèi)容揭示的資源控制逐漸呈現(xiàn)出開放性、共享性、交互性的特點(diǎn),體現(xiàn)專業(yè)化與社會(huì)化控制并存的發(fā)展趨勢(shì)。
以下我們通過元數(shù)據(jù)和大眾分類法的對(duì)比分析說(shuō)明信息資源內(nèi)容控制的多樣化發(fā)展。大眾分類法(Folksonomy)是一種由用戶參與和主導(dǎo)的信息資源組織控制方式,作為構(gòu)筑下一代互聯(lián)網(wǎng)(Web 2.0)的核心要素,大眾分類法由用戶自發(fā)的用標(biāo)簽(Tag)對(duì)感興趣的資料進(jìn)行分類,并與他人共享標(biāo)簽的過程和結(jié)果。它揚(yáng)棄了以往信息資源控制事先確定大綱的方式,由用戶自由選擇關(guān)鍵詞甚至顏色來(lái)分類和描述信息內(nèi)容。
作為網(wǎng)絡(luò)環(huán)境下數(shù)字化信息資源內(nèi)容控制方式,如果說(shuō)元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)(Data about Da―ta)”,那么大眾分類法就是“關(guān)于數(shù)據(jù)的標(biāo)簽(Tag a―bout Data)”。兩者的出發(fā)點(diǎn)都是組織信息以便利用戶的使用,但前者是通過專業(yè)人士以標(biāo)準(zhǔn)化方式推行,后者則更多依賴大眾的參與和“重量級(jí)應(yīng)用”。圖1展示了基于元數(shù)據(jù)的標(biāo)準(zhǔn)化控制和基于用戶標(biāo)簽的自由化控制模式。
“元數(shù)據(jù)”通常采用結(jié)構(gòu)化、規(guī)范化或標(biāo)準(zhǔn)化的方式對(duì)“數(shù)字資源”進(jìn)行標(biāo)識(shí),由專業(yè)機(jī)構(gòu)專業(yè)人員制定。當(dāng)前,由于元數(shù)據(jù)種類繁多,相互之間缺乏有效的互操作機(jī)制,從而影響了元數(shù)據(jù)控制信息資源的效率;“Tag標(biāo)簽”由用戶根據(jù)個(gè)人需要在提交匯聚數(shù)字資源過程中,對(duì)數(shù)字資源加上個(gè)性化的標(biāo)識(shí)說(shuō)明,“Tag標(biāo)簽”在應(yīng)用過程中不斷生成優(yōu)化,而非采用預(yù)設(shè)的結(jié)構(gòu)模式。事實(shí)上,在元數(shù)據(jù)標(biāo)準(zhǔn)化控制模式和用戶標(biāo)簽控制模式中,“用戶”應(yīng)用的社會(huì)互聯(lián)效應(yīng)不同。在“用戶Tag標(biāo)簽?zāi)J健敝校脩舨粌H是信息資源的使用者,同時(shí)也是信息內(nèi)容的建設(shè)匯聚者,在應(yīng)用與建設(shè)“數(shù)字資源”與“Tag標(biāo)簽”的過程中,用戶之間能夠不斷建立社會(huì)聯(lián)系;谟脩魳(biāo)簽自由控制模式,我們完全認(rèn)可信息資源的內(nèi)容控制系統(tǒng)將成為一個(gè)合作的、分布式的、國(guó)際化的、基于網(wǎng)絡(luò)的生態(tài)系統(tǒng)。
目前,無(wú)論是元數(shù)據(jù)還是基于Tag的大眾分類法,還沒有從全局或者根本上解決信息資源組織控制問題,從某種程度上講,大眾分類法提供了新的視角來(lái)看待如何控制信息資源以及用戶的參與對(duì)信息資源控制的影響?傮w而言,信息資源的控制總是處于有序和無(wú)序、標(biāo)準(zhǔn)和自由之間并保持某種動(dòng)態(tài)均衡。
3.4控制技術(shù)的智能化發(fā)展
目前,信息資源內(nèi)容揭示主要以文獻(xiàn)單元為基礎(chǔ)和以數(shù)據(jù)(各種事實(shí)、概念、數(shù)值的總和等)單元為基礎(chǔ),大多是靜態(tài)的、列舉式的。未來(lái)信息資源內(nèi)容控制將以專家系統(tǒng)為基礎(chǔ),具有動(dòng)態(tài)聯(lián)系、判斷、分析、比較、推理等新型的知識(shí)處理與組織功能。
解決信息資源智能化揭示與控制的主要困難,首先是信息按思維程序要求的有效排列和多方面處理之間的矛盾;其次是輸入文獻(xiàn)知識(shí)單元的處理和判斷,以及人工智能的智能化水平的提高。當(dāng)代人工智能技術(shù)的發(fā)展為信息資源的動(dòng)態(tài)結(jié)構(gòu)揭示和智能化控制提供了可能。
當(dāng)前不斷發(fā)展的專家系統(tǒng)被稱為體外大腦,其中的知識(shí)庫(kù)相當(dāng)于人腦的知識(shí)存儲(chǔ)結(jié)構(gòu),是接受新知識(shí)的必要條件,其推理機(jī)構(gòu)類似于人腦的特殊思維活動(dòng)機(jī)制。專家系統(tǒng)對(duì)輸入知識(shí)的處理和判斷可以類比人對(duì)知識(shí)的處理過程;谶@一事實(shí),如果向系統(tǒng)輸入文獻(xiàn)中的靜態(tài)知識(shí)單元,并提出顯示知識(shí)組織和推理的要求,則系統(tǒng)可以顯示文獻(xiàn)作者的推理和思維信息,而這正是所需求的動(dòng)態(tài)知識(shí)信息。智能系統(tǒng)將知識(shí)揭示與文獻(xiàn)控制融為一體,除提供動(dòng)態(tài)知識(shí)外,還可以在更廣的范圍內(nèi)進(jìn)行知識(shí)組織與處理,將反映相關(guān)知識(shí)的信息資源進(jìn)行有機(jī)結(jié)合,從而取得濃度很高的高層次知識(shí)信息。應(yīng)該說(shuō),這是信息資源控制工作的一場(chǎng)變革。當(dāng)前,這一研究尚處于初級(jí)狀態(tài),在某些方面僅僅存在某些學(xué)者和用戶的設(shè)想。
人工智能技術(shù)促進(jìn)了信息內(nèi)容的挖掘與深層次揭示,以更好滿足不同用戶的各種需求,提供個(gè)性化的信息服務(wù)。從信息中采掘知識(shí),再將知識(shí)轉(zhuǎn)變?yōu)樯鐣?huì)財(cái)富,體現(xiàn)信息資源內(nèi)容控制深化發(fā)展的方向,目的是向人們提供便于利用的、可以幫助解決問題的序化知識(shí),實(shí)現(xiàn)從信息層次向知識(shí)層次的根本轉(zhuǎn)變。
相關(guān)熱詞搜索:演進(jìn) 信息資源 揭示 基于內(nèi)容揭示的信息資源控制的演進(jìn) 信息資源控制論文 信息資源管理
熱點(diǎn)文章閱讀