情報(bào)語言學(xué) 情報(bào)語言學(xué)的若干研究心得和收獲
發(fā)布時間:2020-03-07 來源: 散文精選 點(diǎn)擊:
[摘要]著者自述情報(bào)語言學(xué)學(xué)術(shù)思想,包括情報(bào)檢索語言的研究方法、檢索效率、情報(bào)檢索語言一些具體問題的研究心得、術(shù)語學(xué)、自然語言檢索等。 [關(guān)鍵詞]張琪玉情報(bào)語言學(xué)情報(bào)檢索語言 自然語言檢索 術(shù)語學(xué)
[分類號]G254.0
我研究情報(bào)語言學(xué),假如僅僅從寫作《情報(bào)檢索語言》一書算起,也已有30年的時間。有一些來之不易的心得和收獲,介紹出來與同行們交流、分享。
我有一個基本觀點(diǎn),認(rèn)為各種情報(bào)檢索語言的基本原理是一致的,它們只是在表達(dá)各種概念及其相互關(guān)系時和在解決對它們提出的那些共同要求時所采用的方法不同,才形成了不同的類型和語種。因此,對分類檢索語言、主題檢索語言和其他情報(bào)檢索語言以及自然語言在情報(bào)檢索中的應(yīng)用問題進(jìn)行統(tǒng)一研究,可探索它們影響檢索效率的共同規(guī)律和有效的改進(jìn)途徑。提高檢索效率是情報(bào)語言學(xué)研究的根本目的和核心問題。
正是從這一基本觀點(diǎn)出發(fā),我寫成了《情報(bào)檢索語言》一書以及之后的許多情報(bào)語言學(xué)文章和專著。寫作《情報(bào)檢索語言》一書是我對各種情報(bào)檢索語言進(jìn)行統(tǒng)一研究,以探索它們影響檢索效率的共同規(guī)律和有效的改進(jìn)途徑的第一次實(shí)踐。
我的學(xué)術(shù)研究,以情報(bào)語言學(xué)(包括索引學(xué))為范圍。對于情報(bào)語言學(xué),我可以說是“情有獨(dú)鐘”,自1980年之后寫的幾百篇著作,幾乎全部是關(guān)于情報(bào)語言學(xué)的。
我認(rèn)為,人生很短暫,一個人不可能做完一切想做的事,所以只能去做最必要的、最有意義的并且能夠做到的事情。做學(xué)問,要有一個專業(yè)范圍,在專業(yè)范圍內(nèi)力求深而廣。
我把情報(bào)語言學(xué)定義為“是研究情報(bào)檢索中語言保證問題的一門學(xué)科,其主要研究對象是情報(bào)檢索語言,同時也研究自然語言在情報(bào)檢索中的應(yīng)用問題”。這樣表述,是要在概念上弄清情報(bào)檢索語言與自然語言的區(qū)別,情報(bào)檢索語言(簡稱檢索語言)是人工語言,自然語言不能稱為“自然檢索語言”。
1 情報(bào)檢索語言的研究方法
我體會到,研究的成效在很大程度上取決于研究方法。
情報(bào)檢索語言的檢索效率是其功能決定的,而其功能則是由其結(jié)構(gòu)決定的。所以,研究情報(bào)檢索語言的性能,主要就是要分析解剖其結(jié)構(gòu)。結(jié)構(gòu)功能分析法是研究情報(bào)檢索語言最為有效的方法。后來,我總結(jié)出研究情報(bào)檢索語言的一整套專用方法,如歷史演進(jìn)研究法、比較研究法、調(diào)查整理法、歸納法和演繹法、原理或方法的移植法、理想語言設(shè)計(jì)法、現(xiàn)用語言改進(jìn)法、數(shù)學(xué)方法和統(tǒng)計(jì)方法、實(shí)驗(yàn)方法等,我發(fā)現(xiàn)這些方法都含有結(jié)構(gòu)功能分析的內(nèi)容,都是從結(jié)構(gòu)功能分析法衍生出來的。
關(guān)于比較研究法,我寫過一篇題為《情報(bào)檢索語言原理的一致和方法的差異》(《圖書館建設(shè)》1994年第6期)的文章,提到比較研究法可以使我們觀察出情報(bào)檢索語言各種結(jié)構(gòu)與功能的“異中之同,同中之異”,使我們能“既見樹木,也見森林”。這篇文章可以幫助人們了解各種情報(bào)檢索語言的性能。正是在利用結(jié)構(gòu)功能分析法及其各種衍生方法的基礎(chǔ)上,我對情報(bào)語言學(xué)的內(nèi)容進(jìn)行了豐富、發(fā)展。
情報(bào)檢索語言的檢索效率由其各種檢索功能決定,而情報(bào)檢索語言的各種檢索功能則由其結(jié)構(gòu)產(chǎn)生。產(chǎn)生檢索功能的是情報(bào)檢索語言的微觀結(jié)構(gòu)。若干微觀結(jié)構(gòu)的有機(jī)結(jié)合才能構(gòu)成一種情報(bào)檢索語言。各種類型的情報(bào)檢索語言都是一種結(jié)構(gòu)模式,即其宏觀結(jié)構(gòu)。微觀結(jié)構(gòu)的數(shù)量、種類及結(jié)合模式,形成情報(bào)檢索語言檢索效率的整體水平。
正是這一原理,使我樹立起情報(bào)檢索語言可創(chuàng)新、可改進(jìn)的信念。我常常異想天開,去尋找理想的情報(bào)檢索語言結(jié)構(gòu)模式,去發(fā)現(xiàn)新的功能,去探索創(chuàng)新之路。例如《學(xué)科一事物概念組配型檢索語言――關(guān)于情報(bào)檢索語言的遐想與求索》(《圖書館雜志》1997年第2期)和《探索21世紀(jì)的情報(bào)檢索語言》(《北京大學(xué)學(xué)報(bào):信息管理系建系五十周年?(1997年)以及《對未來分類法的憧憬》(《圖書館理論與實(shí)踐》2003年第1期)三篇文章。
《學(xué)科一事物概念組配型檢索語言――關(guān)于情報(bào)檢索語言的遐想與求索》和《探索21世紀(jì)的情報(bào)檢索語言》是經(jīng)過十多年的研究才尋找到的模式。該模式的本質(zhì)屬性可歸納為:①學(xué)科聚類系統(tǒng)與事物聚類系統(tǒng)的結(jié)合;②先組式語言與后組式語言的結(jié)合、體系分類法與組配分類法的結(jié)合;③人工語言與自然語言的結(jié)合;④號碼標(biāo)識與語詞標(biāo)識的結(jié)合、系統(tǒng)序列與字順序列的結(jié)合;⑤不變概念代碼與可變概念體系的結(jié)合。其主要實(shí)現(xiàn)方法可概括為“分面分析+概念代碼+概念對應(yīng)轉(zhuǎn)換+數(shù)據(jù)庫技術(shù)”。這種語言的性能可概括為:①分類法與主題法徹底一體化的;②充分發(fā)揮情報(bào)檢索語言對知識進(jìn)行系統(tǒng)組織和對自然語言進(jìn)行規(guī)范控制的功能的;③用戶可十分方便地進(jìn)行標(biāo)引和檢索的;④概念可不斷增補(bǔ)及概念的代表詞可進(jìn)行更換的;⑤用戶區(qū)別不出是自然語言還是人工語言而其實(shí)是由嚴(yán)密的人工語言控制的;⑥修訂不受已標(biāo)引文獻(xiàn)所牽制,故分類體系可逐步完善的;⑦可以掛接英文索引、分子式索引等以及可用于機(jī)助標(biāo)引的。
《對未來分類法的憧憬》一文認(rèn)為理想分類法的結(jié)構(gòu)模式應(yīng)是:①學(xué)科分類與事物分類并行又能相互結(jié)合的,既可形成學(xué)科分類體系又可形成事物分類體系,兩種體系可變換的分類法,即學(xué)科一事物概念組配型的分類法;②多聚類中心的、線性結(jié)構(gòu)與網(wǎng)狀結(jié)構(gòu)相結(jié)合的,學(xué)科和事物概念全向聚類的分類法,單純線性結(jié)構(gòu)和單純網(wǎng)狀結(jié)構(gòu)都有局限性;③只依據(jù)文獻(xiàn)內(nèi)容的學(xué)科屬性或文獻(xiàn)研究對象之間的相互聯(lián)系的客觀事實(shí)進(jìn)行分類,對其思想觀點(diǎn)不加區(qū)分和褒貶的分類法(某種意識形態(tài)、宗教信仰、政治主張等的優(yōu)先、重點(diǎn)揭示可作為照顧各國各民族的特殊需要來處理),即分類體系的建立更注重于揭示各種知識的內(nèi)在聯(lián)系,重點(diǎn)不在于構(gòu)建表示某種信仰的宏觀框架;④國際化與民族化妥善結(jié)合的分類法。依據(jù)“求同存異”的原則,以國際通用為基本,照顧各國各民族的特殊需要,阮崗納贊的“優(yōu)惠類”原理用超鏈接方法實(shí)現(xiàn);⑤體系列舉方式與分面組配方式相結(jié)合的分類法;⑥在一個整體框架下由眾多專業(yè)分類法集成的分類法;每個學(xué)科領(lǐng)域或事物范疇允許有不只一個分類體系,但不同體系之間大部分類目有對應(yīng)轉(zhuǎn)換的可能性;⑦分類體系和類目可不斷革新的分類法;擺脫了已標(biāo)引文獻(xiàn)和藏書排架牽制的分類法(排架仍可用已分類了大量藏書的原有分類法);⑧能與世界上現(xiàn)有主要分類法通過類目對應(yīng)轉(zhuǎn)換達(dá)到基本兼容的分類法;⑨伸縮性很好的分類法;⑩類名與術(shù)語學(xué)成果盡可能取得一致的分類法,即其類名可作為主題詞使用的分類法,實(shí)際上就是分類法主題法一體化;⑩有詳細(xì)的、完善的自然語言入口的分類法,并可用于人機(jī)結(jié)合賦號標(biāo)引;⑩多語種的分類法;⑩計(jì)算機(jī)化并可在網(wǎng)絡(luò)上應(yīng)用的分類法;⑩有充分文獻(xiàn)保證的分類法,但不是僅限于專著的文獻(xiàn)保證。我設(shè)想,未來分類法的編制可能是先構(gòu)筑部分(專業(yè)分類法),再形成整體。事實(shí)上,未來分類法的構(gòu)成原理和方法大多已存在于現(xiàn)有情報(bào)檢索語言中,只是找出 它們完善結(jié)合(實(shí)現(xiàn))的方案還需要作出很大的努力。
由此可見,情報(bào)檢索語言的發(fā)展方向遠(yuǎn)不止一個網(wǎng)絡(luò)檢索問題,我們必須多方面去探索情報(bào)檢索語言的發(fā)展方向。
我認(rèn)為,情報(bào)檢索語言的進(jìn)步主要是結(jié)構(gòu)模式的進(jìn)步。永遠(yuǎn)只有更佳而不會有最佳的情報(bào)檢索語言結(jié)構(gòu)模式。因此,尋找更佳結(jié)構(gòu)模式永遠(yuǎn)是情報(bào)檢索語言創(chuàng)新的主流。
我認(rèn)為,目前尋找更佳結(jié)構(gòu)模式的主要方向是:①學(xué)科檢索與事物檢索的更密切結(jié)合;②人工語言與自然語言的融合;③線性顯示與網(wǎng)狀顯示的結(jié)合;④族性檢索與特性檢索的靈活調(diào)節(jié);⑤簡單易用與功能豐富能兼?zhèn)洌虎薜统杀九c高效益能兼?zhèn);⑦自動化和網(wǎng)絡(luò)化;⑧既能不斷改進(jìn),又能回避重新標(biāo)引;⑨適應(yīng)性、兼容性、民族化和國際化;⑩與術(shù)語學(xué)密切結(jié)合。這10項(xiàng)中的哪一項(xiàng),即使是小小的改進(jìn),也符合情報(bào)檢索語言發(fā)展的方向。
我在研究中歸納出情報(bào)檢索語言的4項(xiàng)基本功能,即:①對文獻(xiàn)的情報(bào)內(nèi)容(及某些外表特征)加以標(biāo)引;②對內(nèi)容相同及相關(guān)的情報(bào)加以集中或揭示其相關(guān)性;③對大量情報(bào)加以系統(tǒng)化或組織化;④便于將標(biāo)引用語和檢索用語進(jìn)行相符性比較。后來,我在《情報(bào)檢索語言方法綜述》(《圖書情報(bào)知識》1984年第2期)一文中對情報(bào)檢索語言的各種微觀結(jié)構(gòu)如何實(shí)現(xiàn)這4項(xiàng)基本功能做了系統(tǒng)說明。
2 檢索效率
關(guān)于檢索效率,我的總結(jié)是應(yīng)當(dāng)“全、準(zhǔn)、快、便、省”(檢全率、檢準(zhǔn)率、檢索速度、檢索方便性、檢索成本與效益),其中最主要的是全和準(zhǔn)。
決定檢索效率的有4個方面的因素:①情報(bào)檢索語言的質(zhì)量;②標(biāo)引質(zhì)量;③檢索質(zhì)量;④其他。其中,情報(bào)檢索語言的質(zhì)量與檢索效率關(guān)系最密切。
3 一些具體的心得和收獲
至于一些具體的體會,限于篇幅,這里僅列舉出相關(guān)的文章和出處。在這些文章中,我對情報(bào)語言學(xué)的某些問題曾做過全面、深入、系統(tǒng)的研究,我認(rèn)為是比較重要的文章:
?《論情報(bào)檢索語言的研究、創(chuàng)制與普及》(《圖書情報(bào)知識》1983年第4期);
?《情報(bào)檢索中的語言保證問題》(《情報(bào)理論與實(shí)踐》1995年第1期);
?《檢索效率及其影響因素》(《情報(bào)理論與實(shí)踐》1995年第2期);
?《情報(bào)檢索語言語法體系初探》(《圖書館理論與實(shí)踐》1986年第3期);
?《情報(bào)檢索語言中聚類的原理和方法》(《北京圖書館館刊》1997年第1期);
?《組配及其演變》(《情報(bào)理論與實(shí)踐》1996年第1期);
?《文獻(xiàn)主題的構(gòu)成因素及層次》(《圖書情報(bào)知識》1985年第1期);
?《試論隱含主題》(《圖書館理論與實(shí)踐》1993年第2期);
?《情報(bào)檢索語言的國家特點(diǎn)、時代特點(diǎn)和自然語言特點(diǎn)》(《圖書館理論與實(shí)踐》1989年第4期);
?《情報(bào)檢索語言的易用性問題》(《云南圖書館》199(年第4期));
?《文獻(xiàn)標(biāo)引是需要智慧的近手藝術(shù)創(chuàng)造的處理過程》(《圖書館雜志》2004年第3期);
?《情報(bào)檢索全過程中概念與標(biāo)識的對應(yīng)轉(zhuǎn)換》(《圖書與情報(bào)》2002年第2期);
?《情報(bào)檢索語言的發(fā)展趨勢(與吳建中的對話)》(《圖書館雜志》1996年第4期);
?《事物分類與學(xué)科分類》(《圖書館理論與實(shí)踐》200:年第1期);
?《體系分類法的準(zhǔn)則和慣例》(《晉圖學(xué)刊》1992年第4期);
?《體系分類法中“集中與分散”的矛盾》(《圖書館雜志》1982年第1期);
?《體系分類法中的交替法》(《圖書情報(bào)知識》1982年第2期);
?《分類標(biāo)記原理與方法概述》(《圖書館》1993年第1期);
?《情報(bào)檢索語言中語詞標(biāo)識的功能與局限――關(guān)于主題法性能的幾點(diǎn)分析》(《湖北高校圖書館》1985年第1期);
?《主題標(biāo)引的原理和方法》(《圖書館學(xué)刊》1996年第1期和第2期);
?《漢語檢索詞詞素輪排索引編制法探索》(《圖書與情報(bào)》1992年第4期)。
這些文章都有一定的新穎性,大部分可構(gòu)成情報(bào)語言學(xué)的基礎(chǔ)理論。
4 術(shù)語學(xué)
我認(rèn)為,術(shù)語學(xué)對情報(bào)語言學(xué)極其重要。術(shù)語是指稱概念的規(guī)范化符號,情報(bào)檢索語言的語詞則是指稱文獻(xiàn)主題概念的規(guī)范化符號(標(biāo)識),術(shù)語與情報(bào)檢索語言的語詞兩者存在著本質(zhì)的一致性。從這一角度看,術(shù)語學(xué)與情報(bào)語言學(xué)的研究對象可以說是同一事物,情報(bào)語言學(xué)所研究的是如何編制用于情報(bào)檢索領(lǐng)域的“術(shù)語詞典”一一分類表、詞表、代碼表。
情報(bào)檢索語言的編制可以說是術(shù)語整理(規(guī)范化、統(tǒng)一化、標(biāo)準(zhǔn)化)工作成果的諸多應(yīng)用領(lǐng)域之一。術(shù)語整理工作的原則,要求術(shù)語具有:單義性、標(biāo)準(zhǔn)化術(shù)語的字面意義同它所表達(dá)的概念的一致性、系統(tǒng)性(術(shù)語應(yīng)盡可能反映概念之間實(shí)際存在的、在系統(tǒng)化過程中確定下來的關(guān)系)、穩(wěn)定性和普遍性、簡潔性、語言的正確性、借用外來語的不可取性等,這些要求與情報(bào)檢索語言的選詞、規(guī)范化處理和顯示概念關(guān)系等的要求都是一致的。所以,術(shù)語整理工作成果(術(shù)語標(biāo)準(zhǔn)、推薦術(shù)語集、術(shù)語詞典等,特別是有術(shù)語定義和分類體系的術(shù)語文獻(xiàn))是情報(bào)檢索語言選詞的主要來源和進(jìn)行規(guī)范化處理及建立概念間關(guān)系的重要依據(jù)。情報(bào)檢索語言編制中的失誤,有很多是忽視對術(shù)語整理工作成果的利用所造成的。
所以,術(shù)語學(xué)與情報(bào)語言學(xué)有著極為密切的關(guān)系,情報(bào)語言學(xué)研究者對術(shù)語學(xué)的研究必定會獲益匪淺。
5 自然語言檢索
近10多年,隨著自然語言檢索的流行,圖書情報(bào)界議論自然語言檢索的文章很多,主流的論點(diǎn)是:①自然語言檢索是發(fā)展方向,信息檢索要走自然語言道路;②人工語言(情報(bào)檢索語言)不適應(yīng)網(wǎng)絡(luò)環(huán)境,自然語言不亞于人工語言;③目前自然語言雖有缺點(diǎn),但人工智能可使其達(dá)到完善,滿足一切檢索要求。
但是,如果仔細(xì)去看,可發(fā)現(xiàn):發(fā)表這些樂觀論點(diǎn)者幾乎都不是自然語言檢索的專門研究者,而專門研究自然語言檢索的學(xué)者中多數(shù)雖然也認(rèn)同以上某些觀點(diǎn),但他們所發(fā)表的文章比較平和、審慎,不下如此斷言。
自然語言在文獻(xiàn)(或日信息、情報(bào)、知識)檢索中的應(yīng)用大體可歸納為下列幾個方面:①關(guān)鍵詞索引及以關(guān)鍵詞為檢索標(biāo)識的文獻(xiàn)數(shù)據(jù)庫(數(shù)據(jù)庫中的關(guān)鍵詞檢索標(biāo)識來自人工自由標(biāo)引,或略加人工輔助的計(jì)算機(jī)抽詞,或藉助于詞典的自動抽詞);②全文數(shù)據(jù)庫;③搜索引擎及由搜索引擎自動建立的網(wǎng)絡(luò)資源數(shù)據(jù)庫;④自動甄別(知識本體語言);⑤自動標(biāo)引(自動抽取主題概念詞標(biāo)引);⑥自動分類。
以上6個主要方面,只有關(guān)鍵詞索引及數(shù)據(jù)庫、全文檢索、搜索引擎已進(jìn)入實(shí)用。其實(shí),這三個方面的實(shí)質(zhì)都是關(guān)鍵詞檢索。所以可以說,自然語言檢索目前僅在關(guān)鍵詞檢索的層次上已經(jīng)實(shí)現(xiàn)(但還不是非常成熟,不是無可指摘)。至于自動甄別、自動標(biāo)引和自動分類,嚴(yán)格地說都還沒有走出實(shí)驗(yàn)室進(jìn)入廣泛應(yīng)用。自然語言檢索的研究已有半個多世紀(jì)的歷史,進(jìn)展如 此緩慢,可見難度極大。
自然語言在情報(bào)檢索中的應(yīng)用,面臨著以下兩個難題:一是如何從自然語言文本中抽出(或者說確認(rèn))最能準(zhǔn)確、充分地表達(dá)文獻(xiàn)有價值內(nèi)容的詞以及這些詞與檢索課題有效匹配的問題。這個問題的復(fù)雜性在于文獻(xiàn)作者的用詞無明顯的規(guī)律性,并且作為人類社會現(xiàn)象的自然語言不可能用純自然科學(xué)的方法去研究解決。這個問題同機(jī)器翻譯的性質(zhì)類似。如果去追求百分之百的自動化,至少在短期內(nèi)是無希望解決的(當(dāng)然,自然語言自動處理現(xiàn)有的一些中間成果還是有實(shí)用價值的)。如果采用人機(jī)結(jié)合的方法,則可以較為容易一些。二是克服自然語言由于不規(guī)范和缺乏語義關(guān)聯(lián)性而對檢索不利的問題?朔@個難題也是不能完全用自動化方法的。除此以外,對中文來說還有一個漢語分詞的問題。漢語分詞的研究已取得很大進(jìn)展。但這個問題的解決,只是達(dá)到了拼寫文字國家的起點(diǎn)水平,拼寫文字中未解決的上述兩個問題仍有待我們?nèi)ソ鉀Q。
有不止一位作者說,自然語言檢索是情報(bào)檢索用語言發(fā)展的最高階段。他們說:從自然語言,到人工語言,再回到自然語言,或者說,從不控制,到控制,再到不控制,這是“否定之否定”,是情報(bào)檢索用語言的“發(fā)展規(guī)律”。
我認(rèn)為,這種理解是似是而非的。沒有任何控制的檢索用語言是不可思議的。至今還沒有找到在計(jì)算機(jī)環(huán)境下不加控制地利用自然語言的十分有效的方法。如果有,一定會被檢索網(wǎng)站立即用高價收買而付諸應(yīng)用。但至今在網(wǎng)絡(luò)上沒有發(fā)現(xiàn)那樣的方法,說明那樣的方法至少現(xiàn)在還不存在,將來也未必會出現(xiàn)。
自然語言到底會走向何方?我認(rèn)為,自然語言的未來與情報(bào)檢索語言的未來在某種意義上可以說是同一個問題。從一方面看,自然語言不可能全面取代情報(bào)檢索語言、淘汰情報(bào)檢索語言,情報(bào)檢索語言還將繼續(xù)發(fā)展;但從另一方面看,在計(jì)算機(jī)檢索的條件下,自然語言有許多重要的優(yōu)點(diǎn),故它也必然會更進(jìn)一步得到發(fā)展。總之,網(wǎng)絡(luò)檢索不能唯一地使用自然語言。自然語言的前途仍然要走向控制、規(guī)范,當(dāng)然,控制的方法會與過去人工語言所采用的方法有所不同。
其實(shí),自然語言檢索系統(tǒng)與情報(bào)檢索語言檢索系統(tǒng)并不是絕然對立的。既然兩者各有優(yōu)點(diǎn)而不可能互相取代,為什么不可以使兩者結(jié)合或融合呢?自然語言或情報(bào)檢索語言的未來將是自然語言的情報(bào)檢索語言化或情報(bào)檢索語言的自然語言化。
情報(bào)檢索語言的自然語言化、自然語言的情報(bào)檢索語言化,這是兩者發(fā)展的大趨勢,走兩者結(jié)合之路是大方向。在兩者完全融合的新型情報(bào)檢索語言普及以前的趨勢可能是下列三種情況并存:①情報(bào)檢索語言與自然語言在一個檢索系統(tǒng)中并用;②情報(bào)檢索語言增加自然語言成分;③自然語言適當(dāng)引進(jìn)情報(bào)檢索語言的原理與方法和增加情報(bào)檢索語言成分。
既然人工語言和自然語言都起著不可取代的作用,因而對兩者的研究不可偏廢。目前,亟待從情報(bào)語言學(xué)的角度來深入研究自然語言檢索中存在的問題(這是自然語言檢索研究中的薄弱環(huán)節(jié)),把情報(bào)語言學(xué)的原理和方法引進(jìn)自然語言檢索的研究,并要重視利用情報(bào)檢索語言已往所積累的成果(例如分類表和詞表對概念和術(shù)語的整理成果)。也要積極研究情報(bào)檢索語言在網(wǎng)絡(luò)環(huán)境下應(yīng)用中所遇到的新問題,尋找改進(jìn)方法,特別是吸取自然語言的優(yōu)點(diǎn)來彌補(bǔ)情報(bào)檢索語言的不足之處。這兩方面的研究,應(yīng)朝著并且必然會朝著從兩者的初步結(jié)合到完全融合。
總之,我對僅僅借助于計(jì)算機(jī)技術(shù)的純粹自然語言檢索(或者說不利用情報(bào)語言學(xué)原理控制的自然語言檢索)在短期內(nèi)(例如10年、20年)能完滿實(shí)現(xiàn)并不抱樂觀的態(tài)度。我越來越覺得亟需從情報(bào)語言學(xué)角度深入研究自然語言檢索方法,把情報(bào)語言學(xué)的原理和方法引進(jìn)自然語言檢索的研究。正是這樣,我近年的研究重點(diǎn),轉(zhuǎn)移到了自然語言在情報(bào)檢索中的應(yīng)用方面。
在自然語言在情報(bào)檢索中的應(yīng)用(包括網(wǎng)絡(luò)資源檢索工具)的研究方面,我曾寫過不少文章,如:
?《關(guān)于自然語言檢索問題》(《圖書館論壇》2004年第6期);
?《自然語言檢索中各種因素對檢索效率的影響》(《情報(bào)理論與實(shí)踐》1997年第5期);
?《人一機(jī)結(jié)合的題內(nèi)關(guān)鍵詞索引可回避漢語分詞難題》(《圖書館雜志》1993年第4期);
《題名關(guān)鍵詞與正文關(guān)鍵詞檢索性能的差別》(《中國索引》2004年第4期);
《自動抽詞與自動分詞》(《圖書館雜志》2002年第3期);
《文獻(xiàn)題名自動抽詞一分類標(biāo)引系統(tǒng)》(《圖書館雜志》1998年第4期);
?《自然語言與人工語言的對應(yīng)轉(zhuǎn)換一隋報(bào)檢索語言走向自動化之路》(《中國圖書館學(xué)報(bào)》1996年第1期);
?《積極為自然語言與情報(bào)檢索語言的結(jié)合創(chuàng)造務(wù)件――建議大量編制自然語言詞袁》(《圖書館雜志》1999年第9期);
?《走向自然語言與情報(bào)檢索語言結(jié)合之路》(《圖書館理論與實(shí)踐》2001年第2期);
《人工語言與自然語言、先控制與后控制的界限在計(jì)算機(jī)系統(tǒng)中可淡化或取消》(《圖書館雜志》1997年第5期);
?《分類語言、主題語言、自然語言一體化檢索系統(tǒng)》(《現(xiàn)代圖書情報(bào)技術(shù)》2002年第1期);
?《論后控制詞表》(《圖書情報(bào)工作》1994年第1期);
《充分利用入口詞原理》(《圖書館論叢》1992年試刊號);
《論自由標(biāo)引》(《圖書館學(xué)刊》1995年第5期);
?《概念分面組配型自動分類系統(tǒng)》(《圖書館學(xué)刊》2002年第6期);
《全文數(shù)據(jù)庫、全文檢索與全文標(biāo)引》(《圖書館理論與實(shí)踐》2002年第6期);
《全文檢索系統(tǒng)較好的模式》(《圖書館理論與實(shí)踐》2002年第5期);
《全文檢索系統(tǒng)的檢索性能》(《江西圖書館學(xué)刊》2004年第3期);
《字面相似聚類法輔助構(gòu)造詞族表、分面類表和自動標(biāo)引》(《圖書館論壇》2002年第5期);
《文獻(xiàn)題名初步研究》(《江西圖書館學(xué)刊》2006年第3期);
?《關(guān)于我國網(wǎng)絡(luò)信息檢索工具開發(fā)與改進(jìn)的思考》(《2000年理論學(xué)術(shù)年刊》);
(下轉(zhuǎn)第29頁)
?《網(wǎng)絡(luò)信息檢索工具增強(qiáng)關(guān)鍵詞檢索功能的措施》(《圖書館雜志》2001年第1期);
?《網(wǎng)絡(luò)信息檢索工具的分類體系》(《江蘇圖書館學(xué)報(bào)》2002年第4期);
?《因特網(wǎng)大眾分類法若干問題的探討》(《圖書館論壇》2005年第6期);
《因特網(wǎng)大眾分類法的本質(zhì)屬性》(《圖書館雜志》2002年第11期);
《因特網(wǎng)大眾分類法是獨(dú)立創(chuàng)造而不是對傳統(tǒng)分類法的改進(jìn)和發(fā)展》(《江西圖書館學(xué)刊》2005年第1期);
《因特網(wǎng)大眾分類法的標(biāo)準(zhǔn)化問題》(《中國索引》2004年第l期);
《分類瀏覽型網(wǎng)絡(luò)信息檢索工具的主要缺陷》(《中國索引》2005年第1期);
《專業(yè)型檢索工具與導(dǎo)航庫在發(fā)掘網(wǎng)絡(luò)信息資源中的重要作用》(《圖書館理論與實(shí)踐》2002年第6期);
?《網(wǎng)絡(luò)信息檢索用語言的發(fā)展趨勢》(《圖書館雜志》2001年第3期)。
在以上文章中,帶“?”號的文章,我認(rèn)為是比較重要的。
至于我在研究索引學(xué)方面的心得和收獲,因限于篇幅,不再作介紹了。
以上心得中的不正確、不完善之處,請不吝指正。
相關(guān)熱詞搜索:語言學(xué) 情報(bào) 收獲 情報(bào)語言學(xué)的若干研究心得和收獲 試論情報(bào)語言學(xué)的研究方法 情報(bào)語言學(xué)常用的研究方法
熱點(diǎn)文章閱讀