[認(rèn)知信息檢索研究的發(fā)展與展望]信息檢索與利用作業(yè)
發(fā)布時(shí)間:2020-03-07 來(lái)源: 散文精選 點(diǎn)擊:
[摘要]剖析認(rèn)知信息檢索概念和與之相關(guān)的幾個(gè)重要概念,如認(rèn)知觀、信息交互、情境、任務(wù)、多元表示、相關(guān)性;對(duì)相關(guān)研究模型――Wilson模型、Kuhlthau模型、Vakkari模型、Wang-Soergel模型、Ingwersen模型、Saracevic模型進(jìn)行評(píng)述,并回顧認(rèn)知信息檢索所取得的成就,展望其未來(lái)發(fā)展方向。
[關(guān)鍵詞]信息檢索認(rèn)知信息檢索信息查尋
[分類(lèi)號(hào)]G354
1、認(rèn)知信息檢索的概念
20世紀(jì)60一90年代,信息檢索(IR)領(lǐng)域出現(xiàn)了三大方向:系統(tǒng)導(dǎo)向的IR,用戶導(dǎo)向的IR和認(rèn)知導(dǎo)向的IR。
認(rèn)知導(dǎo)向的瓜,通常也被稱為認(rèn)知信息檢索(cognifiveInformation Retrieval,簡(jiǎn)稱CIR),是與傳統(tǒng)系統(tǒng)導(dǎo)向IR相區(qū)別的一種IR研究范式。系統(tǒng)導(dǎo)向IR的研究重點(diǎn)是作者文本、文本表示、提問(wèn)式與IR技術(shù),而CIR則將信息檢索者的認(rèn)知和行為表現(xiàn)作為研究的重點(diǎn)。
在20世紀(jì)70年代,CIR的主要特點(diǎn)是面向用戶和中介。隨著90年代在認(rèn)知上發(fā)生的重大變化和轉(zhuǎn)折(即:認(rèn)知革命、相關(guān)性革命和交互式革命),CIR觀點(diǎn)又有了新的發(fā)展與變化,從以往注重個(gè)體行動(dòng)者的信息行為及情境的個(gè)體主義認(rèn)知觀,轉(zhuǎn)變?yōu)殛P(guān)注信息傳遞過(guò)程中發(fā)生的所有交互過(guò)程的整體主義認(rèn)知觀[1],它更加關(guān)注復(fù)雜的瓜情景中的人類(lèi)行動(dòng)者、任務(wù)以及相關(guān)性。
2、幾個(gè)與認(rèn)知信息檢索相關(guān)的重要概念
2.1 認(rèn)知觀
認(rèn)知觀(cognifive Viewpoint):整體主義認(rèn)知觀的核心觀點(diǎn)是:任何信息處理――無(wú)論是感知還是符號(hào)的信息處理,都是由一個(gè)分類(lèi)系統(tǒng)或概念體系來(lái)介導(dǎo)的。對(duì)于信息處理設(shè)備而言,這就是它的一個(gè)世界模型――無(wú)論該設(shè)備是人還是機(jī)器。依據(jù)這種觀點(diǎn),世界模型是由包括情緒在內(nèi)的認(rèn)知結(jié)構(gòu)(或知識(shí)結(jié)構(gòu))所組成,而認(rèn)知結(jié)構(gòu)是由在社會(huì),組織/文化和系統(tǒng)情境下的個(gè)體與社會(huì)/集體經(jīng)驗(yàn)/教育等等多方面因素決定的。
CIR框架就是一種以整體主義認(rèn)知觀為基礎(chǔ)的、用于研究瓜現(xiàn)象的研究框架。其5個(gè)核心要素(/組件)是:信息檢索者,界面,社會(huì)一組織情境,IT,信息對(duì)象。它們之間通過(guò)信息交互聯(lián)系在一起。
2.2 信息交互
信息交互(Information Interaction)是指在IR情境中,兩個(gè)或更多的認(rèn)知行動(dòng)者之間的交流。交互是一個(gè)雙向的交流活動(dòng),信息交互是CIR框架中5個(gè)組成部分之間的核心情境橋梁。在IR中存在三種交互方式:短期的信息交互,基于會(huì)話期的信息交互以及長(zhǎng)期的、縱向的IR交互。
交互革命發(fā)生于20世紀(jì)90年代,是IR認(rèn)知轉(zhuǎn)折的一個(gè)重要方面,它強(qiáng)調(diào)用戶與系統(tǒng)的交互,認(rèn)為:①用戶的信息需求和行為不是靜態(tài)的,而是動(dòng)態(tài)的,會(huì)隨時(shí)間而發(fā)生變化;②交互發(fā)生在多個(gè)層面和多個(gè)維度;③交互就是要將用戶帶入一種選擇狀態(tài),以激發(fā)用戶做出某種選擇;④由于在IR交互情境中的學(xué)習(xí)和認(rèn)知,相關(guān)性評(píng)估因此也是動(dòng)態(tài)的,并且可能發(fā)生在各個(gè)維度,所以傳統(tǒng)的以主題性作為相關(guān)性測(cè)量指標(biāo)是不夠的。
2.3 情境
情境(Context)是CIR中的另一個(gè)重要概念。按照CIR的觀點(diǎn),與CIR框架中每個(gè)要素相關(guān)的行動(dòng)者和對(duì)象就成為他們基本認(rèn)知結(jié)構(gòu)的情境(即對(duì)象內(nèi)部情境),并成為彼此之間的情境(對(duì)象之間情境)。而在框架各個(gè)要素之間相互作用過(guò)程的情境中,這些框架要素自身又成為彼此的情境。在后者,可能會(huì)討論社會(huì)的、組織的、文化的以及體系的情境。所有的信息查尋、檢索的組成部分和相關(guān)活動(dòng)都處于公共的社會(huì)、物理與技術(shù)基礎(chǔ)結(jié)構(gòu)以及它們的歷史情境中。
情境具有歷史性(累積性),由認(rèn)知行動(dòng)者在與“使用團(tuán)體”、同行長(zhǎng)期接觸過(guò)程中獲得的知識(shí)及經(jīng)驗(yàn)組成。此外,情境還具有社會(huì)、文化或組織特征,與對(duì)象、系統(tǒng)、領(lǐng)域以及檢索者的工作和日常任務(wù)、情感、動(dòng)機(jī)、喜好等密切相關(guān)。歷史情境和實(shí)時(shí)交互情境(檢索會(huì)話)共同構(gòu)成了當(dāng)前情境,并直接影響認(rèn)知行動(dòng)者對(duì)當(dāng)前狀態(tài)的認(rèn)識(shí)與理解。在每一個(gè)要素內(nèi)部,其組成要素之間(包括最小的符號(hào)元素)又互為情境。
2.4 任務(wù)
任務(wù)(Work Task),是指認(rèn)知行動(dòng)者執(zhí)行的工作任務(wù)或與工作無(wú)關(guān)的日常任務(wù)或興趣。任務(wù)可以是現(xiàn)實(shí)生活中自然存在的任務(wù),也可以是模擬情景下分配的工作任務(wù)。如果行動(dòng)者已經(jīng)對(duì)此有所認(rèn)識(shí)但無(wú)法立即解決,這個(gè)工作任務(wù)就會(huì)導(dǎo)致不確定狀態(tài)和信息查尋或檢索行為。
任務(wù)是CIR中的一個(gè)核心概念,旨在強(qiáng)調(diào)任何IR的行為都是發(fā)生在任務(wù)的情境之下,是為了完成任務(wù)和提高績(jī)效而進(jìn)行的信息行為。工作任務(wù)是構(gòu)成IR和真正信息行為的驅(qū)動(dòng)力。
2.5 多元表示
多元表示(Polyrepresentation,也稱為多元證據(jù))原理起源于lngwersen與Pao,Ingwersen進(jìn)一步將其作為交互式IR的認(rèn)知理論成果而提出⑵。多元表示最初是作為一種提高檢索效率的知識(shí)組織方法而提出的,不僅意味著以各種形式進(jìn)行的與文獻(xiàn)內(nèi)容有關(guān)的主題檢索,還意味著對(duì)主題之外的文獻(xiàn)內(nèi)容檢索,例如通過(guò)格式、顏色、結(jié)構(gòu)要素、參考文獻(xiàn)或鏈出結(jié)構(gòu)與內(nèi)容錨點(diǎn)、引用或鏈入以及不同的元數(shù)據(jù)元素如作者、單位或期刊名稱等等。多元表示意在表明:指向文獻(xiàn)的知識(shí)表示在認(rèn)知和功能上越不同、越多樣,文獻(xiàn)與提問(wèn)式、信息需求、感知的工作任務(wù)情境相關(guān)的可能性就越大;通過(guò)認(rèn)知上不同的知識(shí)表示所產(chǎn)生的認(rèn)知重疊,從而發(fā)現(xiàn)文獻(xiàn)應(yīng)賦予最高的相關(guān)性。多元表示是整體主義認(rèn)知觀中利用不同行動(dòng)者的詮釋方式和認(rèn)知結(jié)構(gòu)多樣性的具體表現(xiàn)。
2.6 相關(guān)性
相關(guān)性概念是IR中的重點(diǎn)和難點(diǎn)。近年來(lái),除了傳統(tǒng)的系統(tǒng)相關(guān)和用戶相關(guān)類(lèi)型外,研究者們開(kāi)展了一些重要的理論研究和實(shí)驗(yàn)研究。研究進(jìn)一步發(fā)現(xiàn)和闡釋了算法相關(guān)、主題相關(guān)、需求相關(guān)、情景相關(guān)與社會(huì)認(rèn)知相關(guān)這5個(gè)不同的相關(guān)性類(lèi)型及其關(guān)系⑴:①算法相關(guān),類(lèi)似于檢索引擎處理的排序結(jié)果,并涉及到請(qǐng)求(或查詢)與檢索目標(biāo)之間的關(guān)系;②主題相關(guān),由人類(lèi)進(jìn)行的評(píng)估(解釋)方式,主要解決檢索到的文獻(xiàn)內(nèi)容和請(qǐng)求之間的相關(guān)性關(guān)系,這種相關(guān)不是客觀的,它具有主觀情感和智力的性質(zhì);③需求相關(guān),指在給定時(shí)點(diǎn)由搜索者感知到的檢索對(duì)象的本質(zhì)和信息需求之間的針對(duì)性;④情景相關(guān),指檢索到的對(duì)象和個(gè)體檢索者感知到的工作任務(wù)情景之間的關(guān)系;⑤社會(huì)認(rèn)知相關(guān),指領(lǐng)域、情境和集體性情境偏好。它表示由認(rèn)知行動(dòng)者進(jìn)行的情景相關(guān)評(píng)估和解釋以及這種評(píng)估和解釋隨時(shí)間的變化。
3、認(rèn)知IR研究的模型
3.1 Wilson模型
T.D.Wilson于1999年提出了IR信息行為研究模型⑶,揭示了主要概念間的嵌套關(guān)系,其核心思想是:IR總是處于信 息查尋過(guò)程的情境之中,而信息查尋又是構(gòu)成整體信息行為的其中一種。如圖1所示:
3.2 Kuhlthau的檢索階段與過(guò)程模型
CarolC.Kuhlthau開(kāi)展的一系列長(zhǎng)期研究結(jié)果表明,學(xué)生和圖書(shū)館用戶的學(xué)習(xí)任務(wù)與問(wèn)題解決包括幾個(gè)階段⑷。他從研究中總結(jié)出一種模型,認(rèn)為人們檢索與使用信息的差異取決于過(guò)程階段(見(jiàn)表1)。
Kuhlthau的模型也指向瓜的核心情感特性。該模型給同時(shí)代的其他研究者帶來(lái)了靈感,在不同領(lǐng)域中,他們利用該模型并證實(shí)了它的效用。
3.3 Vakkari模型
在2001年,Vakkari基于一系列的長(zhǎng)期實(shí)驗(yàn)研究⑸提出了一個(gè)新的模型。該模型顯示任務(wù)執(zhí)行階段和需要檢索的信息、檢索策略,并將檢索到的信息有機(jī)聯(lián)系在一起。如圖2所示:
該模型作用:①在與完成任務(wù)相關(guān)的知識(shí)中,領(lǐng)域知識(shí)和IR知識(shí)之間有著清晰的區(qū)別;②在任務(wù)執(zhí)行與解決過(guò)程中,信息利用明顯與檢索任務(wù)的執(zhí)行區(qū)分開(kāi)。檢索被視為信息利用的工具,而檢索與相關(guān)性評(píng)價(jià)的結(jié)果有助于信息利用。
3.4 Wang―Soergel模型
Wang與Soergel基于長(zhǎng)期的實(shí)驗(yàn)研究,于1998年提出了瓜的文獻(xiàn)選擇框架⑹(見(jiàn)圖3)。它也是一個(gè)階段模型,比圖2的Vakkari模型更詳細(xì),在決策階段應(yīng)用了11個(gè)相關(guān)性標(biāo)準(zhǔn)和5個(gè)文獻(xiàn)價(jià)值維度對(duì)如何選擇檢索到的文獻(xiàn)進(jìn)行決策。另外,它成功地將標(biāo)準(zhǔn)、價(jià)值與決策和所謂的“文獻(xiàn)信息元素”結(jié)合起來(lái)!拔墨I(xiàn)信息元素”即作者創(chuàng)建的文獻(xiàn)結(jié)構(gòu)、數(shù)據(jù)元素等重要數(shù)據(jù)。
3.5 Ingwersen的概念模型
Ingwersen在1992年出版的專著⑺中提出了IR交互模型。該模型包括信息檢索者的社會(huì)一組織環(huán)境(情境)(見(jiàn)圖4)。
3.6 Saracevic的概念模型
Saracevic于1996年提出了信息交互層面的分層模型嘲(見(jiàn)圖5)。該模型的特點(diǎn)是:①指向三個(gè)通訊層。第一層是表面處理層,負(fù)責(zé)數(shù)據(jù)源與基于提問(wèn)式的接口之間的計(jì)算數(shù)據(jù)處理;第二層是交互式認(rèn)知溝通層,包含在人一機(jī)交互期間的感知與感知到的信息需求相關(guān)的信息過(guò)程,即檢索者一提問(wèn)式接口之間的對(duì)話;第三層被稱為“情景層”,是指在某一環(huán)境的情景中,與感知到的工作任務(wù)有關(guān)的信息利用。第一層與信息處理的語(yǔ)言層相關(guān),后兩個(gè)層次則與信息處理的語(yǔ)義層和語(yǔ)用層相關(guān)。②有利于人們對(duì)有關(guān)交互IR的相關(guān)性類(lèi)型的修正和更準(zhǔn)確地領(lǐng)會(huì)。
4、認(rèn)知信息檢索所取得的主要成就
4.1 模型方面
在實(shí)驗(yàn)研究的基礎(chǔ)上,形成了綜合的研究模型,并應(yīng)用于實(shí)驗(yàn)研究。在此期間,模型之間有時(shí)互相集成或彼此組合。
4.2理論建構(gòu)方面
研究者嘗試發(fā)展和應(yīng)用更加綜合的理論構(gòu)架,ASK假說(shuō)、多元表示假說(shuō)等成為CIR的理論基礎(chǔ)。此外,該階段還提出了其他一些有關(guān)工作任務(wù)復(fù)雜性和工作任務(wù)情景的假說(shuō)。
4.3 IR評(píng)價(jià)方面
設(shè)計(jì)了新穎的IR評(píng)價(jià)模型以處理多維相關(guān)狀態(tài)中動(dòng)態(tài)的信息情景,例如受IR認(rèn)知觀啟發(fā)而來(lái)的交互IR評(píng)價(jià)包。
4.4 相關(guān)性研究方面
研究者成功地發(fā)現(xiàn)了多種相關(guān)類(lèi)型以及可供使用的相關(guān)性標(biāo)準(zhǔn)分類(lèi);在與搜索者相關(guān)的最佳匹配中,相關(guān)性研究也取得了突破;在真實(shí)環(huán)境中,包括檢索者在內(nèi)的(間接)相關(guān)反饋和查詢修改算法受到了關(guān)注。
4.5 分級(jí)相關(guān)性方面
分級(jí)相關(guān)性被重新發(fā)現(xiàn),并開(kāi)展了實(shí)驗(yàn)研究。結(jié)果得到了許多新穎的、適用于真實(shí)的交互式IR研究評(píng)價(jià)的性能評(píng)價(jià)指標(biāo),從而搭起了與實(shí)驗(yàn)室IR研究團(tuán)體溝通的橋梁。
4.6 方法學(xué)方面
對(duì)IR現(xiàn)象的實(shí)驗(yàn)研究大量增加,并應(yīng)用了一定的方法學(xué)。長(zhǎng)期的縱向研究方法也得到了應(yīng)用。此外,研究的對(duì)象也從成人擴(kuò)展到兒童,并且開(kāi)始在網(wǎng)絡(luò)環(huán)境中進(jìn)行研究。5認(rèn)知信息檢索的未來(lái)發(fā)展方向[1.9]
5.1 情境方面
CIR將與人類(lèi)信息行為集成,從而更加全面地理解CIR。在IR研究中,將人類(lèi)信息行為的情境考慮在內(nèi),正是在該情境中,人與IR系統(tǒng)發(fā)生交互作用。
5.2 認(rèn)知研究方面
在認(rèn)知研究方面,需要繼續(xù)開(kāi)展深入研究,以期更多地了解人類(lèi)-IR系統(tǒng)交互作用的認(rèn)知?jiǎng)恿W(xué)。
5.3 社會(huì)和組織研究方面
在社會(huì)和組織研究方面,需要繼續(xù)展開(kāi)深入研究,探索人類(lèi)與IR系統(tǒng)在社會(huì)和組織層面上的交互作用。
5.4 相關(guān)性和評(píng)價(jià)研究方面
相關(guān)性一直是而且今后仍是CIR研究的重點(diǎn)。
5.5 情境觀和認(rèn)知觀方面
在情境觀和認(rèn)知觀的統(tǒng)領(lǐng)下,研究與信息查尋不同的研究路徑和研究陣營(yíng),將從以往相互隔離的狀態(tài)逐步走向互動(dòng)與整合,最終可能形成集成的信息查尋及檢索研究框架。
6、結(jié)語(yǔ)
1977-1982年是認(rèn)知IR觀被確立為一種理論觀點(diǎn)的時(shí)期,CIR作為一種獨(dú)立的研究范式得以確立和發(fā)展。隨后,與CIR相關(guān)的重要概念得到了闡述,有關(guān)的理論基礎(chǔ)和假說(shuō)也得到發(fā)展,建立了相應(yīng)的研究模型,陸續(xù)展開(kāi)了一系列的實(shí)驗(yàn)研究,取得了一系列的研究成果。如2005年出版的兩部著作((The Turn:Integration of Information Seeking andRetrieval inContext))m~H((New directions in cognitDe information retrieval))191.對(duì)CIR研究進(jìn)行了系統(tǒng)的總結(jié)。
從長(zhǎng)遠(yuǎn)來(lái)看,CIR為具有圖書(shū)館人文傳統(tǒng)的信息查尋與具有情報(bào)學(xué)技術(shù)傳統(tǒng)的信息檢索之間建立起互動(dòng)與溝通的橋梁,尋求讓兩者在情境中進(jìn)行有機(jī)的集成,從而開(kāi)創(chuàng)一條新的研究路徑,有望發(fā)展成為一個(gè)新的統(tǒng)一、集成的理論體系,并最終改進(jìn)IR及WEB系統(tǒng)的設(shè)計(jì)。 [2]De Mey M. The relevance of the cognitive paradigm for information science // Harbo O, Kajberg L. Theory and application of information research: Proceedings of the 2nd International Research Forum on Information Science (IRFIS 2). Copenhagen: Royal School of Librarianship, 1980: 48-61
[3]Ingwersen P, Ja..rvelin K. The turn: Integration of information seeking and retrieval in context. Dordrecht: Springer, 2005.
[4]Wilson T D. Review of :Ingwersen P, Jarvelin K. The turn: Integration of information seeking and retrieval in context. [2007-04-30].省略/ir/reviews/revs189.html.
[5]賴茂生,王琳. 情報(bào)檢索發(fā)展路徑的轉(zhuǎn)向――評(píng)丹麥情報(bào)學(xué)家英格沃森的新著. 情報(bào)學(xué)報(bào), 2006,25(12):755-760.
[6]Yazdan M. Book review: The turn: Integration of information seeking and retrieval in context. [2007-05-08]. http://www.webology.ir/2006/v3n3/bookreview4.html.
[7]Bawden D. Book review: The turn: Integration of information seeking and retrieval in context. Journal of Documentation, 2007, 63(2): 290-292
[8]James D A. Book review: The turn: Integration of information seeking and retrieval in context. Information Processing and Management, 2007, 43(3): 821-833
相關(guān)熱詞搜索:認(rèn)知 展望 信息檢索 認(rèn)知信息檢索研究的發(fā)展與展望 研究與發(fā)展管理 發(fā)展研究
熱點(diǎn)文章閱讀