多媒體信息檢索系統(tǒng)中的用戶需求集成|培訓(xùn)需求分析的方法
發(fā)布時(shí)間:2020-03-10 來源: 感恩親情 點(diǎn)擊:
[摘要]為更有效地對(duì)多媒體信息進(jìn)行檢索,在設(shè)計(jì)多媒體信息檢索系統(tǒng)時(shí)人們開始更加注重用戶的信息需求。本文設(shè)計(jì)一種新的檢索方法對(duì)用戶信息需求進(jìn)行集成,即把用戶的信息需求集成到信息檢索結(jié)果的“語用環(huán)境”中。通過使用該方法,可以對(duì)多媒體信息檢索中的用戶需求進(jìn)行更有效的集成。
[關(guān)鍵詞]多媒體信息檢索系統(tǒng) 信息需求 語用環(huán)境
[分類號(hào)]G354
1 引言
1.1 國(guó)內(nèi)外多媒體信息檢索系統(tǒng)開發(fā)現(xiàn)狀
多媒體信息檢索包括基于文本的多媒體信息檢索和基于內(nèi)容的多媒體信息檢索。目前,在基于文本的多媒體信息檢索方面,美國(guó)康奈爾大學(xué)開發(fā)出基于向量空間模型的SMART文本檢索系統(tǒng),美國(guó)馬薩諸塞大學(xué)研究出基于概率模型的INQUERY文本檢索系統(tǒng)。在基于內(nèi)容的多媒體信息檢索方面,美國(guó)堪薩斯大學(xué)開發(fā)出數(shù)字圖書館系統(tǒng)(DVLS)圖像檢索系統(tǒng),該系統(tǒng)計(jì)劃存儲(chǔ)、索引及檢索圖像、聲頻信息,已建立起一個(gè)VISION的原型系統(tǒng)及一個(gè)數(shù)據(jù)庫(kù);馬里蘭大學(xué)開發(fā)出Voice Graph音頻檢索系統(tǒng),該系統(tǒng)基于內(nèi)容和基于說話人的查詢,檢索已知的說話人和語詞,并設(shè)計(jì)音頻圖示查詢接口。
我國(guó)在基于內(nèi)容的文本檢索方面,清華大學(xué)的《中國(guó)學(xué)術(shù)期刊(光盤版)》、北大方正的MIRS、易寶北信的TRS全文檢索系統(tǒng)都采用了布爾模型。在基于內(nèi)容的音頻檢索系統(tǒng)方面,有ARS系統(tǒng);中國(guó)科學(xué)院計(jì)算技術(shù)研究所開發(fā)了基于形狀的圖像檢索系統(tǒng);清華大學(xué)研發(fā)的TV-FI(Tsinghua Video Find It)系統(tǒng)是視頻節(jié)目管理系統(tǒng),提供視頻數(shù)據(jù)入庫(kù)、基于內(nèi)容的瀏覽檢索等功能。
國(guó)內(nèi)外對(duì)多媒體信息檢索系統(tǒng)的開發(fā)研究,無論是基于文本的檢索,還是基于內(nèi)容的檢索,其基本思路都是用戶以提問的形式表達(dá)信息需求,然后系統(tǒng)對(duì)提問進(jìn)行匹配從而在數(shù)據(jù)庫(kù)中找出相關(guān)信息。如清華大學(xué)的《中國(guó)學(xué)術(shù)期刊(光盤版)》,其多媒體信息檢索過程如圖1所示。
1.2 存在的問題
基于文本的多媒體信息檢索,其檢索純粹是以多媒體信息的外部特征作為檢索入口,無法表達(dá)和揭示多媒體信息的實(shí)質(zhì)內(nèi)容和語義信息;而基于內(nèi)容的多媒體信息檢索,相對(duì)于基于文本的多媒體信息檢索有著明顯的優(yōu)勢(shì),但卻存在以下問題:①系統(tǒng)中對(duì)象特征相關(guān)性、通用性不足。現(xiàn)有大多數(shù)基于內(nèi)容的視頻檢索系統(tǒng),要么只針對(duì)某一具體領(lǐng)域的應(yīng)用,要么只針對(duì)媒體的某物理特征或基于物理特征的邏輯關(guān)系開展研究。系統(tǒng)中各媒體特征之間缺乏內(nèi)在的關(guān)聯(lián)性描述,使得系統(tǒng)的檢索效率不高,通用性不好。②對(duì)目標(biāo)描述的研究相對(duì)較少,而且主要針對(duì)對(duì)象的底層內(nèi)容檢索。雖然有些系統(tǒng)能綜合利用媒體的若干特征,但往往局限于媒體特征的外部組合,還沒有深入研究各類媒體特征的內(nèi)在相關(guān)性,更沒有考慮多媒體對(duì)象的高層語義。因此,當(dāng)用戶提交一個(gè)檢索特征進(jìn)行查詢時(shí),系統(tǒng)很難找到用戶真正想要尋找的信息。
為解決以上問題,本文提出一種新的檢索方法,在多媒體信息檢索系統(tǒng)中集成用戶的信息需求,在進(jìn)行信息檢索前,系統(tǒng)就對(duì)用戶的信息需求進(jìn)行集成分析,從而使檢索結(jié)果更加接近用戶真正的需求,系統(tǒng)的查詢效果也得到了提高。
2 多媒體信息檢索系統(tǒng)中的用戶信息需求集成
所謂“多媒體信息檢索系統(tǒng)的用戶信息需求集成”,是指設(shè)計(jì)一種新的檢索方法,即在信息系統(tǒng)的設(shè)計(jì)階段就對(duì)用戶信息進(jìn)行描述,把用戶的信息需求集成到信息檢索結(jié)果的“語用環(huán)境”中,以達(dá)到滿足用戶需求的目的。通過使用該方法,可以對(duì)多媒體信息檢索中的用戶需求進(jìn)行更有效的集成。
2.1 設(shè)計(jì)思路
2.1.1 設(shè)計(jì)階段的用戶信息描述1996年,Chevaliet和Nigy提出了信息需求的準(zhǔn)確表達(dá),即它是用戶研究領(lǐng)域的一種知識(shí)。用戶信息需求包括對(duì)信息客體的需求以及為了滿足這一需求而產(chǎn)生的對(duì)信息檢索工具、系統(tǒng)的需求和對(duì)信息服務(wù)的需求。
設(shè)計(jì)階段的用戶信息描述包括:①用戶身份描述(User Identity):姓名、姓氏、地址、職業(yè)、職稱、學(xué)歷、研究方向等;②用戶信息需求描述(Information Needs ofUser):相當(dāng)于檢索信息的語用環(huán)境。
用戶身份的描述主要包括姓名、地址等基本信息的描述,而用戶信息需求的描述是通過描述檢索結(jié)果的“語用環(huán)境”完成的,因?yàn)橥ㄟ^描述“語用環(huán)境”可以確保在系統(tǒng)中有效集成用戶的信息需求。
2.1.2 語用環(huán)境所謂語用環(huán)境即語境,是“言語行為過程中對(duì)話雙方運(yùn)用語言表達(dá)思想、交流情感或推導(dǎo)、分析理解話語含義時(shí)所依賴的各種因素,包括語言知識(shí)和語言外知識(shí)兩個(gè)方面”。
在用戶信息需求提出和接收的過程中,服務(wù)人員首先必須具備用戶所用語言的知識(shí),包括所用語言的語法、詞匯、語音的系統(tǒng)及其規(guī)則等,這是理解用戶信息需求必須的最基本的語境知識(shí)。其次,服務(wù)人員必須了解用戶表達(dá)需求的上下文。因?yàn)橛脩粜枨蟮谋磉_(dá)和溝通過程必然是一個(gè)動(dòng)態(tài)的、不斷發(fā)展的過程。在這個(gè)過程中,新的話語不斷產(chǎn)生,每一句話都有可能與前面已經(jīng)出現(xiàn)的話語存在聯(lián)系,可能不斷完善或表達(dá)著用戶的需求,為了全面、準(zhǔn)確地理解用戶的需求,必須了解一段話與上下文的聯(lián)系。
下面可以體會(huì)一段典型的對(duì)話:
一位讀者在圖書館對(duì)圖書館員問:“同志,請(qǐng)問《霧》、《雨》、《電》在什么地方?”
圖書館員回答:“中國(guó)文學(xué)類,分類號(hào)1345.6”,或干脆回答在某個(gè)室某個(gè)書架上。
這種對(duì)話在日常交際中極容易引起誤解,但在圖書館這個(gè)特定的場(chǎng)所,圖書館員不會(huì)產(chǎn)生歧解,便是因?yàn)榫唧w的地點(diǎn)、場(chǎng)合及其相關(guān)背景知識(shí)起了制約和引導(dǎo)作用。
因此,在分析用戶需求時(shí),必須與當(dāng)時(shí)的地點(diǎn)、場(chǎng)合及其相關(guān)背景知識(shí)聯(lián)系起來,必須與用戶說話的上下文和用戶當(dāng)時(shí)的心情、情緒聯(lián)系起來,因?yàn)檫@些因素都可能影響用戶的信息需求表達(dá)。另外,用戶的身份、思想、職業(yè)、修養(yǎng)、性格等因素,既是決定用戶信息需求的客觀因素,也決定著用戶信息需求的表達(dá),成為用戶與服務(wù)人員交流和溝通的語境。因此,接收和分析用戶的信息需求,必須考慮所有上述因素的影響。
2.1.3 用戶信息需求及其集成模型 考慮到不同類型多媒體內(nèi)容的存在,假定用戶對(duì)信息的檢索都是基于特定需求的,可以通過信息檢索結(jié)果的語用環(huán)境對(duì)用戶進(jìn)行建模。
考慮到用戶信息需求的多樣性以及用戶信息需求集成后檢索結(jié)果的精確性與全面性,在設(shè)計(jì)系統(tǒng)時(shí),可直接通過用戶信息描述將多媒體信息檢索系統(tǒng)中的用戶類型及其信息需求的內(nèi)容區(qū)分出來,構(gòu)成用戶信息需求模型,如圖2所示。
?對(duì)于專業(yè)化用戶來說,其信息需求內(nèi)容相對(duì)穩(wěn)定,歸納起來主要有:了解全、新、準(zhǔn)的有關(guān)科研的前沿問題;科技查新;學(xué)習(xí)本專業(yè)領(lǐng)域的最新學(xué)科知識(shí);為提高自己的綜合素質(zhì)而廣泛閱讀;解決學(xué)習(xí)中遇到的難題;完成學(xué)業(yè)論文查詢專業(yè)信息;了解社會(huì)動(dòng)向等。 ?對(duì)于一般網(wǎng)絡(luò)用戶來說,其信息需求主要內(nèi)容包括以下方面:了解國(guó)內(nèi)外有關(guān)新聞和信息;閱讀網(wǎng)上文學(xué)、期刊、報(bào)紙等;尋求新的學(xué)習(xí)途徑、遠(yuǎn)程教育、出國(guó)深造;學(xué)習(xí)因特網(wǎng)技術(shù);了解人才市場(chǎng)信息;應(yīng)用BBS或虛擬社區(qū)進(jìn)行聊天或問題探討;發(fā)送郵件賀卡;網(wǎng)上娛樂等。
如今,由于社會(huì)的不斷發(fā)展,用戶的信息需求已趨向于社會(huì)化、實(shí)用化、濃縮化、個(gè)性化。因此,在設(shè)計(jì)多媒體信息檢索系統(tǒng)時(shí),一定要銘記用戶的信息需求,以便更有效地對(duì)用戶的信息需求進(jìn)行集成;同時(shí)在信息系統(tǒng)創(chuàng)建和反饋過程中更精確地集成結(jié)果信息的使用語境,加強(qiáng)更有針對(duì)性的用戶需求。
通過上述分析,筆者設(shè)計(jì)的多媒體信息檢索系統(tǒng)中的用戶信息需求集成模型如圖3所示。
從圖3可以看出,信息需求被集成到系統(tǒng)中是通過與用戶和語用環(huán)境相關(guān)的屬性來完成的。這些屬性可被提前定義或由用戶在檢索信息的過程中進(jìn)行添加。在該應(yīng)用過程中,定義出信息檢索的四個(gè)語用環(huán)境:培訓(xùn)(training)、教學(xué)(teaching)、娛樂(entertain-ment)、內(nèi)容(documcntation)。但需要明確的是,這四個(gè)語用環(huán)境都是信息檢索過程中最常用到的,實(shí)際中并不能預(yù)測(cè)出所有信息檢索的可能語境,當(dāng)然也可能是用戶找不到與他相關(guān)的語境。為了彌補(bǔ)這種語境“缺失”的問題,可以建立一種開放式模式來描述多媒體信息。該模式即使是在信息系統(tǒng)開發(fā)之后還允許用戶描述其新的語用環(huán)境,也就是通過標(biāo)識(shí)處理用戶可以詳細(xì)說明他們的新語境。這種詳細(xì)說明是通過語用環(huán)境的屬性重組表達(dá)出來的。此后,不管用戶的信息需求是否相同,這種已被描述的檢索信息語用環(huán)境都可被各種用戶使用。該語用環(huán)境的使用可被看作是一種協(xié)作式信息檢索。依照這種思路在設(shè)計(jì)多媒體信息檢索系統(tǒng)時(shí)可建立流程圖,該流程圖描述了多媒體信息庫(kù)與用戶之間的關(guān)系,如圖4所示。
2.2 實(shí)例分析――QBIC系統(tǒng)中的用戶需求集成QBIC(Query By Image Content)是IBM Almaden研究中心研制的,是第一個(gè)真正的功能齊全的CBR(基于案例的推理)系統(tǒng),它用到的檢索特征包括顏色、形狀、紋理、對(duì)象形狀等,這些特征一般采用半自動(dòng)的方法抽取出來,系統(tǒng)通過范例、用戶描繪的草圖、選擇的顏色和紋理圖案、攝像機(jī)移動(dòng)、組成物體運(yùn)動(dòng)情況等方式來進(jìn)行數(shù)據(jù)庫(kù)查詢。QBIC系統(tǒng)的查詢步驟如下:用戶提出查詢要求,系統(tǒng)按查詢要求將一系列結(jié)果按相似順序排出。查詢要求通過圖形化或示例的方式提出,而結(jié)果是按相似程度順序排列的圖像集合。為完成這一功能,QBIC主要由兩個(gè)部分組成:數(shù)據(jù)庫(kù)生成部分和數(shù)據(jù)庫(kù)查詢部分。在數(shù)據(jù)庫(kù)生成時(shí),每一個(gè)圖像對(duì)象和視頻對(duì)象的內(nèi)容特征,包括顏色、紋理、形狀及攝影機(jī)和對(duì)象的移動(dòng)等,都被數(shù)據(jù)庫(kù)生成部分提取出來并存人數(shù)據(jù)庫(kù)中。在數(shù)據(jù)庫(kù)查詢時(shí),數(shù)據(jù)庫(kù)查詢部分將把用戶用圖形化方法提供的對(duì)象特征,與數(shù)據(jù)庫(kù)中存儲(chǔ)的對(duì)象內(nèi)容特征進(jìn)行比較匹配,尋找出具有相似特征的圖像和視頻。在QBIC中其數(shù)據(jù)模型分成兩個(gè)層次:場(chǎng)景(或圖像)和對(duì)象。所謂場(chǎng)景就是一幅圖像或視頗中的單個(gè)代表幀。對(duì)象是場(chǎng)景的一部分,或者是視頻中的一個(gè)運(yùn)動(dòng)的實(shí)體。特征將從圖像和對(duì)象中提取出來,并存人數(shù)據(jù)庫(kù)中。QBIC查詢結(jié)構(gòu)圖見圖5。
在QBIC系統(tǒng)中進(jìn)行用戶需求集成,首先要在設(shè)計(jì)階段進(jìn)行用戶信息描述,即用戶身份描述和用戶信息需求描述;然后是用戶信息需求建模(見圖2);最后是設(shè)計(jì)QBIC系統(tǒng)中的用戶信息需求集成模型,如圖6所示。
設(shè)計(jì)階段對(duì)用戶信息的描述,使最終的匹配結(jié)果也將根據(jù)用戶的不同而不同,最終檢索系統(tǒng)將更有針對(duì)性地反饋給不同的用戶。這樣不僅提高了檢索的效率,同時(shí)也提高了檢索的準(zhǔn)確度。3結(jié)語
本文的研究目的是對(duì)多媒體信息檢索系統(tǒng)中的用戶需求進(jìn)行集成。該系統(tǒng)的使用用戶是定向的而且它也可以根據(jù)用戶的語用環(huán)境進(jìn)行恰當(dāng)?shù)恼{(diào)整。此外,本文提出將用戶信息需求集成到信息檢索結(jié)果的“語用環(huán)境”中,這種方法不僅可以確保用戶和系統(tǒng)之間的有效互動(dòng),而且使多媒體信息系統(tǒng)更有助于用戶對(duì)檢索信息及其語用環(huán)境進(jìn)行描述。
相關(guān)熱詞搜索:多媒體信息 需求 集成 多媒體信息檢索系統(tǒng)中的用戶需求集成 多媒體信息集成軟件 多媒體信息集成工具
熱點(diǎn)文章閱讀