[基于本體論的高校圖書館個性化書目推送系統(tǒng)]推送
發(fā)布時間:2020-03-07 來源: 散文精選 點擊:
[摘要]針對高校圖書館個性化服務(wù)的要求,研究利用本體論技術(shù)實現(xiàn)高校圖書館個性化的書目信息推送服務(wù)。對書目信息本體論、用戶信息本體論和用戶興趣模型的構(gòu)建進行介紹,并在此基礎(chǔ)上構(gòu)建一種基于本體論的高校圖書館個性化書目信息推送系統(tǒng)模型,該模型不但可以為每本書找到它們潛在的讀者,還可以為讀者節(jié)省時間,使讀者不用到圖書館就可以獲取所需書目信息,為高校圖書館實現(xiàn)個性化書目信息推送服務(wù)提供參考。
[關(guān)鍵詞]本體論 個性化服務(wù) 書目推送 高校圖書館
[分類號]G250
隨著信息化時代的到來,人們對信息的實效性要求越來越高,高校圖書館如何不斷地改進服務(wù)質(zhì)量,更好地服務(wù)廣大師生已成為一個緊迫課題。而如何及時主動地為廣大師生提供個性化書目推送服務(wù)正是其中的要求之一。主動推送的書目信息必須符合用戶需求,需要根據(jù)用戶對館藏書目檢索和圖書館網(wǎng)絡(luò)的使用情況,收集用戶行為數(shù)據(jù)進行分析,從而挖掘出用戶的潛在需求,再相對應(yīng)地制定推送策略,為廣大師生提供個性化的書目信息推送服務(wù)。這種個性化的書目推送服務(wù),體現(xiàn)了阮岡納贊提出的“圖書館五法則”中“每本書有其讀者”,“節(jié)省讀者的時間”這兩條原則。
目前,針對本體論的研究是圖書情報領(lǐng)域的研究熱點,無論是領(lǐng)域本體論的構(gòu)建還是個性化信息服務(wù)中基于本體論的用戶興趣模型的構(gòu)建,都有很多研究成果報道,而關(guān)于書目信息推送服務(wù),雖然也有較多的研究成果,如利用RSS信息聚合技術(shù)來實現(xiàn)圖書信息推送服務(wù),利用郵件及手機短信進行書目信息推送服務(wù)等,但利用本體論技術(shù)進行個性化書目信息推送服務(wù)的研究,還鮮有相關(guān)報道。本體論作為一種新的知識表示方式,由于具有良好的概念層次結(jié)構(gòu)和對邏輯推理的支持,因而在實現(xiàn)個性化的書目信息推送服務(wù)中具有很好的應(yīng)用前景。本文擬對此進行相關(guān)研究,為高校圖書館實現(xiàn)個性化書目信息推送服務(wù)提供參考。
1、高校圖書館個性化書目信息推送服務(wù)
高校圖書館個性化信息服務(wù),是指針對不同的用戶(學(xué)生或教師),根據(jù)其個人信息,采取不同的服務(wù)策略,提供不同的服務(wù)內(nèi)容來滿足其對信息的不同需求。開展個性化的書目信息推送服務(wù),就是在個性化書目信息推送系統(tǒng)的環(huán)境下,根據(jù)用戶的特征提供用戶需要的具有針對性的信息,同時通過對用戶專業(yè)特征、研究興趣的智能分析而主動地向用戶推薦其可能需要的書目信息,以滿足用戶信息需求多元化的需要,提高圖書館的服務(wù)質(zhì)量和服務(wù)層次。
高校圖書館提供的個性化書目信息推送服務(wù)有其自身的特點:①服務(wù)對象明確、層次分明。高校圖書館主要服務(wù)對象是高校的教學(xué)科研人員、行政管理人員和學(xué)生,就每類服務(wù)對象而言,又可再進行細分。比如:教師可分為教授、副教授、講師、助教等,學(xué)生可分為博士研究生、碩士研究生、本科生等,這就要求高校圖書館根據(jù)各類對象對信息資源需求的側(cè)重點不同而提供個性化書目信息推送服務(wù)。②服務(wù)對象知識化突出、專業(yè)化明顯。高校師生是高校圖書館的主要服務(wù)對象,他們具有較高的文化水平,對專業(yè)知識的掌握比較深入,因而對信息服務(wù)的質(zhì)量要求比較高,對書目信息的需求主要集中在相關(guān)專業(yè)及鄰近專業(yè)上。因此,必須針對不同服務(wù)對象的不同特點提供書目信息推送,才能充分發(fā)揮個性化書目信息推送服務(wù)的重要作用。
2、書目信息及用戶信息本體論庫
為了實現(xiàn)基于本體論的個性化書目信息推送服務(wù),建立一個能全面準確表達書目資源信息以及用戶信息的本體論庫是關(guān)鍵所在。該本體論庫不但能全面準確地描繪出書目資源以及用戶特征的標志信息,而且可以清晰地建立起書目資源之間、用戶之間以及書目資源與用戶之間的各種聯(lián)系,這也正是基于本體論的個性化書目信息推送系統(tǒng)的優(yōu)勢所在。本體庫設(shè)計如圖1所示:
從圖1可知,本體論庫中至少要包括書目信息資源類、讀者特征類和知識庫類等3個類目。書目信息資源類的屬性包括資源的標題、作者、相關(guān)知識以及相關(guān)讀者等,其中相關(guān)知識的屬性值域指向知識庫類,可以建立起書目資源實例與知識庫中特定知識領(lǐng)域?qū)嵗碾`屬關(guān)系;相關(guān)讀者屬性值域為讀者特征類,可以建立起特定資源與該資源的目標讀者之間的關(guān)聯(lián)。讀者特征類的屬性包括讀者類型、專業(yè)方向、學(xué)位學(xué)歷、興趣愛好以及關(guān)聯(lián)讀者,其中專業(yè)屬性與興趣屬性,其值域指向知識庫類的實例,以建立起用戶與知識庫領(lǐng)域?qū)嶓w的一對一或一對多關(guān)系。知識庫類則以某個知識領(lǐng)域通用的概念為描述對象,建立并描述這些概念之間的關(guān)系。
3、基于本體論的用戶興趣模型
基于本體論的用戶興趣模型可以借助于書目信息本體論以及用戶的個人信息資料來構(gòu)建,其中的每一個概念都被賦予一個初始值為0的概念興趣相關(guān)度。隨著用戶檢索圖書館書目系統(tǒng)以及辦理借閱次數(shù)的不斷增加,通過對用戶興趣相關(guān)領(lǐng)域概念的提取以及對概念興趣相關(guān)度的計算,不斷在用戶興趣模型中累加此概念的興趣相關(guān)度權(quán)重,這樣經(jīng)過一段時間,用戶興趣模型中概念興趣相關(guān)度非零的概念節(jié)點逐漸趨于穩(wěn)定,即用戶興趣模型逐漸收斂。其中概念興趣相關(guān)度權(quán)重越高的概念表明其與用戶的興趣越相關(guān)。
3.1 用戶興趣的獲取
目前各個圖書館的流通管理系統(tǒng)數(shù)據(jù)庫中都積累了大量的讀者借閱歷史數(shù)據(jù)以及讀者在辦理借書證時留下的大量個人信息資料,利用這些信息我們可以挖掘出用戶對圖書資源的借閱偏好模式以及用戶潛在的需求,獲取用戶的興趣所在。
?根據(jù)用戶個人信息進行聚類。雖然每個用戶都有其個性化需求,但是在一定條件下,他們的需求會有相似性,因此可以收集用戶公開的所有個人信息,將相同屬性的用戶聚類。例如:相同專業(yè)年級的學(xué)生對某些課程科目的信息需求是類似的,在館藏書目系統(tǒng)中,他們也許就使用過同一個主題詞進行檢索。同一屬性類的用戶中,某一用戶感興趣的書目,另一用戶也有可能感興趣。
?根據(jù)用戶檢索數(shù)據(jù)進行分析。用戶在使用書目查詢系統(tǒng)時輸入的檢索記錄,反映了用戶感興趣的書目信息,我們可以通過分析用戶輸入的檢索詞,包括題名、責(zé)任者、主題詞以及分類號等,來獲取用戶的興趣概念;在這個過程中,對于用戶輸入的責(zé)任者、主題詞等檢索項,可以直接提取作為用戶的興趣概念;對于用戶輸入的題名,則要先通過分詞等技術(shù)抽取出能代表該書目內(nèi)容的特征詞語,然后把這些特征詞語與領(lǐng)域本體論中的概念進行匹配,實現(xiàn)從特征詞語到概念詞語的轉(zhuǎn)換,從而獲取用戶的興趣概念;對于用戶輸入的分類號,要先把分類號轉(zhuǎn)換成相應(yīng)的類目概念作為用戶興趣概念。
?根據(jù)用戶訪問日志進行挖掘。圖書館網(wǎng)站的Web服務(wù)器積累了大量的用戶訪問數(shù)據(jù),這些數(shù)據(jù)是用戶真實意圖和動機在行為上的表現(xiàn)。通過Web日志文件,我們可以獲取用戶的訪問頁面以及用戶在每頁停留的時間等數(shù)據(jù)。對這些數(shù)據(jù)進行分析,用戶瀏覽頁面上可能含有用戶所尋找的信息,進一步挖掘用戶的隱性需求。
3.2 概念興趣相關(guān)度的獲取 影響用戶的概念興趣相關(guān)度的主要因素有:①用戶借閱某本書的時間Length。對于某本書,用戶借閱時間越長,則表明用戶對該書興趣越大;②用戶借閱或檢索某本書距離現(xiàn)在的時間PassedTime。很明顯,用戶很久以前借閱的某本書和剛剛借閱的相比,后者用戶更感興趣;③用戶的直接反饋Evaluation。用戶對推送書目的評價最能反映用戶對該書的興趣程度。
考慮以上幾個因素,用戶借閱或檢索某本書后,對該書所對應(yīng)概念的興趣度變化AI,可以參考如下的計算公式:
△I=W1*f1(Time,Length)+W2*f2(PasssedT-ime)+W3*f3(Evaluation)
(1)
其中,f1、f2、f3為三個函數(shù),分別用于計算上述三個因素對該書目對應(yīng)概念的興趣相關(guān)度的影響。w1、w2、w3分別為這三個因素在影響概念的興趣相關(guān)度變化量中所占的權(quán)重。
4、一種基于本體論的書目信息推送系統(tǒng)模型
該模型主要由以下幾個部分組成:用戶界面代理、書目信息推送模塊、本體論服務(wù)器(包括用戶興趣模型、書目信息本體論庫)、書目信息分析模塊、書目信息數(shù)據(jù)庫、個性化書目信息索引庫等。
4.1 用戶界面代理
用戶界面代理在系統(tǒng)中的主要作用表現(xiàn)為:
?建立用戶個人檔案。當用戶首次登錄時,用戶界面代理要求用戶通過注冊建立起自己的個人檔案,內(nèi)容涉及用戶身份、知識背景、興趣領(lǐng)域等方面的內(nèi)容。用戶檔案的建立可以使系統(tǒng)構(gòu)建初始的用戶興趣模型。
?選擇推送模式。主頁推送、郵件推送或手機短信方式。
?對用戶行為進行動態(tài)監(jiān)測。對用戶行為的動態(tài)監(jiān)測可以包括:用戶借閱某本書的時間、用戶借閱或檢索某本書距離現(xiàn)在的時間、用戶對推薦書目的評價等。用戶界面代理通過以上對用戶行為的監(jiān)測分析,將結(jié)果反饋到用戶偏好本體論庫中,使用戶的下一次查詢能夠得到更優(yōu)化的結(jié)果。
?獲取用戶反饋信息。用戶界面代理建立了用戶對推送書目信息的評價機制,鼓勵用戶對推送書目信息給出量化的評價值,該值通過某種計算后,用于更新用戶興趣模型的內(nèi)容,并據(jù)此對個性化書目信息索引庫中的內(nèi)容進行調(diào)整。
4.2 書目信息本體論庫
書目信息本體論庫在系統(tǒng)中的作用主要包括:
?利用書目信息本體論對書目信息進行語義標引。對于書目信息庫中的每一條信息,書目信息分析模塊首先提取其中的特征詞,然后可以在書目信息本體論的協(xié)助下,將其轉(zhuǎn)換為本體論中的概念詞,并與具體的每一條書目信息建立映射關(guān)系,從而實現(xiàn)對書目信息的語義標引。
?利用書目信息本體論構(gòu)建用戶興趣模型。利用本體論庫構(gòu)建的用戶興趣模型,不僅包含了用戶的興趣概念,還包含了用戶興趣概念之間的各種關(guān)聯(lián),這樣系統(tǒng)可以在用戶興趣概念之間進行推理,挖掘出用戶潛在的興趣概念。另外,當用戶對某一興趣概念的概念興趣相關(guān)度發(fā)生變化時,系統(tǒng)可以對與其相關(guān)聯(lián)的興趣概念的概念興趣相關(guān)度做出相應(yīng)的調(diào)整,從而使用戶的興趣模型更準確地反映用戶的實際情況。
4.3 用戶興趣模型
在使用推薦系統(tǒng)時,比較突出的一個問題是客戶信息的獲取,然而在本系統(tǒng)中,由于高校圖書館書目推薦系統(tǒng)用戶和使用環(huán)境的特殊性,系統(tǒng)可以方便地得到較為真實的用戶偏好、個人信息等,使這一問題得到較好地解決。讀者信息主要包括:①讀者的基本個人信息,如所在院系、身份信息(教師還是學(xué)生)、職稱信息、學(xué)生類別等。這些信息不需要讀者自己輸入,可以從學(xué)校管理信息系統(tǒng)獲得;②讀者的顯/隱性輸入信息,如讀者輸入關(guān)鍵字、書名、文獻特征、讀者的瀏覽記錄等;③讀者的歷史借閱記錄數(shù)據(jù);④讀者借閱過某些文獻所給出的評價。
由于用戶的興趣知識屬于一種隱性知識和動態(tài)知識,很難對其進行直接或明確的說明,因此用戶偏好本體論庫的構(gòu)建也不可能是一勞永逸的,而是要通過系統(tǒng)對用戶興趣的動態(tài)追蹤,不斷深入挖掘,并在此基礎(chǔ)上對用戶興趣模型的內(nèi)容進行不斷修正,才能比較準確地反映用戶的興趣偏好。
4.4 書目信息推送模塊
書目信息推送可以基于以下三種方法:
?基于相關(guān)性書目信息的推送:推送系統(tǒng)根據(jù)用戶感興趣的書目信息來推送其它相關(guān)的書目信息,這種方式需要了解客戶當前選擇的書目信息。例如某位讀者選擇借閱了有關(guān)“電子商務(wù)”的書籍,推送系統(tǒng)就可以向其推薦其它關(guān)于“電子商務(wù)”圖書的書目信息。
?基于相關(guān)性用戶的推送:推送系統(tǒng)根據(jù)目前用戶與其他已經(jīng)借閱了某圖書的其他用戶之間的相關(guān)性進行推送。例如推送系統(tǒng)可以對某計算機學(xué)院的讀者推送與其相類似(相同愛好、研究方向等)的其他讀者借閱查看的資料。
?基于用戶專業(yè)及興趣的推送:推送系統(tǒng)可以根據(jù)某讀者的歷史借閱數(shù)據(jù)以及用戶的專業(yè)、研究方向等,獲得讀者潛在知識需求,對讀者進行書目信息推送。
推送的形式可以根據(jù)用戶的不同情況,由用戶選擇以下三種方式中的一種:
?用戶登陸圖書館網(wǎng)站查詢時自動彈出推送書目信息。
?通過E-mail發(fā)送到用戶郵箱。
?通過短信發(fā)送到用戶的手機。
由于本體論具有良好的邏輯推理功能,因此,書目信息推送模塊能夠借助本體論從語義層面根據(jù)讀者特征信息、資源特征信息和知識庫信息,自動推理出與讀者所從事專業(yè)、閱讀興趣等相匹配的書目信息資源。針對高校的特點,每個讀者的特征類包含了關(guān)聯(lián)讀者屬性,通過該屬性,可在老師與學(xué)生之間、具有相同愛好讀者之間建立聯(lián)系,將資源信息推送給目標讀者的同時推送給關(guān)聯(lián)讀者,實現(xiàn)點對面的資源推送。
4.5 書目信息分析模塊
書目信息分析模塊的功能主要是對書目信息進行語義概念層次上的分析與過濾,只保留下與用戶相關(guān)的書目信息、過濾掉無關(guān)的。具體來說:①書目信息分析模塊需要對所收集到的每一條書目信息進行特征詞的抽;②對于抽取的這些特征詞,書目信息分析模塊還需要在書目信息本體論的協(xié)助下,將其轉(zhuǎn)換為本體論中的概念詞語;③還要把含有這些轉(zhuǎn)換為本體論中的概念詞語與用戶興趣模型中的概念詞進行匹配,只有匹配成功的概念詞語所對應(yīng)的書目信息資源才是需要保留的。將這些保留下來的書目信息按照某種規(guī)則排序后存入個性化書目信息索引庫中,由書目信息推送模塊按照某種方式推送給用戶。
4.6 個性化書目信息索引庫
系統(tǒng)自動為每個圖書館的用戶建立個性化書目信息索引庫,即從書目信息庫中抽取出與用戶相關(guān)的書目信息實體,濾出無關(guān)信息,滿足了用戶個性化書目信息需求。
個性化書目索引庫中的書目信息是按照用戶興趣概念進行存儲的,每個興趣概念都與用戶興趣模型中的概念相對應(yīng)。當用戶興趣模型中的用戶興趣發(fā)生變化時,個性化書目信息索引庫相應(yīng)地也會做出調(diào)整。在這里,我們假定個性化信息索引庫中包含有一個對自身信息進行管理的管理服務(wù)器,管理服務(wù)器會把不符合用戶興趣的興趣概念及其相應(yīng)的書目信息從個性化書目索引庫中刪去,同時加進用戶新產(chǎn)生的興趣概念等。
5、結(jié)論與展望
基于本體論的個性化書目信息推送系統(tǒng)不但可以為每本書找到它們潛在的讀者,還可以為讀者節(jié)省時間,使讀者不用到圖書館就可獲取所需的書目信息。我們相信,隨著信息化、網(wǎng)絡(luò)化、數(shù)字化的進一步推進,基于本體論的個性化書目信息推送系統(tǒng)在高校圖書館將得到廣泛的重視和應(yīng)用,為讀者提供更人性化、個性化、智能化的書目信息推送服務(wù),為其節(jié)約大量時間和精力,使高校數(shù)字圖書館的服務(wù)更令人滿意,使其資源得到更充分的利用。
相關(guān)熱詞搜索:本體論 推送 書目 基于本體論的高校圖書館個性化書目推送系統(tǒng) 個性化推薦系統(tǒng)項目 個性化推薦系統(tǒng)代碼
熱點文章閱讀