本體感覺評(píng)估量表 本體評(píng)估工具的比較分析
發(fā)布時(shí)間:2020-03-07 來源: 歷史回眸 點(diǎn)擊:
[摘要] 對(duì)ODEval、OntoQA、Core、OntoManager四個(gè)本體評(píng)估工具的系統(tǒng)結(jié)構(gòu)體系進(jìn)行分析,從工具所用的評(píng)估方法、工具的評(píng)估機(jī)制、工具的使用者、工具的作用范圍、工具的可操作性及有效性5個(gè)層面進(jìn)行比較分析,明確其各自側(cè)重點(diǎn)和差異,以幫助本體開發(fā)者及最終用戶選擇適合自身需要的在國(guó)際范圍應(yīng)用廣泛、具備發(fā)展前景的本體評(píng)估工具。
[關(guān)鍵詞] 本體評(píng)估工具 ODEval OntoQA Core OntoManager 工具比較
[分類號(hào)] G354.2
1 引 言
目前,本體通過提供某個(gè)特定領(lǐng)域的相關(guān)概念及這些概念之間的關(guān)系而廣泛應(yīng)用于知識(shí)工程、信息組織及語(yǔ)義Web等各個(gè)方面。隨著本體體系的發(fā)展,對(duì)本體進(jìn)行評(píng)估成為本體發(fā)展中的關(guān)鍵問題。一方面,本體評(píng)估對(duì)于指導(dǎo)本體構(gòu)建過程并保證所構(gòu)建本體最大程度地滿足應(yīng)用需求起重要作用;另一方面,最終用戶選擇最符合自身需要的本體時(shí),本體評(píng)估也是必不可少的。此外,本體評(píng)估在本體重用、自動(dòng)或半自動(dòng)的本體學(xué)習(xí)技術(shù)以及本體管理與規(guī)范化建設(shè)中都有著重要作用。
我國(guó)關(guān)于本體的建設(shè)與研究尚處在不斷完善的過程中,對(duì)本體的評(píng)估研究才剛剛起步,國(guó)外對(duì)于本體的評(píng)估已受到專家學(xué)者關(guān)注。本文基于目前國(guó)內(nèi)外本體評(píng)估方法類型及其研究現(xiàn)狀,選擇并分析了目前應(yīng)用比較廣泛的四種本體評(píng)估工具ODEval、OntoQA、Core、OntoManager,旨在通過對(duì)這些工具的比較研究幫助本體開發(fā)者及最終用戶選擇適合自身需要的評(píng)估工具,并促進(jìn)本體的規(guī)范化建設(shè)。
2 本體評(píng)估方法
本體評(píng)估的核心是評(píng)估角度的全面化,即以多維視角的評(píng)估內(nèi)容來綜合衡量本體的質(zhì)量。當(dāng)前研究者從不同角度提出各種類型的本體評(píng)估方法,如Onto-Metric、oQual、OntoClean等,綜合各類方法,Jannz Brank等人把本體評(píng)估方法分為以下四類:
?基于“黃金標(biāo)準(zhǔn)”的方法,即將所構(gòu)建的本體與一個(gè)現(xiàn)有公認(rèn)的比較成熟的“黃金標(biāo)準(zhǔn)”進(jìn)行比較,羅列出其不足并進(jìn)行改進(jìn)。
?基于本體應(yīng)用的方法,即在一個(gè)特定應(yīng)用環(huán)境如語(yǔ)義網(wǎng)、信息檢索中,測(cè)試一組本體以確定適合該應(yīng)用的本體。
?基于語(yǔ)料庫(kù)的方法,即使用術(shù)語(yǔ)抽取算法從語(yǔ)料庫(kù)中抽出術(shù)語(yǔ),計(jì)算被本體覆蓋的術(shù)語(yǔ)數(shù)量,或是用一個(gè)向量來表示本體和語(yǔ)料庫(kù),然后計(jì)算本體向量與語(yǔ)料向量之間的差距。
?基于一套預(yù)先定義好的原則和必要條件等進(jìn)行評(píng)估的方法,其多是從構(gòu)建本體的原則來評(píng)估本體。
隨著越來越多本體評(píng)估方法的提出,創(chuàng)建能夠運(yùn)用這些方法從而使評(píng)估工作更易進(jìn)行的本體評(píng)估工具就顯得越來越重要。筆者選用的四個(gè)本體評(píng)估工具:ODEval、OntoQA、Core、OntoManager的創(chuàng)建都使用了上述一種或幾種方法,它們基于本體的不同側(cè)面來檢測(cè)本體構(gòu)建規(guī)劃、本體構(gòu)建過程、本體應(yīng)用以及本體維護(hù)等階段出現(xiàn)的問題或錯(cuò)誤,包括本體句法層面的正確與否、本體設(shè)計(jì)結(jié)構(gòu)上的合適與否以及本體相對(duì)于領(lǐng)域知識(shí)表示完整與否等。
3 國(guó)外現(xiàn)有本體評(píng)估工具
3.1 ODEval
ODEval是Corcho等人于2004年提出的,從知識(shí)表示角度評(píng)估用RDF(s)、DAML+OIL和OWL語(yǔ)言表示的本體的本體評(píng)估工具。
ODEval使用基于圖理論的運(yùn)算法則來檢測(cè)本體概念分類存在的問題。在這個(gè)運(yùn)算法則中,把本體的概念類看作一個(gè)定向的曲線圖G(V,A),其中V是一組節(jié)點(diǎn),A是一組定向的弧線。節(jié)點(diǎn)集V和弧線集A所表示的具體元素因表示本體語(yǔ)言和問題類型的不同而有所差異。如表1所示:
3.2 OntoQA
OntoQA是Samir等人于2005年提出的結(jié)合了用戶需要對(duì)本體進(jìn)行評(píng)估的工具。OntoQA提供具體的指標(biāo)來定量評(píng)估本體的質(zhì)量。評(píng)估指標(biāo)分為兩類:模式(schema)指標(biāo)和實(shí)例(instance)指標(biāo)。模式指標(biāo)組指用來評(píng)估本體結(jié)構(gòu)設(shè)計(jì)的指標(biāo);實(shí)例指標(biāo)組指評(píng)估本體內(nèi)實(shí)例分布的指標(biāo),包括知識(shí)庫(kù)指標(biāo)和類指標(biāo)。知識(shí)庫(kù)指標(biāo)將知識(shí)庫(kù)作為一個(gè)整體來評(píng)估,類指標(biāo)評(píng)估本體結(jié)構(gòu)中定義的類在知識(shí)庫(kù)中的運(yùn)用方式。如表2所示:
3.3 Core
Core(Collaborative Ontology Reuse and Evaluationsystem)是Femdndez等人于2006年提出的基于本體排列的應(yīng)用于本體重用和本體評(píng)估的工具。Core根據(jù)已選出的標(biāo)準(zhǔn)準(zhǔn)則來評(píng)估本體,這個(gè)準(zhǔn)則涉及黃金標(biāo)準(zhǔn)和用戶需要兩個(gè)方面。在黃金準(zhǔn)則方面,Core通過詞匯評(píng)估層面和分類評(píng)估層面對(duì)本體進(jìn)行評(píng)估。詞匯評(píng)估層面使用一套詞匯評(píng)估方法評(píng)估黃金標(biāo)準(zhǔn)和所選本體的相似性,通過比較表示它們所描述領(lǐng)域的詞匯條目來實(shí)現(xiàn);分類評(píng)估層面評(píng)估所選本體的“is-a”層級(jí)結(jié)構(gòu)和黃金標(biāo)準(zhǔn)結(jié)構(gòu)的重疊程度。在此基礎(chǔ)上,Core通過以下三個(gè)模塊組成的體系結(jié)構(gòu)來完成對(duì)一系列相關(guān)本體的評(píng)估:
?黃金標(biāo)準(zhǔn)技術(shù)設(shè)計(jì)模塊:用戶通過自然語(yǔ)言處理從其感興趣的相關(guān)文檔中得出根詞匯,并使用WordNet和它提供的同義及反義關(guān)系擴(kuò)展根詞匯,以此構(gòu)建包含新詞匯的詞匯黃金標(biāo)準(zhǔn)。
?系統(tǒng)推薦模塊:用戶選擇一套評(píng)估準(zhǔn)則,然后根據(jù)這套準(zhǔn)則將所要評(píng)估的本體與黃金標(biāo)準(zhǔn)進(jìn)行比較,選出并按相似度排列與黃金標(biāo)準(zhǔn)接近的本體。
?協(xié)作性評(píng)估模塊:本體的某些特征(例如可讀性、靈活性等)無(wú)法通過自動(dòng)化的機(jī)器直接進(jìn)行評(píng)估,因此需要用戶參與,此模塊綜合用戶需要及上述評(píng)估結(jié)果得出最終排序。
3.4 OntoManager
OntoManager是Nenad等人于2002年提出的一個(gè)適于本體工程師、領(lǐng)域?qū)<壹靶袠I(yè)分析家使用的管理系統(tǒng),它可以根據(jù)用戶需要找出不足以促進(jìn)本體完善,并能促進(jìn)管理人員問責(zé)制的發(fā)展。其主要任務(wù)是通過收集用戶應(yīng)用本體的交互性數(shù)據(jù)來了解用戶需求,以避免通過調(diào)查問卷等繁瑣方式獲取數(shù)據(jù),從而評(píng)估本體滿足用戶需求情況。
OntoManage的實(shí)現(xiàn)基于概念體系結(jié)構(gòu)MAPE(Mo―nitor Analyze Plan Execute)模型,其把管理體系機(jī)構(gòu)提煉為四個(gè)功能:①監(jiān)控功能,收集、整理并過濾用戶使用本體的交互性數(shù)據(jù);②分析功能,整合所收集到的數(shù)據(jù)并使其可視化,提出本體修改建議;③計(jì)劃功能,規(guī)劃出適用于本體修改的行動(dòng);④執(zhí)行功能,根據(jù)對(duì)本體做出的調(diào)整,更新本體的應(yīng)用。整體來看,OntoManager由三個(gè)模塊組成:
?數(shù)據(jù)整合模塊:整合、收集、預(yù)處理并組織用戶應(yīng)用本體的行為信息數(shù)據(jù)。
?可視化模塊:把上述數(shù)據(jù)以易于理解的可視化形式表示出來,即通過圖表、表格、條形圖等方式來實(shí)現(xiàn)。
?分析模塊:引導(dǎo)本體進(jìn)行改變以適應(yīng)用戶需要,從而完成本體進(jìn)化完善以及實(shí)例抓取兩項(xiàng)任務(wù)。
4 本體評(píng)估工具的比較分析
不同的本體評(píng)估工具是從不同的視角針對(duì)不同領(lǐng)域的、不同類型的、用不同知識(shí)表示形式表示的本體而創(chuàng)建的,且沒有一個(gè)本體評(píng)估工具能成功解決本體存在的所有問題。我們從評(píng)估方法、評(píng)估機(jī)制、使用者、作用范圍、可操作性及有效性等指標(biāo)來比較上述四種本體評(píng)估工具。指標(biāo)的比較如表3所示:
4.1 工具所用評(píng)估萬(wàn)法
本體評(píng)估工具都是使用一定的評(píng)估方法來創(chuàng)建的,在選用評(píng)估方法上,本體評(píng)估工具會(huì)針對(duì)評(píng)價(jià)的重點(diǎn)及其評(píng)估視角來做相應(yīng)選擇。
ODEval基于邏輯規(guī)則視角,通過本體表示語(yǔ)言的邏輯規(guī)則來評(píng)估本體。其使用了基于原則的評(píng)估方法。盡管目前一些本體剖析器和本體平臺(tái)可用于檢測(cè)用RDF(s)、DAML+OIL和OWL語(yǔ)言表示的本體,例如ICS-FORTH Validating RDF parser、OWL Validator等,但它們只能檢測(cè)出簡(jiǎn)單的循環(huán)問題,而對(duì)于分割錯(cuò)誤和冗余問題大多束手無(wú)策,而該工具可有效地評(píng)估本體內(nèi)容中的不一致和冗余。
OntoQA、Core都是基于指標(biāo)視角的評(píng)估工具,利用指標(biāo)的綜合性從不同方面評(píng)估本體。OntoQA使用了基于語(yǔ)料庫(kù)和基于原則的綜合評(píng)估方法,通過具體指標(biāo)幫助用戶分析所選本體的適用性,Core使用了基于黃金標(biāo)準(zhǔn)和基于應(yīng)用的評(píng)估方法來對(duì)本體進(jìn)行評(píng)估并排序以供選擇適用性高的本體。
OntoManager基于本體進(jìn)化視角,通過總結(jié)本體生命周期的變化來評(píng)估本體,例如領(lǐng)域知識(shí)的變化導(dǎo)致的本體內(nèi)容結(jié)構(gòu)的變化、本體知識(shí)表示語(yǔ)言的相互轉(zhuǎn)化所導(dǎo)致的格式變化等。其使用了基于用戶應(yīng)用的評(píng)估方法,分析用戶使用數(shù)據(jù)來持續(xù)管理、評(píng)估并完善本體。
4.2 工具的評(píng)估機(jī)制
ODEval作用于本體模型創(chuàng)建階段,它執(zhí)行RDF(s)、DAML+OIL和OWL本體的句法評(píng)估,它使用基于圖理論的自動(dòng)檢測(cè)程序,通過對(duì)本體表示語(yǔ)言中詞條的檢測(cè)來檢測(cè)本體創(chuàng)建過程中出現(xiàn)的本體概念分類的不一致和冗余等問題。OntoQA將所設(shè)計(jì)的評(píng)估指標(biāo)存儲(chǔ)于基于Java語(yǔ)言的程序原型中,運(yùn)用SeasameRDF store來下載本體的模式和知識(shí)庫(kù),形成OntoQA本體評(píng)估工具。Core根據(jù)已選出的標(biāo)準(zhǔn)準(zhǔn)則通過自動(dòng)相似度檢測(cè)方法對(duì)一組本體進(jìn)行排序,即從其提供的標(biāo)準(zhǔn)準(zhǔn)則中選擇一個(gè)子集,而基于每種標(biāo)準(zhǔn)都可以得出一個(gè)本體排序,然后使用能把這些標(biāo)準(zhǔn)綜合起來考慮的融合性排序技術(shù)并結(jié)合用戶需要得出最終的本體排序。OntoManager通過門戶網(wǎng)站或應(yīng)用來關(guān)注最終用戶需求,即跟蹤用戶在日志文檔中應(yīng)用的交互作用,收集有用的能夠用于評(píng)估用戶主要興趣域的信息,通過這種信息的變化來尋找并及時(shí)反映本體領(lǐng)域知識(shí)所發(fā)生的變化,以此來評(píng)估并不斷地完善本體,此機(jī)制表示為一個(gè)“使用環(huán)”,如圖1所示:
4.3 工具的使用者
本體評(píng)估工具的使用者包括本體開發(fā)者和最終用戶。前者包括本體構(gòu)建者、本體管理人員等領(lǐng)域?qū)<。本體開發(fā)者需要評(píng)估工具來完善本體;用戶需要評(píng)估工具來對(duì)一組內(nèi)容相近的本體的質(zhì)量進(jìn)行評(píng)估從而選擇最適合其需要的本體。Sabou等認(rèn)為本體選擇和本體評(píng)估相互補(bǔ)充,起過濾作用的本體選擇是先于本體質(zhì)量評(píng)估的,且用戶角度的本體評(píng)估工具有助于本體選擇和本體評(píng)估的實(shí)施。目前隨著本體使用范圍的擴(kuò)大,研究人員也開始關(guān)注最終用戶對(duì)本體的評(píng)估。
ODEval和OntoManager的使用者是本體開發(fā)者。ODEval適用于創(chuàng)建本體階段的使用;OotoManager適用于本體構(gòu)建完成后本體的更新完善階段的使用。On-toQA和Core的使用者既包括本體開發(fā)者也包括最終用戶。OntoQA是從用戶視角創(chuàng)建的,為了更大程度地滿足用戶在評(píng)估本體質(zhì)量基礎(chǔ)上選擇本體的需求;Core的實(shí)施在自動(dòng)檢測(cè)方法的基礎(chǔ)上也需要最終用戶的參與,以用戶評(píng)價(jià)結(jié)果為重要組成部分。
4.4 工具的作用范圍
Guarino把本體類型分為頂層本體、領(lǐng)域本體、任務(wù)本體和應(yīng)用本體。頂層本體通常表達(dá)的是常識(shí)性概念,如空間、時(shí)間、事件、行為等,與具體應(yīng)用無(wú)關(guān)。頂層本體可能沒有實(shí)例填充,而其他本體在被構(gòu)造好之后需要人工或自動(dòng)、半自動(dòng)化填充實(shí)例。有的本體評(píng)估工具僅作用于本體的模式而忽略了在被填充本體的知識(shí)庫(kù)中運(yùn)用的知識(shí)。
ODEval因?yàn)槠涫褂糜诒倔w模型構(gòu)建階段,只作用于本體的模式,而OntoQA、Core、OntoManager既作用于本體模式,也作用于本體的知識(shí)庫(kù),這樣既對(duì)本體概念體系做出了相應(yīng)的合適度評(píng)估,也對(duì)本體中實(shí)例分布情況、豐富程度、實(shí)例反應(yīng)領(lǐng)域知識(shí)情況等做出了更全面的評(píng)估。
4.5 工具的可操作性及有效性
ODEval是一種自動(dòng)檢測(cè)工具,沒有最終用戶使用界面,但它易于被本體開發(fā)者所掌握,從而幫助本體開發(fā)者設(shè)計(jì)出沒有知識(shí)概念分類異常的本體。
OntoQA、Core、OntoManager都包含從用戶角度進(jìn)行評(píng)估的層面,可以確保在開發(fā)本體過程中所產(chǎn)生的建議反映用戶的需要。OntoQA有易于操作的用戶界面,且OntoQA正嘗試開發(fā)可適用于Web的評(píng)估界面,適用范圍會(huì)更廣。
Core有易于操作的用戶界面,適用于本體評(píng)估和本體重用。用戶可根據(jù)自身需要對(duì)頁(yè)面上的指標(biāo)進(jìn)行設(shè)置從而得出最符合自身需要的本體排序,參考價(jià)值高,可操作性強(qiáng)。
OntoManager根據(jù)用戶需求來支持本體的管理和優(yōu)化,它是一個(gè)易于管理人員使用的管理系統(tǒng),但很難有深入的評(píng)估,不適合最終用戶使用。
相關(guān)熱詞搜索:本體 評(píng)估 工具 本體評(píng)估工具的比較分析 本體評(píng)估方法研究綜述 本體評(píng)估方法研究
熱點(diǎn)文章閱讀