領域本體構建 [旅游領域本體的構建與應用研究]
發(fā)布時間:2020-03-10 來源: 幽默笑話 點擊:
[摘要]在研究幾種典型本體構建方法的基礎上,提出一種全新的領域本體構建方案。該方案把應用案例作為本體構建的數(shù)據(jù)源和本體實用性檢驗的用例,詳細給出利用該方案構建旅游領域本體的步驟和細節(jié),實踐表明該方案具有很強的可操作性和實用性。將旅游領域本體應用于建設基于ontology的旅游線路自動生成系統(tǒng)和基于語義的旅游電子商務平臺兩個方面,并給出前者的系統(tǒng)模型與后者的系統(tǒng)框架。
[關鍵詞]旅游 本體 方案 應用 模型
[分類號]TP391
旅游業(yè)是一個綜合性產業(yè),涉及吃、住、行、游、購、娛等多方面。旅游信息具有涉及面廣、信息量大、比較分散、時空性強等特點,而目前的旅游信息資源建設存在技術手段落后、缺乏一致性、缺乏廣泛共享、信息服務自動化和智能化程度低等缺點。中國是旅游資源大國,旅游產業(yè)信息化建設嚴重落后于市場發(fā)展的需要,迫切需要提高旅游服務質量以及旅游服務的自動化和智能化程度。通過構建旅游領域的基礎知識庫一本體,并利用本體開發(fā)基于語義Web服務的旅游服務和旅游電子商務平臺是一種較先進的解決方案。
1 本體構建方法
1.1 本體
本體最早是一個哲學的范疇,本體在計算機領域中的定義也有多種,其中1991年Neches等人最早給出了一個定義:構成相關領域詞匯的基本術語和關系,以及利用這些術語和關系構成的規(guī)定這些詞匯外延的規(guī)則定義。Perez等人用分類法組織了本體,歸納出5個基本的建模元語:類或概念、關系、函數(shù)、公理和實例。本體一般可分為元本體、通用本體、領域本體和應用本體等多種本體。本體的描述語言有非形式化語言、半非形式化語言、半形式化語言和形式化語言,在本項目中采用OWL。本體開發(fā)工具有OntoEdit、Onto-lingua、Prot6g6等。本體在知識檢索中具有廣泛的應用,在語義Web中也具有非常重要的地位,同時本體為語義化Web服務和電子商務平臺提供了語義支持。
1.2 常見的領域本體構建方法
目前尚無構建本體的標準方案,許多學者在自己的研究項目中都提出了相應的本體構建方案。文獻中介紹了7種比較有影響的方法:IDEF5法、TOVE法、METHONTOLOGY法、骨架法、SENSUS法、KACTUS法和七步法。這些方法各有千秋,沒有一種方法是完備的。
1.3 基于應用案例的領域本體構建方案
筆者通過對上述方法進行仔細比較研究后,充分從應用領域角度出發(fā),在實踐中提出一種基于應用案例的領域本體構建方案,如圖1所示:
該方案分4個階段:第一個階段是在確定應用領域和范圍之后通過激發(fā)應用案例進行數(shù)據(jù)收集與分析,這個階段往往需要進行多次案例激發(fā)才能完成;第二階段是對收集的數(shù)據(jù)進行概念化并開發(fā)初始本體,概念化和初始本體設計是一個反復的過程;第三階段在初始本體確定后通過多應用案例檢驗,根據(jù)檢驗所得的統(tǒng)計結果對本體做進一步的調整和改進;第四階段是本體維護和應用開發(fā)。
這里對該方案做出說明:①通過激發(fā)實際的領域應用案例進行數(shù)據(jù)采集和分析,避免了無源之水和沒有應用背景的本體開發(fā),當然效果的好壞在很大程度上由開發(fā)者的經驗和領域專家的參與情況所決定;②初始本體開發(fā)時一定要考察復用已有本體中的概念和屬性的可能性;③初始本體設計完后遵照Gruber在1995年提出的5條規(guī)則進行評價,在符合要求后才允許進入下一階段;④在第三階段通過多應用案例進行檢驗能夠避免開發(fā)的本體過分抽象化,以提高本體的實用性;⑤通過前面的工作將得到一個符合標準并且實用的領域本體,同時在進行本體應用開發(fā)過程中還可進一步維護本體。
2 旅游領域本體的構建
旅游領域本體的構建遵循上述新方案,旅游行業(yè)最重要的商業(yè)活動包含于三個方面:①游客與旅行社之間;②旅行社之間;③旅行社與其他相關旅游機構(如交通運輸公司、賓館酒店、景區(qū)、購物點、保險公司等)之間。旅游領域本體的應用范圍就是為旅游行業(yè)的商業(yè)活動提供知識支持,從而達到旅游信息的一致性和充分共享,并且為建設自動化和智能化程度高的旅游電子商務平臺打下語義基礎。
2.1 激發(fā)應用案例與數(shù)據(jù)收集
案例(一):某游客想在即將到來的國慶長假期間到外地旅游,于是他來到當?shù)丶茁眯猩,旅行社的組團部負責人熱情地接待他并推薦一些行程,最終該游客選擇“昆明、麗江四飛六日游”。國慶很快到來,該游客愉快地度過了一個長假,旅游結束回家休息一天準備接下來的工作。
案例(二):乙旅行社準備整合推銷當?shù)芈糜钨Y源,便與當?shù)芈糜尉皡^(qū)的經營單位和交通食宿企業(yè)聯(lián)系,制定具有當?shù)靥厣牡亟臃桨浮?
案例(三):乙旅行社將制定好的地接方案傳給外地的丙旅行社,邀請聯(lián)合推銷乙所在地的旅游資源,雙方商談了具體的合作事宜。丙旅行社結合本地區(qū)到乙旅行社所在地的交通、食宿等具體情況制定了幾套行程方案,并有針對性地向當?shù)芈糜慰驮词袌鲞M行推廣。
篇幅有限,以上案例均省略了大量具體信息。通過充分地激發(fā)一定數(shù)量而又具有旅游行業(yè)代表性的應用案例,開發(fā)人員能夠掌握足夠的、關于旅游領域的原始數(shù)據(jù)。
這些應用案例通常以文檔的形式存儲,接下來的重要工作就是從這些文檔中收集和分析出有用的數(shù)據(jù)?刹捎萌斯せ虬胱詣踊墓ぞ邚奈臋n中提取出重要的詞匯、術語。從上述的部分案例中提取出這樣一些重要術語:游客、導游、旅行社、法人、組團部、地接部、旅游團、行程、旅游資源、景區(qū)、景點、企業(yè)、交通、食宿、旅游線路、地接方案、日期、時間、制定、選擇、執(zhí)行、合作、利用、具有、隸屬于等和其他大量實例數(shù)據(jù),如旅行社名稱、游客姓名等。
2.2 概念化
根據(jù)上面收集的重要術語和實例數(shù)據(jù),在旅游領域專家的參與下,對旅游領域的知識進行概念化并建模。圖2給出了旅游領域頂層概念模型,圖3給出了部分底層概念模型。
2.3 初始本體設計與評價
根據(jù)概念化所得的概念模型就可以進行初始本體設計,設計前需選定本體描述語言和本體設計工具,本項目相應采用OWL和Prot6g63.3.1進行本體開發(fā)。需要完成以下工作:①設計類和類的層次(核心類層次參見圖4);②設計類的屬性(部分主要屬性參見表1);③設計屬性的Facets(部分屬性的Facets參見表2);④實例化。在設計過程中尤其要注意復用已有本體中的慨念和屬性,如時間、地址、價格、簡單數(shù)據(jù)類型等。
初始本體設計完成后進行評價,評價標準可采用Grubel的五條規(guī)則:明確性和客觀性、完全性、一致性、最大單調可擴展性、最小承諾。如果不滿足,就對概念模型進行調整并重新設計初始本體直到滿足上述五條規(guī)則為止。
2.4 本體檢驗與改進
領域本體主要應用于本領域的實踐應用案例中,這借鑒于“從實踐中來到實踐中去”的哲學思想。在 開發(fā)旅游領域本體之初激發(fā)了許多應用案例,并從中提取并設計初始本體。這里反過來把設計好的本體應用于新的應用案例來檢驗本體的實用性,在檢驗過程中對初始本體進行調整和改進,并最終得到完善的旅游領域本體。
3 旅游領域本體的應用探索
本體不僅能應用于信息系統(tǒng)的建設,而且成為語義Web解決語義層次上Web信息共享和交換的基礎。本項目中構建的旅游領域本體主要應用于兩個方面:①為建設基于Ontology的旅游線路自動生成系統(tǒng)提供本體支持;②為建設基于語義的旅游電子商務平臺提供語義支持。
3.1 基于Ontology的旅游線路自動生成系統(tǒng)
在傳統(tǒng)模式中,旅游線路是由旅行社相關工作人員利用交通服務、食宿服務和旅游資源合理設計出符合現(xiàn)實操作的旅游行程并計算出成本價而產生的?疾煺麄產生過程幾乎是全手工式的,這浪費了大量的人力資源和時間,同時還可能錯過許多潛在的旅游線路所帶來的商機。通過旅游領域本體對旅游行業(yè)的相關信息和資源做出規(guī)范化的定義后,旅游線路的自動生成有了語義的基礎保障,系統(tǒng)的模型如圖5所示:
3.2 基于語義的旅游電子商務平臺
目前旅游商務活動以人工方式為主,而旅行社扮演一種人工組裝車間的角色,在現(xiàn)代信息技術時代旅行社的功能和存在價值受到較大沖擊。基于語義的旅游電子商務平臺能夠實現(xiàn)電子旅行社的功能,取代旅行社的人工操作模式,最終實現(xiàn)旅游商務活動的自動化和智能化。游客能夠通過平臺提供的旅游線路自動生成服務定制個性化的旅游線路,整個旅游過程中所需的諸如交通、食宿等其他服務的具體信息能夠準確合成到旅游線路的行程安排之中。如圖6所示:
4 結語
本文提出一種基于應用案例的領域本體構建方案,通過構建旅游領域本體的實踐表明該方案有如下獨特之處和優(yōu)點:①通過激發(fā)應用案例進行數(shù)據(jù)收集與分析。這樣做針對性更強,避免了無效數(shù)據(jù)干擾的同時也減小了數(shù)據(jù)源的空間,提高了數(shù)據(jù)收集的速度。②利用Gibber五條規(guī)則對“初始本體”進行檢驗。在其他方案如骨架法中往往只在本體構建后期進行檢驗,而此時本體體積龐大,不易發(fā)現(xiàn)問題,出錯修改的開銷較高。然而處于本體構建初期的“初始本體”體積較小,此時檢驗容易發(fā)現(xiàn)問題,對其調整修改的開銷也較小。③利用應用案例對“生成本體”再次進行應用性檢驗。很多方案如METHONTOLOG法對生成本體檢驗的目的不明確,用例不科學。而這里的檢驗目的明確即為應用服務,用例科學即應用案例,這增強了本體的實用性。④該方案每一個階段的任務明確、管理規(guī)范。方案分成四個階段,每個階段的工作劃分清晰,開發(fā)者容易根據(jù)任務要求規(guī)范地完成每一個具體流程,體現(xiàn)了可操作性強的優(yōu)點。
旅游業(yè)通過全球范圍內的異構網(wǎng)絡信息系統(tǒng)進行運作,旅游交易需要眾多參與者(用戶、軟件代理以及大型信息系統(tǒng))的緊密協(xié)作才能完成。旅游領域本體能為這些參與者提供知識基礎以達成對旅游信息組織結構的共同理解和認知,在此基礎上實現(xiàn)多方(用戶間、軟件代理間以及用戶與軟件代理間)的無障礙信息交互和無縫交易協(xié)作成為現(xiàn)實。旅游領域本體的上述功效為旅游知識管理、旅游信息資源規(guī)劃、旅游信息智能檢索系統(tǒng)設計等方面提供了保障。本文在建設基于Ontology的旅游線路自動生成系統(tǒng)和基于語義的電子商務平臺兩個方面進行了初步探索并給出了系統(tǒng)框架,這為提高旅游服務質量及其自動化和智能化程度提供了一種先進的解決方案,也為旅游業(yè)信息化建沒指明了方向。同時,這也為其他行業(yè)實現(xiàn)知識共享、交易的自動化和智能化提供了參考。
相關熱詞搜索:本體 構建 領域 旅游領域本體的構建與應用研究 領域本體構建方法研究 旅游領域本體構建的分析
熱點文章閱讀