【Mashup國內(nèi)外研究綜述】 國內(nèi)外研究綜述
發(fā)布時間:2020-03-07 來源: 短文摘抄 點擊:
[摘要]對2005~2009年國內(nèi)外Mashup研究論文,從來源數(shù)據(jù)庫、發(fā)表時間方面進行統(tǒng)計分析,并按主題簡要介紹該領域理論研究和應用研究兩個層次的主要成果,并對這些成果從內(nèi)容和研究方法上進行述評,指出Mashup發(fā)展中存在的不足,對研究中存在的問題進行分析總結,并對未來該領域的研究趨勢進行預測。
[關鍵詞]聚合 API 信息服務 網(wǎng)絡學習
[分類號]G202
近年來“Mashup”新型網(wǎng)絡應用在Intemet上廣泛興起,根據(jù)維基定義“Mashup:網(wǎng)絡聚合應用,把來自兩個或多個外部資源的數(shù)據(jù)或功能整合起來創(chuàng)建一項新服務的網(wǎng)頁或Web應用程序”可知,Mashup是從多個分散站點獲取信息源,組合成一種新型網(wǎng)絡應用模式,它利用的外部數(shù)據(jù)源格式多種多樣,兼容性驚人。今天,博客、網(wǎng)摘、圖片、視頻等服務廣泛應用,促進了Mashup研究熱潮,引起國內(nèi)外學者重視。本文將對其研究現(xiàn)狀進行綜述,揭示近年來該主題研究的發(fā)展軌跡、研究路線、學術成果及存在的相關問題,并對其發(fā)展進行展望。
1 Mashup研究現(xiàn)狀概述
筆者利用CNKI,以“mashup”為檢索詞,進行篇名及關鍵詞檢索,經(jīng)篩選得到國內(nèi)研究論文43篇;并以相同檢索條件,在國外四大權威數(shù)據(jù)庫ACM、ProQuest、ScienceDirect、SpringerLink中進行檢索,篩選后分別得到16篇、3篇、2篇、21篇主題研究文獻,共為5l篇(包括著作兩本)。國內(nèi)外合計為94篇。如表1所示:
數(shù)據(jù)表明,對Mashup關注始于2006年。國內(nèi)研究稍早于國外,原因是2006年國內(nèi)圖書情報界對“跨界合作”的研究熱潮。Mashup特有的重新整合網(wǎng)絡資源應用的方式,激起了軟件開發(fā)者與廣大普通網(wǎng)民的極高熱情,并吸引了越來越多研究者投入其中,研究熱度持續(xù)上升,論文年度數(shù)量分布呈現(xiàn)出明顯的遞增趨勢。國內(nèi)外對Mashup的研究主要包括基礎理論研究和應用研究,論文將從這兩方面展開綜述。
2 Mashup理論研究現(xiàn)狀
在理論研究方面涉及主要內(nèi)容有Mashup定義、架構、關鍵技術、平臺工具。
2.1 定義
學者大都認同維基定義及著名Mashup網(wǎng)站的定義即Mashup網(wǎng)站是一個Web頁面或應用程序,從兩個或以上的外部在線資源連接數(shù)據(jù)。外部資源極可能是其他的Web站點,并且站點上的數(shù)據(jù)被“mashup開發(fā)員使用不同的方法獲得,這些方法包括但又不僅僅局限于APIs,XML數(shù)據(jù)源(XML Feeds)和屏幕抓取”。
較早對Mashup進行明確定義的是加拿大學者菲克特(Darlene Fichter),她指出“Mashup:把多個信息源整合起來創(chuàng)建一個全新的網(wǎng)站或者網(wǎng)絡應用!贝送猓袑W者把Mashup定義為一種網(wǎng)絡技術,這種技術結合了多個來源的信息到一個單一的Web應用程序,這種技術為人們整合不同來源的數(shù)據(jù)提供了一個新的平臺。
我國學者黃倩則提出Mashup是新一代的軟件開發(fā)模式,交互式的Web應用開發(fā)模式涉及了Web2.0,SaaS,SOA等多種技術的融合應用,它通過不同渠道獲取外部數(shù)據(jù)源創(chuàng)建全新的服務,提供統(tǒng)一體驗的互聯(lián)網(wǎng)應用。而王萍、張際平提出“Mashup的內(nèi)涵在于整合不同外部數(shù)據(jù)源的內(nèi)容和服務,把松散的學習資源、要素、服務和功能集成在網(wǎng)絡學習環(huán)境之中,提供增值的、創(chuàng)新的內(nèi)容、服務和統(tǒng)一完整體驗的Web信息系統(tǒng)”。
筆者認為在定義Mashup時應注意Mashup還是一種理念,它是將整合、混搭的理念用于Web服務構建而形成的一種嶄新的模式。
2.2 架構
大部分學者認同Mashup的三層架構模式,即:①API/內(nèi)容提供者,提供了建設Mashup網(wǎng)站所需內(nèi)容。為了方便外界獲取和使用,提供者將自己的內(nèi)容通過Web協(xié)議,采用API的形式對外提供。②Mashup服務器。負責把所獲得的或者是自有的資源和服務封裝成標準組件,并管理這些組件,同時響應應用程序對于資源、服務的開放調(diào)用。③客戶機Web瀏覽器。以可視化方式呈現(xiàn)應用程序的地方,也是用戶交互發(fā)生的地方,Mashu P通常都使用客戶機端的邏輯來構建合成內(nèi)容。
然而,上述Mashup三層架構模式存在著不足,許多學者提出了相應改進模型。代表性的有:陸璐瑩針對“Mashup缺乏語義信息”提出了基于語義Web的Mashup設計架構,將其體系架構分為四層,即頁面顯示層、業(yè)務邏輯層、語義處理層以及服務實現(xiàn)層;Zahoor E提出了名為“Mashup處理網(wǎng)絡(MPN)”的系統(tǒng)架構模型,該模型由四部分組成:數(shù)據(jù)流生產(chǎn)者、數(shù)據(jù)流消費者、Mashup流程代理、以及用來發(fā)送Web服務請求和接收響應的溝通渠道;還有學者提出基于質量控制的Mashup架構等。語義Web架構模型滿足了用戶的靈活需求,而MPN架構模型則克服了傳統(tǒng)Mashup系統(tǒng)缺乏長期穩(wěn)定性和系統(tǒng)健壯性的缺陷等問題。這些改進模式推動了Mashup更快更健全的發(fā)展。
2.3 關鍵技術
筆者通過對相關資料的研究發(fā)現(xiàn):Mashup根生于Web2.0環(huán)境,形成與發(fā)展都離不開Web2.0相關技術的支持,支撐其發(fā)展的技術有:
?Ajax。一種Web應用模型,關注內(nèi)容的異步加載和呈現(xiàn)方式,是多種技術的集合。目前研究的核心技術包括:①XMLHttpt,一套可以在JavaScript等腳本語言中,通過H237P協(xié)議傳送或接收XML及其他數(shù)據(jù)的一套API;②文檔對象模型(DOM),提供對文檔內(nèi)容、結構、風格進行訪問和更新的應用程序接口;③JavaScript,用于客戶端的腳本語言,是一種被瀏覽器全面支持的輕型設計語言。
?Web協(xié)議。主要包括SOAP和REST協(xié)議,是與平臺無關的遠程通信協(xié)議。SOAP是一種輕量的、簡單的、基于XML的協(xié)議,它被設計成在Web上交換結構化的和固化的信息。但是隨著標準不斷被提出,SOAP變得臃腫,操作變得越來越復雜,REST(一種針對網(wǎng)絡應用的設計和開發(fā)方式,可以降低開發(fā)的復雜性,提高系統(tǒng)的可伸縮性)的出現(xiàn)解決了這一問題,最終推動了Mashup的快速發(fā)展,并帶來了信息組織與信息服務范式的變革。
?屏幕抓取。抓取是使用軟件工具處理并分析最初為人們閱讀而編寫的內(nèi)容,從中提取出可以通過編程進行使用和操作的信息的語義數(shù)據(jù)結構表示。當缺乏內(nèi)容提供者提供的API時通常會強制要求mashup開發(fā)人員采取屏幕抓取方式來提取自己希望集成的信息。目前有很多屏幕抓取工具可供mashup者使用,但由于其自身固有的缺點及給使用者帶來的侵權風險,制約了它在該領域的應用。
?語義Web。其目標是創(chuàng)建Web基礎設施,使用元數(shù)據(jù)對數(shù)據(jù)進行增強,從而使數(shù)據(jù)變得有意義,最終使數(shù)據(jù)變得適合進行自動化、集成、推理和重用,它的 實現(xiàn)依賴于XML、RDF和Ontology三大關鍵技術。它的出現(xiàn)彌補了屏幕抓取技術的缺陷。但至今,語義Web仍未能找到一種方法來表示所有的數(shù)據(jù)使得在連接到網(wǎng)絡時某一數(shù)據(jù)可識別并建立與其他相關信息的鏈接。
?RSS和ATOM。RSS是一種描述和同步顯示網(wǎng)站內(nèi)容的格式,是目前使用最廣泛的資源共享應用。但其被開發(fā)者凍結的核心內(nèi)容不能滿足內(nèi)容聚合開發(fā)者的需要,因此研究者開發(fā)了ATOM來彌補RSS的開放性不足的問題,人們通過Atom提供比RSS更好的元數(shù)據(jù)維護和更為全面的文檔。這些聯(lián)合技術對于集成基于事件或更新驅動內(nèi)容的Mashup來說都非常有用。
2.4 平臺工具
目前已推出的Mashup開發(fā)工具主要有Yahoo!Pipes、Microsoft’s PopFly、Google Mashu PEditor、IBMDamia以及Intel@Mash Maker等。這些Mashup平臺工具各有特點:微軟的Popfly開發(fā)過程簡單,用戶體驗好,但如果創(chuàng)建一個新的Mashup,很可能會導致出現(xiàn)瀏覽器崩潰的情況;雅虎Yahoo!Pipes則對數(shù)據(jù)格式要求較嚴;Google Mashup Editor相當于一個在線的可視化工作室,功能很強大,有編輯、編譯、運行等功能,可以很方便實現(xiàn)Ajax功能,對中文支持比較好;目前英特爾Intel Mash Maker使用門檻高,使用者必須對網(wǎng)站內(nèi)容及技術有一定程度的認識。上述開發(fā)平臺要真正達到廣大普通用戶的mashup要求,還需研究者繼續(xù)努力。
3 Mashup應用研究現(xiàn)狀
Mashup應用發(fā)展迅速。來自名為programmableweb網(wǎng)站的數(shù)據(jù)顯示,截至2009年8月22日,全球在網(wǎng)站上注冊的API數(shù)1430個,基于API開發(fā)的Mashup應用達到4261個,平均每天增長約3個,開放API的出現(xiàn)促進了用戶進行Mashup開發(fā)的熱情,使之在各領域得到迅速發(fā)展,其典型應用領域有:①地圖Mashup。地圖是Mashup最主要的應用領域,約占其所有應用的35%。人們搜集大量有關事物和行為的數(shù)據(jù),而這兩類數(shù)據(jù)常具有位置注釋信息,所有這些包含位置數(shù)據(jù)的不同數(shù)據(jù)集均可利用地圖通過圖形化方式呈現(xiàn)出來。②圖片和視頻Mashup。內(nèi)容提供者擁有與其保存的圖像相關的元數(shù)據(jù),Mashup的設計者可以將這些照片和其他與元數(shù)據(jù)相關的信息進行關聯(lián)。③搜索和購物Mashup。在Mashup這個術語出現(xiàn)之前,搜索和購物Mashup就已經(jīng)存在很長時間了。在Web API出現(xiàn)之前,有相當多的購物工具,都使用了B2B技術或屏幕抓取的方式來累計相關的價格數(shù)據(jù)。為了促進Mashup和其他web應用程序的發(fā)展,諸如eBay和Amazon之類的消費網(wǎng)站已經(jīng)發(fā)布了自己的API,以供開發(fā)者調(diào)用。
文獻資料顯示,學者們探究的Mashup應用研究方向卻大相徑庭,涉及的主要領域有:
?企業(yè):Mashup與企業(yè)結合是國外學者研究的熱點之一。由于移動運營商可以借助Mashup拓展產(chǎn)業(yè)鏈、全面進入信息領域,mashup在移動互聯(lián)網(wǎng)上的應用是學者研究的重中之重,并取得了一定成果:我國學者郭靖和郭晨峰對Mashup應用于移動互聯(lián)網(wǎng)的應用前景、關鍵問題、實現(xiàn)平臺及主要的應用方向等做了介紹;芬蘭與德國學者提出了一個TELAR Mashup平臺,該平臺基于客戶端/服務器的解決方案,有利于為移動設備建立一個基于位置信息的Mashup系統(tǒng);日本學者提出了一個應用于移動互聯(lián)網(wǎng)的Mashup工具,目的是為移動用戶提供一個個性化的顯示方式,同時整合了一些其他的服務。然而,Mashup在企業(yè)中的應用并不僅僅局限于移動互聯(lián)網(wǎng)行業(yè),學者同樣研究了適用于廣大企業(yè)的Mashup平臺,代表性的有美國學者提出的企業(yè)Mashup應用平臺(EMAP),詳細探討了EMAP的模型及架構,分析了企業(yè)Mashup取得成功的關鍵因素。實踐證明通過這個靈活的平臺,Mashup應用開發(fā)商能夠迅速地編寫企業(yè)級質量的應用,用戶則可以簡便地創(chuàng)建高度個性化的應用。作者還根據(jù)企業(yè)中投資收益率的原則,預測這項應用將很快被廣大企業(yè)所采用。文介紹了企業(yè)Mashup的主要組成部分,并探討了這一新模式的設計原則及架構,進而說明了這種Mashup架構能夠在短時間內(nèi)為獨立或異構企業(yè)提供相應的應用。
?生物醫(yī)學:生物醫(yī)學領域中龐大的數(shù)據(jù)信息以不同的存儲格式分布在不同網(wǎng)絡環(huán)境的數(shù)據(jù)庫中,急需一種網(wǎng)絡技術或工具把它整合起來以便于應用。加拿大學者詳細介紹了Bio2RDF Mashup系統(tǒng),開發(fā)了整合帕金森癥四個轉錄因子基因相關信息的Mash,up系統(tǒng);耶魯大學學者探討用Mashup來整合醫(yī)療衛(wèi)生和生命科學信息。
?其他。包括Mashup在圖書館、教育、音樂等領域的應用。Mashup在圖書館主要用于圖書館書目信息服務,教育界則主要是網(wǎng)絡學習方面;ヂ(lián)網(wǎng)中各類信息的海量增長,必將促使Mashup在更多領域得到更廣泛的應用。
4 Mashup研究存在的問題
隨著Mashup的迅速發(fā)展及廣泛應用,一些技術問題、社會問題、跨組織邊界應用問題給我們提出了新的挑戰(zhàn),如:①知識產(chǎn)權保護問題。Mashup主要技術之一――屏幕抓取技術本身就存在著侵權的可能性,Mashup開發(fā)人可能以未獲得API內(nèi)容提供者批準的方式使用其內(nèi)容,造成侵權。②數(shù)據(jù)語義與數(shù)據(jù)質量問題。Mashup數(shù)據(jù)源自不同機構、組織、個人,Mashup開發(fā)者可能并不是源數(shù)據(jù)模型領域的專家,他們對源數(shù)據(jù)語義的理解是否準確,異構數(shù)據(jù)模型的轉換、映射是否完整、真實,開放的數(shù)據(jù)提供帶來的數(shù)據(jù)污染,屏幕抓取數(shù)據(jù)具有不穩(wěn)定性等都可能造成Mashup應用失敗。③標準化問題。目前Mashup領域缺乏統(tǒng)一的標準規(guī)范,制約了其進一步發(fā)展。④尚未形成明確的商業(yè)盈利模式。如內(nèi)容提供者如何收取服務費用,這將影響商業(yè)性數(shù)據(jù)庫向Mashup領域的介入。
5 研究熱點及發(fā)展趨勢
Mashup產(chǎn)生背景決定了其具有應用性非常強的特點。從上文分析可以看出學者主要關注Mashup應用研究,對其基礎理論探究則相對較少,應用研究主要集中在企業(yè)、生物醫(yī)學等領域,探究如何整合這些領域中的相關信息從而為用戶提供更方便、更個性化的使用。該類研究國內(nèi)外存在著巨大差異,國內(nèi)對Mashup的應用研究主要集中在圖書館、教育及移動互聯(lián)網(wǎng)等領域,對其在廣大企業(yè)和生物醫(yī)學領域的應用則沒有涉及。因此,Mashup在此兩大領域的應用,將是我國學者研究熱點之一。
此外,針對Mashup應用中存在的數(shù)據(jù)語義、數(shù)據(jù)質量、數(shù)據(jù)安全、Mashup系統(tǒng)改進等也是現(xiàn)階段研究熱點之一。目前Mashup開發(fā)者主要集中在高學歷水平的學者或軟件開發(fā)人員,且許多國外優(yōu)秀的Mashup開發(fā)平臺在國內(nèi)并沒有中文版本,更加大了其開發(fā)難度。Mashup今后將沿著更加平民化、簡易化方向發(fā)展。
相關熱詞搜索:綜述 國內(nèi)外 研究 Mashup國內(nèi)外研究綜述 國內(nèi)外研究綜述 flash國內(nèi)外研究綜述
熱點文章閱讀