Folksonomy及其國(guó)外研究進(jìn)展:國(guó)外白發(fā)研究進(jìn)展
發(fā)布時(shí)間:2020-03-07 來(lái)源: 散文精選 點(diǎn)擊:
〔摘要〕闡述了folksonomy的概念與分類(lèi)原理,指出了其與傳統(tǒng)分類(lèi)法的不同。分析了folksonomy在類(lèi)目結(jié)構(gòu)、信息組織、信息資源揭示等方面的優(yōu)勢(shì)以及在語(yǔ)義表達(dá)、語(yǔ)法控制、語(yǔ)義普遍認(rèn)知方面的劣勢(shì)。從存在價(jià)值、基于tag的定量分析、用戶(hù)定量分析、系統(tǒng)設(shè)計(jì)與應(yīng)用、缺陷解決措施以及檢索等六個(gè)方面系統(tǒng)介紹了folksonomy的國(guó)外研究進(jìn)展。
〔關(guān)鍵詞〕folksonomy 網(wǎng)絡(luò)信息分類(lèi)法 tag
〔分類(lèi)號(hào)〕G254.11 TP393
Folksonomy and Related Research Progress in Some Advanced Countries
Yu Jinxiang
School of Economics and Management, South China Normal University, Guangzhou510006
〔Abstract〕This paper firstly expounds the conception and the classification principles of folksonomy, and points out the differences between folksonomy and the traditional classification methods. Then, it analyzes folksonomy"s advantages on its category structure, information organization, information resources disclosure and disadvantages on semantics expression, grammar controlling and semantics cognition. At last, the paper introduces foreign research progress of folksonomy systematically from the aspects of the value of existing, the quantitative analysis based on tag, user quantitative analysis, system design and application, flaw solution measures and retrieval technologies.
〔Keywords〕folksonomy internet information classification tag
1引言
Folksonomy是由folks和taxonomy組合而來(lái),folks在英文中是比較口語(yǔ)化的詞,表示一群人、一伙人的意思,taxonomy是指分類(lèi)法,它是信息架構(gòu)中的重要部分。Folksonomy是指一種社群參與人運(yùn)用自由定義tag(標(biāo)簽)的方式進(jìn)行協(xié)作分類(lèi)的活動(dòng),主要機(jī)制是基于開(kāi)放性元數(shù)據(jù)標(biāo)準(zhǔn)和自然語(yǔ)言的社群聚類(lèi),現(xiàn)有“分眾分類(lèi)法”、“通俗分類(lèi)法”、“大眾分類(lèi)法”、“民眾分類(lèi)法”等不同翻譯。分類(lèi)的原理為向社群參與者提供一種協(xié)同構(gòu)建與共享各自網(wǎng)絡(luò)資源標(biāo)簽的開(kāi)放式平臺(tái),用戶(hù)通過(guò)自己制定的分類(lèi)標(biāo)準(zhǔn)來(lái)提交tag,由用戶(hù)群體定義tag的頻率來(lái)決定信息的組織方式。這種標(biāo)簽包括網(wǎng)絡(luò)內(nèi)容的分類(lèi)、大意與鏈接地址等,tag對(duì)每個(gè)人都是完全開(kāi)放的,用戶(hù)可以自由查看并修改自己提交的標(biāo)簽。
Folksonomy與傳統(tǒng)網(wǎng)絡(luò)信息分類(lèi)法最大的不同在于它并不采用嚴(yán)格的分類(lèi)標(biāo)準(zhǔn),其分類(lèi)全部由用戶(hù)直接提交,分類(lèi)的形成過(guò)程完全是自發(fā)的。這種分類(lèi)是平面化的,沒(méi)有等級(jí)層次的劃分,雖然它相對(duì)不夠嚴(yán)謹(jǐn),缺乏準(zhǔn)確度,但是在社會(huì)性軟件中,這種平面延伸的分類(lèi)方法卻在無(wú)形之中成為了方便、靈活、不受條件限制地溝通渠道。所以以自定義標(biāo)簽形式的大眾分類(lèi)在現(xiàn)下流行的社會(huì)性網(wǎng)絡(luò)服務(wù)中得到了廣泛的應(yīng)用,如:Flickr、Furl、Del.icio.us、Frassle、Simpy、Spurl、Technorati、FotoFlix、Simpy、OpenBM等。應(yīng)該說(shuō),國(guó)內(nèi)對(duì)于folksonomy的研究還處于初步階段,因此,了解國(guó)外的研究對(duì)于國(guó)內(nèi)的研究和實(shí)踐具有非常重要的意義。
2Folksonomy的優(yōu)劣勢(shì)分析
2.1Folksonomy的優(yōu)勢(shì)
2.1.1平面化、非等級(jí)結(jié)構(gòu)的類(lèi)目結(jié)構(gòu)傳統(tǒng)分類(lèi)法具有嚴(yán)密的等級(jí)結(jié)構(gòu)和邏輯體系,folksonomy則是平面的、非等級(jí)的。一些門(mén)戶(hù)網(wǎng)站和搜索引擎對(duì)信息的組織一般采用類(lèi)目細(xì)分的方式來(lái)進(jìn)行分類(lèi),如果分類(lèi)體系過(guò)多,會(huì)增加網(wǎng)民的認(rèn)識(shí)負(fù)擔(dān)、影響檢索效率;如果分類(lèi)體系過(guò)少,則會(huì)影響分類(lèi)體系的清晰度,增加網(wǎng)民瀏覽選擇的負(fù)擔(dān)[1]。而folksonomy通過(guò)tag的字號(hào)大小以及顏色的不同來(lái)表示其“受歡迎”的程度,能夠?qū)崿F(xiàn)快速而自動(dòng)的信息聚類(lèi),生成系列加權(quán)列表和標(biāo)簽總圖(TagCloud),具有較強(qiáng)的大眾趨同性,直觀(guān)性和易用性強(qiáng)。
2.1.2低成本的信息組織方式Adam提出網(wǎng)絡(luò)信息資源的組織有三種方式:由圖書(shū)館ICP服務(wù)商和其他信息機(jī)構(gòu)提供的檢索目錄、作者創(chuàng)建元數(shù)據(jù)、用戶(hù)交流和共享產(chǎn)生的信息描述。folksonomy通過(guò)用戶(hù)共享元數(shù)據(jù)來(lái)實(shí)現(xiàn)合作分類(lèi)和交流,相對(duì)于前兩種信息組織方式而言,無(wú)需預(yù)先編制、維護(hù)和學(xué)習(xí)龐大的分類(lèi)體系表,也無(wú)需掌握專(zhuān)門(mén)的圖書(shū)館領(lǐng)域?qū)I(yè)技術(shù)方法和專(zhuān)業(yè)培訓(xùn),能夠節(jié)省用戶(hù)的時(shí)間和精力[2]。
2.1.3多維度揭示信息資源 作為folksonomy類(lèi)目的tag,它既不同于關(guān)鍵詞、也不同于目錄和主題詞。Tag是對(duì)文章概括和理解基礎(chǔ)上產(chǎn)生的,是對(duì)內(nèi)容的個(gè)人理解上的私人標(biāo)注,未必針對(duì)主題,可能是時(shí)間、內(nèi)容或與文章主題無(wú)關(guān)的詞匯,因此標(biāo)簽的設(shè)定要比關(guān)鍵詞自由和方便,它可以從多個(gè)維度來(lái)揭示信息內(nèi)容。在以目錄為基礎(chǔ)的存儲(chǔ)體系中,目錄結(jié)構(gòu)必須要事前規(guī)劃,而tag可以不考慮目錄結(jié)構(gòu)并以較少的代價(jià)細(xì)化分類(lèi)。folksonomy的類(lèi)目是由用戶(hù)定義一個(gè)或幾個(gè)tag組成,沒(méi)有明確定義tag之間的關(guān)系,各個(gè)tag之間的關(guān)系是平等的,但是又可以根據(jù)相關(guān)性分析,將經(jīng)常一起出現(xiàn)的tag關(guān)聯(lián)起來(lái),而產(chǎn)生一種相關(guān)性的分類(lèi),它不像傳統(tǒng)分類(lèi)法和分類(lèi)表,有多重明確的關(guān)系。此外,它還能解決傳統(tǒng)分類(lèi)法更新慢,不能及時(shí)面對(duì)新出現(xiàn)的學(xué)科和專(zhuān)業(yè)術(shù)語(yǔ)的問(wèn)題。
2.2Folksonomy的劣勢(shì)研究
狹義的分類(lèi)是以嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)邏輯為線(xiàn)索,以學(xué)術(shù)信息的匯集、樹(shù)立和查詢(xún)?yōu)槟康,以學(xué)術(shù)為軸心,而tag是以個(gè)人的感性邏輯即個(gè)人的知識(shí)、情感、意志、記憶、素養(yǎng)等綜合素質(zhì)的反應(yīng)為線(xiàn)索,以個(gè)人所需信息的匯集、梳理和查詢(xún)?yōu)槟康,以個(gè)人的經(jīng)驗(yàn)為基礎(chǔ)[3]。但是,對(duì)于他人或是整個(gè)分類(lèi)體系而言,folksonomy是模糊的,不精確的,隨意的。此外,同名異義的問(wèn)題也導(dǎo)致了它的模糊性:①一詞多義產(chǎn)生的意義分歧。②縮略詞產(chǎn)生的問(wèn)題:例如在一些社會(huì)性書(shū)簽網(wǎng)站中,“ANT”是社會(huì)學(xué)領(lǐng)域“Actor Network Theory”的縮寫(xiě),但是在del.icio.us中,它卻是Java編程語(yǔ)言中的一種工具。
Folksonomy缺乏同義詞、英文單復(fù)數(shù)控制以及標(biāo)題、詞語(yǔ)順序等語(yǔ)法控制。同時(shí),folksonomy的中文運(yùn)用問(wèn)題上還存在著分詞結(jié)構(gòu)模糊;在不同的語(yǔ)言環(huán)境下,對(duì)語(yǔ)義的普遍認(rèn)知存在明顯差異的問(wèn)題;垃圾標(biāo)簽的出現(xiàn)使宏觀(guān)標(biāo)簽總圖的準(zhǔn)確性下降,對(duì)垃圾信息和標(biāo)簽的合理使用還沒(méi)有行之有效的解決方法[4]。
目前,folksonomy的使用范圍有限,這種分類(lèi)法的組織對(duì)象基本上是非學(xué)術(shù)的、面向生活的、公眾的,目前僅限于blog等社會(huì)性網(wǎng)站的組織和管理,而這部分信息在網(wǎng)絡(luò)信息空間中僅是微量部分。由于受語(yǔ)言、風(fēng)俗習(xí)慣、文化背景等的影響,在跨國(guó)界、跨時(shí)空、跨文化的信息組織和交流中仍然存在很多障礙,作為一種基于自然語(yǔ)言產(chǎn)生的新的網(wǎng)絡(luò)信息組織方式,folksonomy仍然存在許多的問(wèn)題。
3國(guó)外folksonomy研究進(jìn)展
國(guó)外對(duì)folksonomy理論方面的研究始于2005年,通過(guò)對(duì)國(guó)外文獻(xiàn)的閱讀和分析,筆者認(rèn)為國(guó)外對(duì)folksonomy的研究主要集中在以下6個(gè)方面:
3.1Folksonomy存在價(jià)值的研究
自由分類(lèi)法這一概念的產(chǎn)生晚于它的應(yīng)用,最初的討論集中在其存在價(jià)值的研究:Admam認(rèn)為folksonomy將取代以往由專(zhuān)家控制的元數(shù)據(jù)編輯管理;Clay認(rèn)為folksonomy是有勝于無(wú)的方案;Shelly認(rèn)為傳統(tǒng)分類(lèi)法過(guò)于復(fù)雜,維護(hù)成本高;Louis認(rèn)為folksonomy缺乏檢索功能、精確性不強(qiáng)。
3.2基于tag的定量分析
Lambiotte采用了概率論和數(shù)學(xué)建模的方法對(duì)專(zhuān)業(yè)音樂(lè)網(wǎng)站數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)使用tag描述在線(xiàn)合作性分類(lèi)產(chǎn)成了由不同結(jié)點(diǎn)即用戶(hù)、款目和標(biāo)簽構(gòu)成的三重網(wǎng)絡(luò)。其次,通過(guò)分析用戶(hù)使用款目和tag之間的關(guān)系分析了這三個(gè)要素構(gòu)成的無(wú)序網(wǎng)絡(luò)。再次,采用過(guò)濾技術(shù)來(lái)分析用戶(hù)的合作性行為,認(rèn)為網(wǎng)絡(luò)的等級(jí)結(jié)構(gòu)產(chǎn)生了對(duì)用戶(hù)類(lèi)型的統(tǒng)計(jì)定義,提取了合作性過(guò)濾和分類(lèi)之間的直接連接關(guān)系并提出了合作性社群中測(cè)量用戶(hù)多樣性的方法[5]。
Christopher通過(guò)對(duì)Technorati中排名前350的tag以及分享同一tag文章的相似性進(jìn)行定量研究,分析了blog標(biāo)簽分類(lèi)的有效性。發(fā)現(xiàn)tag在粗略的分類(lèi)體系中是有效的,但是在表明特殊的文章內(nèi)容時(shí)是無(wú)效的,tag與自動(dòng)抽詞高度相關(guān),可以高度聚焦分類(lèi)文章。討論了未來(lái)tag成為信息組織和檢索工具更加有效的方法:更具表達(dá)力和簡(jiǎn)潔性、易用tag的形成;用戶(hù)對(duì)tag分群,tag間特定關(guān)系的闡釋?zhuān)瑃ag與特定的人或物相關(guān);產(chǎn)生幫助用戶(hù)自動(dòng)形成文章tag的工具;標(biāo)簽發(fā)展為社會(huì)現(xiàn)象的興趣研究等[6]。
3.3基于用戶(hù)的定量分析
Ciro采用統(tǒng)計(jì)學(xué)和概率論的方法對(duì)del.icio.us和Connotea中的tag進(jìn)行了統(tǒng)計(jì)分析,構(gòu)架了用戶(hù)使用合作性標(biāo)簽的隨機(jī)模型,該模型包含兩個(gè)要素:對(duì)于他人標(biāo)記活動(dòng)感知的用戶(hù)偏好機(jī)制以及系統(tǒng)中tag的時(shí)效性。盡管用戶(hù)個(gè)體的認(rèn)知過(guò)程是復(fù)雜的,個(gè)體的分類(lèi)、標(biāo)記標(biāo)簽的行為是錯(cuò)綜復(fù)雜的,但是在合作性標(biāo)簽系統(tǒng)內(nèi),用戶(hù)普遍的標(biāo)記行為卻遵循著簡(jiǎn)單的活動(dòng)模式[7]。
Scott采用模型和圖表研究了用戶(hù)使用合作性標(biāo)簽系統(tǒng)的規(guī)律以及合作性標(biāo)簽系統(tǒng)的結(jié)構(gòu)、使用標(biāo)簽的頻率、各種標(biāo)簽的應(yīng)用、相關(guān)標(biāo)簽使用的穩(wěn)定性的分析,認(rèn)為tag反映了用戶(hù)興趣的發(fā)展變化[8]。
3.4系統(tǒng)的設(shè)計(jì)及應(yīng)用研究
Cameron建立了基于資源、用戶(hù)和標(biāo)簽的網(wǎng)絡(luò)標(biāo)簽?zāi)P,然后?2個(gè)標(biāo)簽系統(tǒng)為例,設(shè)計(jì)了標(biāo)簽系統(tǒng)的模塊和系統(tǒng)屬性,這些模塊為:使用標(biāo)簽的權(quán)限、標(biāo)簽的聚集、標(biāo)簽支持/供給、資源的類(lèi)型、來(lái)源、資源的鏈接、群體在系統(tǒng)中的連通性。分析了用戶(hù)添加tag時(shí)的7種動(dòng)機(jī)即未來(lái)檢索、貢獻(xiàn)和分享、注意力的吸引、競(jìng)爭(zhēng)、自我表現(xiàn)、觀(guān)點(diǎn)表達(dá)等以及這7種動(dòng)機(jī)對(duì)標(biāo)簽系統(tǒng)的不同影響,并在flicker中進(jìn)行了實(shí)驗(yàn)。該標(biāo)簽系統(tǒng)為開(kāi)發(fā)者和設(shè)計(jì)者提供了基于tag的模型設(shè)計(jì)和基本思路[9]。
Satoshi Niwa認(rèn)為,由于難以收集用戶(hù)偏愛(ài)網(wǎng)頁(yè)的數(shù)據(jù)、因特網(wǎng)上的網(wǎng)頁(yè)數(shù)量龐大,通過(guò)協(xié)作性過(guò)濾來(lái)構(gòu)建網(wǎng)頁(yè)評(píng)價(jià)體系的嘗試存在一定困難,提出了通過(guò)正在流行的folksonomy和社會(huì)性書(shū)簽工具來(lái)構(gòu)建覆蓋整個(gè)網(wǎng)絡(luò)網(wǎng)頁(yè)評(píng)價(jià)系統(tǒng)的方法[10]。
多倫多大學(xué)Jennifer和美國(guó)丹佛藝術(shù)博物館Bruce提出博物館的收藏支持社會(huì)性書(shū)簽,并且提供基于folksonomy的檢索,這給開(kāi)放的博物館一種新的闡釋[11]。
Darlene指出對(duì)于內(nèi)部網(wǎng)而言,通過(guò)標(biāo)簽可以自由分享未曾發(fā)現(xiàn)的數(shù)字資源。通過(guò)賓夕法尼亞大學(xué)圖書(shū)館的Penn Tags的社會(huì)性書(shū)簽服務(wù)項(xiàng)目和哈佛大學(xué)Berkman互聯(lián)網(wǎng)社會(huì)研究中心的H20 Playlist項(xiàng)目以及IBM引入folksonomy理念開(kāi)發(fā)的企業(yè)社會(huì)性書(shū)簽工具dogear來(lái)說(shuō)明站點(diǎn)管理員可以試著使用多種社會(huì)性軟件來(lái)支持標(biāo)簽活動(dòng)并指出標(biāo)簽活動(dòng)可以消除信息分類(lèi)者和員工對(duì)信息理解的分歧[12]。
3.5Folksonomy缺陷解決措施研究
日本學(xué)者從認(rèn)知學(xué)雙循環(huán)滿(mǎn)意原則即及時(shí)滿(mǎn)意和延時(shí)滿(mǎn)意的角度來(lái)解決folksonomy信息質(zhì)量、信息分享問(wèn)題,并且針對(duì)分類(lèi)法的非連續(xù)性和同名義意的問(wèn)題提出了解決辦法,并且提出了基于元數(shù)據(jù)的個(gè)人本體框架[13]。
Louis提出元數(shù)據(jù)生態(tài)學(xué)的概念,基本思想為:設(shè)計(jì)合理的元數(shù)據(jù),建立可控的、動(dòng)態(tài)發(fā)展的元數(shù)據(jù)詞匯表,同時(shí)鼓勵(lì)作者和用戶(hù)創(chuàng)造folksonomy詞匯,并作為受控詞表收詞的備選,與受控詞表一起構(gòu)建和諧的網(wǎng)絡(luò)信息組織環(huán)境[14]。
3.省略網(wǎng)站和美味書(shū)簽中進(jìn)行了URLCount和URLRank、TagCount以及TagRank和UserRank檢索結(jié)果的比較和分析[15]。
Andreas研究了folksonomy的信息檢索問(wèn)題,構(gòu)建了folksonomy的模型和FolkRank檢索機(jī)制,并采用這種新的檢索運(yùn)算法則來(lái)研究folksonomy的結(jié)構(gòu)。采用FolkRank運(yùn)算法則計(jì)算了特定主題的排序,并且比較了FolkRank和PageRank間的不同[16]。
Al-KhalifaScott通過(guò)測(cè)量folksonomy和yahoo關(guān)鍵詞設(shè)置的重疊率以及索引者主觀(guān)評(píng)價(jià)兩種系統(tǒng)產(chǎn)生的關(guān)鍵詞的質(zhì)量,來(lái)對(duì)基于相同網(wǎng)站的yahoo API文本語(yǔ)詞抽取技術(shù)和folkson-omy進(jìn)行評(píng)價(jià)[17]。
4結(jié)語(yǔ)
Folksonomy作為一種出現(xiàn)不久的網(wǎng)絡(luò)信息組織方法,缺乏重量級(jí)的應(yīng)用,對(duì)其研究還需進(jìn)一步加強(qiáng)。了解國(guó)外folksonomy的最新研究概況,汲取國(guó)外構(gòu)建各種模型、tag系統(tǒng)時(shí)的經(jīng)驗(yàn)和研究方法,對(duì)促進(jìn)我國(guó)folksonomy的研究將有積極的促進(jìn)意義。
2005年5月10日國(guó)內(nèi)博客網(wǎng)站blogbus首次推出tag功能并與專(zhuān)業(yè)搜索引擎Technorati整合,標(biāo)志著folksonomy理念進(jìn)入中國(guó)并逐步被采用。雖然目前使用或知道tag的網(wǎng)民還主要限于網(wǎng)上博客,標(biāo)簽軟件的應(yīng)用標(biāo)準(zhǔn)等尚待完善,folksonomy尚需后受控手段與受控語(yǔ)言的融合,但網(wǎng)民卻接受了這種“有勝于無(wú)”的方案。在Web2.0時(shí)代,每個(gè)人都有權(quán)自由獲取、組織和使用信息,而folksonomy作為反映草根文化和民間力量的信息組織方式,為用戶(hù)提供了一個(gè)契機(jī),它將促進(jìn)全球信息的分享、交流乃至文化融合、世界大同的共有理念的形成。
參考文獻(xiàn):
[1] 周榮庭,鄭彬.分眾分類(lèi):網(wǎng)絡(luò)時(shí)代的新型信息分類(lèi)法.現(xiàn)代圖書(shū)情報(bào)術(shù),2006(3):72-75.
[2] 梁桂英,李記旭.folksonomy初探.圖書(shū)館雜志,2006(4):46-49.
[3] tag-我分類(lèi).[2006-6-25].http://www.省略/maozixi-ansheng/.
[4] Folksonomy與語(yǔ)言的關(guān)系以及中文應(yīng)用的問(wèn)題.[2006-06-25].http://blog.省略.
[5] Lambiotte R, Ausloos M. Collaborative tagging as a tripartite network.[2006-08-15].省略/abs/cs.DS/0512090.
[6] Brooks C H, Montanez N. An analysis of the effectiveness of tagging in blog.[2006-08-15].http://www.cs.usfca.edu.
[7] Cattuto C, Loreto V,Pietronero L. Collaborative tagging and semiotic dynamics.[2006-08-15].省略/.
[8] Golder S A, Huberman B A. The structure of collaborative tagging systems.[2006-08-15].省略/
[9] Marlow C. Tagging paper, taxonomy, flickr, academic article,to read.[2006-08-15].http://www.省略.
[10] Niwa S, Doi T, Honiden S. Web page recommender system based on folksonomy mining for ITNG?6 Submissions.[2006-08-15].http://ieeexplore.省略/.
[11] Trant J, Wyman B. Investigating social tagging and folksonomy in art museums withsteve.museum.[2006-08-15].http://www.省略.
[12] Fichte D. Intranet applications for tagging and folksonomies.[2006-08-20].http://www.省略.
[13] Ikki Ohmukai, Masahiro Hamasaki, Hideaki Takeda. A Proposal of Community-based Folk-sonomy with RDF Metadata.[2006-08-15].http://www.ifi.unizh.ch/.
[14] Rosenfeld L. Folksonomies? How about metadata eco1ogies7.[2006-08-15].http://www.省略.
[15] Szekely B, Torres E. Ranking bookmarks and bistros:Intelligent community and folksonomy development.[2006-08-15].http:/ /torrez.us/.
[16] Hotho A, Jaschke R, Schmitz C, et al. Information retrieval in folksonomies:search and ranking.[2006-08-15].http://www.kde.cs.
[17] Al-Khalifa H S, Davis H C. Folksonomy versus autionmatic keywaord extraction: an empirical study.[2006-08-15].http://eprints.ecs.soton.ac.uk/.
〔作者簡(jiǎn)介〕 余金香,女,1983年生,碩士研究生。
相關(guān)熱詞搜索:研究進(jìn)展 國(guó)外 Folksonomy Folksonomy及其國(guó)外研究進(jìn)展 國(guó)外自由基研究進(jìn)展 國(guó)外基坑研究新進(jìn)展
熱點(diǎn)文章閱讀