【標注及其演化研究】 景區(qū)演化研究
發(fā)布時間:2020-03-07 來源: 短文摘抄 點擊:
[摘要]探討標注的概念,分析印本形式標注的種類與作用,數(shù)字形式標注在計算機領域和數(shù)字圖書館領域的應用,重點剖析大眾標注概念的內(nèi)涵、應用、不足和發(fā)展態(tài)勢等。
[關(guān)鍵詞]標注演化大眾標注印本形式標注數(shù)字形式標注
[分類號]G250.76
標注古已有之,在計算機出現(xiàn)之前標注都是由手寫完成,人們往往通過標注來表達自身的閱讀感受與觀點態(tài)度,同時也方便日后查找,這是標注最基本的功能。進入計算機時代,數(shù)字形式的標注隨之出現(xiàn),使得標注的功能已經(jīng)不僅僅局限于滿足閱讀者個人的需求。大眾標注(follksonomy)這一體現(xiàn)著第二代互聯(lián)網(wǎng)功能特征的網(wǎng)絡信息技術(shù)的出現(xiàn),從本質(zhì)上改變了傳統(tǒng)標注的方法、性質(zhì)、功能和作用,對標注這一古老的活動賦予了全新的內(nèi)涵。
1 印本形式標注及其作用
在其發(fā)展早期,標注表現(xiàn)為手寫形式,出現(xiàn)在書本頁面的空白處,其功能主要是對文本內(nèi)容進行注釋,或者是閱讀者對閱讀內(nèi)容發(fā)表的觀點、體會等。此種標注多數(shù)不具備標引文獻內(nèi)容的功能,但有些標注是與標注對象具有邏輯關(guān)系的詞語,這種標注已經(jīng)具備了一定的標引功能,有利于提高查找文獻的便利性和效率。
1.1 印本形式標注的種類
在中國,標注主要產(chǎn)生于兩個方面:①在對經(jīng)典名著或古籍資料的解讀過程中產(chǎn)生的,如一些名著的批注本;②應用于學習之中的,用于注解閱讀內(nèi)容,如在學習文言文過程中對字、詞、句含義的注釋,在學習語言過程中對單詞、語法等的注釋等。古籍注釋是我國古代文化賴以傳承的一種主要方式。出現(xiàn)于漢代的某些古籍的書面語注釋,如注解《詩經(jīng)》的《古訓傳》、注解《春秋》的《公羊傳》等,可以說是古籍注釋的先驅(qū)。
在學習方面,較為普遍的注釋是讀者在閱讀過程中進行的批注,其作用是幫助自己掌握書中的內(nèi)容。批注是我國文學鑒賞和批評的重要形式和傳統(tǒng)的讀書方法,其內(nèi)容往往是與所讀內(nèi)容較為貼切的短語斷句。根據(jù)批注出現(xiàn)的位置,可以將之分為“眉批”、“旁批”和“尾批”等。其類型主要包括注釋、提要、批語、警語等。批注的主要功能體現(xiàn)為閱讀者對自身感受的筆錄,體現(xiàn)著閱讀者別樣的理解、體會和情懷。大部分批注只是表達閱讀者的觀點與態(tài)度,而不直接揭示文獻的內(nèi)容,基本不具備檢索功能。
此外,中國封建社會皇帝對各類奏章所進行的批注,則是印本形式標注的另一種表現(xiàn)形式。這種批注是皇帝閱讀奏章過程中意見的表達,是皇帝發(fā)布命令的一種方式,一般不直接揭示奏章的內(nèi)容,當然也不具備標引功能。
1.2 印本形式標注的作用
印本形式標注是讀者閱讀文獻的一種反饋,通常也為其他讀者利用文獻提供了一種線索或指導。標注作為閱讀與思考結(jié)果的一種呈現(xiàn)方式,在一定程度上體現(xiàn)或蘊含了讀者對文獻的利用方式、利用過程和利用結(jié)果,表明該文獻或該文獻的某一部分在解決讀者的疑問,滿足讀者的需求方面發(fā)揮了作用。表明讀者通過對所讀內(nèi)容的學習和理解,結(jié)合其自身的知識結(jié)構(gòu)和知識積累,得到了某些啟迪和借鑒。這些標注不僅有助于讀者以后再次利用文獻,對同一文獻的其他讀者來說也具有參考價值。
2 數(shù)字形式標注及其應用
隨著計算機技術(shù)的迅速發(fā)展,標注開始從印本形式發(fā)展到數(shù)字形式。用戶可以在數(shù)字空間中借助計算機隨意創(chuàng)建、修改和刪除標注,為日后自己或他人重復利用同一資源提供便利。
2.1 計算機領域數(shù)字形式標注及其應用
國外有關(guān)學者研究表明,在計算機領域,首次采用標簽(tag)方式進行標引的文件系統(tǒng)是微軟的DOS系統(tǒng)。1986年施樂公司構(gòu)建了一個用于標注和編輯語音記錄的原型系統(tǒng),該系統(tǒng)允許用戶為文檔添加語音標注,同時也允許用戶為語音片段添加文本標注,作為標識其內(nèi)容的線索。此后的十余年中,計算機界的研究人員在這一領域進行了不懈地努力和探索,他們對印本環(huán)境中用戶的閱讀行為和標注活動進行研究,發(fā)現(xiàn)標注是思考性閱讀過程的一個組成部分,它對資源的后續(xù)使用者更為有效地利用該資源具有一定的參考作用。基于此,人們開始嘗試在數(shù)字環(huán)境下模擬印本的閱讀環(huán)境,開發(fā)應用于不同平臺,面向不同媒體格式的數(shù)字標注系統(tǒng),如用于標注網(wǎng)頁的ComMentor、Annotator、ThirdVoice、Cdd,mk、CoNote、Futplex等,用于標注電子郵件的Tapestry,用于標注文本文件的Acrobat、MicrosoftWord、SemanticWord,用于標注PowerPoint文件的Briefing Associate,用于標注多媒體文檔的Dynomite,用于桌面計算機系統(tǒng)的Xlibris,用于手持設備上的標注系統(tǒng)Notable,可同時用于桌面計算機和手持設備的NotePals,實現(xiàn)交互式教學的Classroom2000,支持個性化標注的Yawas等。這些系統(tǒng)從不同角度對印本文獻的閱讀環(huán)境和工作環(huán)境進行模擬與再現(xiàn),利用計算機和網(wǎng)絡的強大功能拓展這一環(huán)境,實現(xiàn)交互式閱讀和用戶之間的協(xié)作。
2.2 數(shù)字圖書館領域數(shù)字形式標注及其應用
20世紀90年代,在數(shù)字圖書館概念形成之初,人們就開始考慮如何在數(shù)字圖書館中引入數(shù)字形式標注功能。1997年,施樂公司的研究人員根據(jù)對特定印本環(huán)境中標注(大學校園中教科書內(nèi)的標注)的研究,探討了在數(shù)字圖書館中引入數(shù)字形式標注的意義和面臨的問題。人們列數(shù)字圖書館和協(xié)作服務中的標注進行了研究,從元數(shù)據(jù)、內(nèi)容、對話行為三個角度來分析標注,闡述了標注、數(shù)字圖書館和協(xié)作服務之間的關(guān)系,探討了利用標注為用戶查詢相關(guān)文檔的搜索策略;ヂ(lián)網(wǎng)的發(fā)展帶來資源的分布和異構(gòu),由此引發(fā)的另一個問題是如何從這些分布、異構(gòu)的資源中無縫地檢索和獲取資源。為了充分利用科研人員的標注成果,人們還研究了如何通過外部的、概念化的標注來整合科學數(shù)據(jù),提出了相應的模型框架。采用分層數(shù)據(jù)存取服務的方式,實現(xiàn)了對科學數(shù)據(jù)的數(shù)字化標注。
2.3 數(shù)字形式標注的發(fā)展
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們對標注的研究開始突破系統(tǒng)/工具的開發(fā)或整體研究的范疇,向著更為深化、細致的方向發(fā)展。這主要體現(xiàn)在以下方面,①對在不同系統(tǒng)或不同表現(xiàn)形式下標注的適應性進行研究,當用戶改變?yōu)g覽器窗口的大小時,標注的內(nèi)容會隨之改變,以適應變化后的內(nèi)容版面。②關(guān)于識別手寫符號的研究,開發(fā)出的許多工具或系統(tǒng),用以解決對筆式工具所形成結(jié)果的識別問題。③進一步擴展了標注的研究對象,包括自動抽取文檔中的標題、作者等特征項,為它們加上不同的指示符號等。同時,開始研究對新格式、新協(xié)議的支持和應用等。④關(guān)于語義標注的研究,隨著語義Web的出現(xiàn),語義標注也開始出現(xiàn),相應的出現(xiàn)了支持語義標注的系統(tǒng)和工具。
3 大眾標注的內(nèi)涵及其應用
近年來,基于網(wǎng)絡的數(shù)字形式標注正在成為一種時尚的 大眾網(wǎng)絡行為。尤其是,隨著瀏覽器功能的日益強大,數(shù)字形式標注的使用也更加普遍,操作更為便捷。大量應用系統(tǒng)的出現(xiàn),逐步形成一種由用戶參與建立起來的、互動的學習,交流和共享環(huán)境。大眾標注應運而生。
3.1 大眾標注提出的背景
在大眾標注的概念提出之前,人們總希望文獻的組織有條不紊,最好是全國乃至全世界都使用統(tǒng)一的信息組織標準,可是這種大一統(tǒng)的理念和做法卻束縛了信息組織的靈活性和個性化。blog、wiki等完全平民化的信息發(fā)布渠道異軍突起,打破了以往只能由少數(shù)新聞傳播機構(gòu)或者少數(shù)信息服務機構(gòu)發(fā)布信息的格局,大眾由單純的信息接受者逐漸發(fā)展成為信息接受者與信息發(fā)布者的統(tǒng)一體(prosumer)。網(wǎng)絡已經(jīng)成為人們抒發(fā)情感、張揚個性的最佳渠道。人們在不斷創(chuàng)造信息的同時,也需要按照自己的需求,以不同的方式有效地組織各類信息。于是,不受傳統(tǒng)信息組織規(guī)范約束,完全出于個人喜好的標注方式,逐漸成為人們推崇的數(shù)字信息組織的主要方法。Joshua Schachter開發(fā)的del.icio.us系統(tǒng)(網(wǎng)站)于2003年底投入使用,向用戶提供在線標注網(wǎng)頁的服務,促進了大眾標注實踐活動的開展。隨后,基于大眾標注的信息組織理念迅速被人們應用到其他系統(tǒng)之中,涌現(xiàn)出一大批支持大眾標注的網(wǎng)站。2004年底,Thomas Vanderwal首次以folksonomy這一詞匯形容大眾標注的概念。目前,大眾標注已經(jīng)成為人們對網(wǎng)絡資源自由標注、自由分類的專業(yè)術(shù)語。
3.2 大眾標注的內(nèi)涵
針對大眾標注概念的內(nèi)涵,許多學者進行了深入研究,其中最具代表性的觀點有如下一些:
大眾標注是一種分布式的,大眾在線創(chuàng)建數(shù)字對象元數(shù)據(jù)的方法;
大眾標注是一種技術(shù),也是一種理念。大眾標注可以起到分類的作用;
大眾標注是數(shù)字對象使用者賦予數(shù)字對象文本標識的一種組織機制;
大眾標注是一種基于因特網(wǎng)的信息檢索方法。該方法以合作創(chuàng)建的、不受限制的標簽為基礎,并通過標簽來類分網(wǎng)頁、在線圖片和網(wǎng)絡鏈接等數(shù)字對象;
大眾標注是由用戶創(chuàng)建的分類法,使用不受限制的標簽來類分和檢索各種網(wǎng)絡資源。
綜上所述,筆者認為,大眾標注是網(wǎng)絡資源的利用者為了組織和利用某一數(shù)字資源,而自主地對該資源賦予標簽的過程或結(jié)果。從這一角度上理解,“folksonomy”應該被視為一種大眾性的、自由式的標注,將“folksonomy”譯為“大眾標注”似乎與原文內(nèi)涵更為貼切。
3.3 大眾標注的應用
大眾標注的應用呈現(xiàn)出一種扁平的結(jié)構(gòu),作為標注詞的標簽不受任何限制,標注內(nèi)容與標注對象之間的關(guān)系并不明顯,而且不需要形成一個嚴密的概念體系。任何人都可以創(chuàng)建、選擇自己喜歡的標簽,新標注的引入隨時可以進行,每一個被描述的對象在理論上可以擁有數(shù)量不受限制的標簽,使用者不用接受專業(yè)培訓,而且標注的過程完全可以隨,心所欲。標簽并不能等同于傳統(tǒng)信息組織中使用的關(guān)鍵詞,對于同一個數(shù)字對象,不同用戶可以根據(jù)其自身需要,使用數(shù)量不等,形式各異的標簽進行標注。用戶可以隨意對自己賬戶中的標簽進行增刪和修改,十分方便地利用標注系統(tǒng)管理自己的文章、圖片、音樂和共他數(shù)字資源。在個人網(wǎng)絡信息資源的組織與管理方而,大眾標注已經(jīng)成為一種時尚。
3.4 大眾標注的不足
大眾標注具有許多優(yōu)點:使用成本低,簡單,可擴展性好,可重新組織網(wǎng)絡資源,快速反應用戶需求,社群的信任,用戶擁有個人獨立的空間,能夠提供及時的反饋等。由于具有大眾性、自由性和非專業(yè)性等特點,使得大眾標注自出現(xiàn)伊始就受到廣大網(wǎng)民的喜愛?墒墙(jīng)過一段時間的發(fā)展,人們發(fā)現(xiàn)對于同一內(nèi)容的描述與組織,往往由于標注者的知識背景和喜好的不同而大相徑庭,用戶在不同年齡段對同一標注對象使用的標簽會有所不同。很多人使用標簽只是基于當前的需要,他們一船不會老虎其自身以后的需要,或者其他人的需要。在大眾標注系統(tǒng)中很多標簽只被使用過一次。如dei.iciolus的統(tǒng)計表明,在用戶提供的20萬個標簽中,有19萬個標簽僅被使用過一次,標簽對資源查找的支持效果不佳。盡管支持大眾標注的網(wǎng)站系統(tǒng)可以將用戶使用過的所有標簽都加以保存,并作為檢索點提供給用戶瀏覽或檢索,但其結(jié)果卻往往導致信息的泛濫和查全率的降低。國外學者研究表明,大眾標注存在標簽濫用、標準缺乏、信息檢索效率低,用戶之間難以理解對方的標簽,系統(tǒng)不能為用戶提供同義詞詞典等缺點。此外,大眾標注還存在標簽語義模糊,同音異義詞、同義詞、方言的使用難以有效控制,標注缺乏秩序,邏輯關(guān)系不明確等問題。
3.5 大眾標注的最新研究進展
隨著大眾標注應用的不斷深化,人們開始探討如何提高標注在資源查找、發(fā)現(xiàn)、利用和共享等方面的價值與效率。標注的目的乃是為下一次查找與利用提供便利,如果標注不利于高效查找,其意義將大打折扣。大眾標注經(jīng)過一段時間的發(fā)展后,開始走入非完全自由標注的階段了。多數(shù)支持大眾標注的網(wǎng)站往往會在用戶輸入標簽時,提示并推薦他們認為更適合用來標注該資源的標簽。其后臺實現(xiàn)方法是,以自動統(tǒng)計的方式,將同一含義并且使用頻率較高的標簽推薦給用戶。盡管用戶在標注網(wǎng)絡信息資源時可以做到隨心所欲,但是由于標簽的使用不受限制,使得基于大眾標注組織起來的各種網(wǎng)絡信息資源查找起來相當困難。為了做到既保持用戶自由標注的優(yōu)點,又能使之以更高的效率支持用戶查找和發(fā)現(xiàn)信息,進入2007年,SamanthaHastings、HemalataIyer、DianeNeal、Abebe Ronssa和JungWon Yoon等人就如何構(gòu)建具有高效查找與搜索功能的大眾標注系統(tǒng)開展了一系列研究。
ManekeGuy等撰文指出,對用戶進行有關(guān)自由標注方法的教育,可以提高大眾標注的資源組織效率。用戶的標注方法教育可以包括但不局限于:標簽不要出現(xiàn)拼寫錯誤,詞語的合成要符合規(guī)則,注意作為標簽的詞語在語態(tài)、格和單復數(shù)的不同形式,不要采用過于個性化的詞語作為標簽,不要使用那些在標簽數(shù)據(jù)庫中只出現(xiàn)過一次的標簽等。MichaelPeinhopf認為,改進大眾標注的方法可以包括:提供一組受控的詞語列表,讓用戶只能在系統(tǒng)提供的詞語列表中選擇詞匯進行標注。建立同義詞控制機制,即當用戶輸入某一詞語作為標簽時,同義詞檢驗系統(tǒng)會即時提醒用戶使用更為適合的詞語;跇撕灥恼Z義關(guān)系,構(gòu)建被標注對象之間的聯(lián)系,提高標注系統(tǒng)的信息組織功能,以及提高用戶的標注素養(yǎng)等。
4 結(jié)語
如何充分發(fā)揮大眾標注的作用是一個值得思考的問題。大眾標注的最終目標無非是為了實現(xiàn)更廣泛、更便捷的信息 共享與交流。但是,高效率的共享與交流往往要求使用大量為普通大眾所共同認可的標簽進行標注。這將要求對標注活動加以規(guī)范,而規(guī)范勢必限制自由。大眾標注從出現(xiàn)伊始就以完全尊重信息用戶的個性化標注意愿為出發(fā)點,這是其最本質(zhì)的特色。因此,規(guī)范的推行有可能使得大眾標注在很大程度上將不再是“大眾”標注。大眾標注下一步如何發(fā)展,我們將拭目以待。
相關(guān)熱詞搜索:演化 標注 研究 標注及其演化研究 地球演化研究進展 為了研究太陽演化進程
熱點文章閱讀