【基于大眾標注的情報學基本原理探析】 情報學
發(fā)布時間:2020-03-07 來源: 散文精選 點擊:
[摘要]新型信息交互環(huán)境下,大眾標注在信息資源的組織和獲取過程中,具有信息用戶的主動參與、信息資源的交互共享以及信息中介的社會化協(xié)同等特征,從而較能體現(xiàn)情報學以用戶需求為中心的宗旨和特征。基于大眾標注的上述特征,分析情報學的最小努力性、適度相關性及混沌有序性等基本原理,并分析上述原理分別體現(xiàn)出的信息用戶能動選擇、情報要素關聯(lián)分布、情報結構混序演化等規(guī)律。
[關鍵詞]情報學 基本原理 大眾標注
[分類號]G350
1 引言
基本原理是指某一領域或某一學科中具有普遍意義的基本規(guī)律。開展情報學基本原理研究,有助于豐富情報學的理論體系,有助于加強情報學的學科地位;掌握情報學的基本原理,有助于提高情報學研究和實踐的科學性,避免盲目性。
在傳統(tǒng)信息環(huán)境下,專家學者曾對情報學的基本原理進行了研究。楊超提出了情報學的6個基本原理:整體性、環(huán)境適應性、用戶友好性、系統(tǒng)安全性、兼容性、信息資源的共享性等原理;該基本原理主要側重于信息系統(tǒng)方面,而對用戶行為方面的概括較少。馬費成教授提出了情報學的6個基本原理:離散分布、相關性、有序性、易用性、小世界及對數(shù)透視等原理,并認為離散分布原理和相關性原理雖然目前研究較多,但尚有很多不足,其它原理的情報學研究成果顯得很零星。梁戰(zhàn)平教授提出了情報學的10方面基本原理:隱藏、相關性、離散分布、有序性、重組、轉化、對數(shù)透視、小世界、可視化、最小努力等原理。梁戰(zhàn)平教授的基本原理中包含有馬費成教授的6方面基本原理,并又提出重組、轉化、可視化和隱藏等四方面原理。
情報系統(tǒng)是“人-中介-資源”系統(tǒng),其基本目的和任務是將知識和信息組織有序化,以用戶認為方便的形式提供有效利用。對情報學基本原理的概括和總結,除了應該關注信息中介載體的獲取和加工過程規(guī)律外,還應關注信息資源本身的形成和存在規(guī)律,信息用戶組織和獲取相關信息資源的行為規(guī)律以及信息用戶、信息資源以及信息中介三要素之間的相互影響的規(guī)律。
受傳統(tǒng)情報信息技術及環(huán)境的限制,信息用戶只能被動地接受情報信息的提供,并且信息用戶相互之間缺乏有效的交互共享的環(huán)境條件,因此,傳統(tǒng)的情報學研究多關注于文獻等信息載體方面,雖然有的學者也認識到用戶認知和效用在情報學中的重要性,但多采用問卷調(diào)查和網(wǎng)絡日志分析等方法,尚不能客觀有效地揭示情報用戶的認知和效用。
新一代網(wǎng)絡環(huán)境下,情報學的研究和實踐面臨著新的環(huán)境和應用,特別是大眾標注技術的出現(xiàn),使得用戶能夠主動參與對信息資源的標注,相互之間能夠交互共享相應的情報信息資源,并且社會化的大眾參與標注能夠形成一定涌現(xiàn)的有序性特征,因此,對于情報學相關原理的體現(xiàn)和升華,大眾標注具有傳統(tǒng)理論研究環(huán)境不可比擬的優(yōu)勢。
2 大眾標注的含義及特征
2.1 大眾標注的含義
大眾標注是指在公開分享的環(huán)境中,由信息使用者共同為各類信息資源進行標記或分類,也即由使用者個人對于各類信息資源進行索引或分類,進而形成眾人共同索引和分類的機制,如圖1所示:
大眾標注的概念最早出現(xiàn)于社會性書簽網(wǎng)站的應用。Smith Gene總結了大眾標注的發(fā)展簡史:2004年初,Joshua Schachter開發(fā)了del.icio.us系統(tǒng)(網(wǎng)站),開始采用非層次的關鍵詞分類系統(tǒng)并允許用戶在線標引網(wǎng)頁;2004年底,Thomas Vander Wal通過一個郵件討論列表,首次提出“folksonomy”概念;2005年初,支持標簽的網(wǎng)站開始大量出現(xiàn)。
大眾標注的發(fā)展如此迅速,主要由于實踐應用和理論研究兩方面的推動作用。在實踐應用方面,有“flickr”、“Del.icio.us”、“Technorati”等著名網(wǎng)站的帶動;理論研究方面,有ASIST、SIG/CR、DC、WWW、ACMCHI、ACM SIGIR、IA Summit等組織和會議的推動。
2.2 大眾標注的特征
2.2.1 信息用戶的主動參與 在大眾標注過程中,大量信息用戶分別根據(jù)自己的偏好和對網(wǎng)絡信息資源的認知能力,選擇相應的標簽進行標注,并將相應的資源和標簽保存到網(wǎng)絡收藏夾中,以便供標注者自身或者他人檢索相應的信息資源。
大眾標注是面向用戶的,完全依賴于用戶個體的參與和貢獻。大眾標注的產(chǎn)生,是用戶基于個人信息管理的目的,使用自己的詞匯對信息進行標注,以便再次查找和使用。所形成的標簽集是由關注該信息資源的用戶群生成的,這些用戶在檢索該標簽集合時,能夠顯示一定的興趣。大眾標注是以用戶主動參與為特征,體現(xiàn)了用戶的個性化認知和價值效用。
2.2.2 信息資源的交互共享 大眾標注有兩個獨特的特點:①參與的廣泛性;②標注的隨意性(不受限制)。無限多用戶的參與使得被標注對象每個角落的內(nèi)容得到較全面的揭示和反映。從長尾理論的角度看,資源的每一部分都是有價值的,區(qū)別僅僅在于價值的大小及受眾群體的不同。用戶參與標注可以實現(xiàn)對不同部位、不同細節(jié)的注意與發(fā)掘,有利于長尾價值的揭示和利用。以往的網(wǎng)頁內(nèi)容是分散的孤島,標簽將它們相聯(lián)系并實現(xiàn)信息共享,因此具備更強的用戶吸引力和粘合力。
標注的典型功能是共享。通過標簽中介,用戶與資源之間以及具有相似標注的用戶之問,建立了交互共享的聯(lián)系。除了準確定位個人信息,相同的標簽能夠聚合整個信息空間中的所有相似內(nèi)容,實現(xiàn)資源的共享,基于標簽的瀏覽更能使用戶獲得意外的發(fā)現(xiàn)。
2.2.3 社會化標簽的社會化協(xié)同
用戶在資源的共享過程中能夠找到與自身有相同興趣的人群,得到關于標簽使用的反饋,從而影響其未來的行為,因而大眾標注的形成和發(fā)展具有明顯的社會化性質(zhì)。在大眾標注過程中,大量的信息用戶運用大量的社會化標簽對大量的信息資源進行標注,不同用戶之間能夠彼此相互瀏覽對方的資源及相應的標簽,可通過相互學習和借鑒而糾正自身隨后的相關標注行為,從而隨著標注的增加,用戶標注行為存在著協(xié)同效應。
通過大量用戶對資源的大眾化、持續(xù)的標注,所形成的標簽集既能形成對資源客觀屬性特征的較全面的揭示,又能較充分地反映用戶的認知及效用特征。用戶隨手對自己的內(nèi)容增加一些個性化的標簽,就對這些內(nèi)容產(chǎn)生了重新的認識,更容易將過去、現(xiàn)在的所有思維串聯(lián)起來。標簽可以快速地在一個公共信息空間創(chuàng)建一個信息剖面,智能聚合各種相關信息,這種能力可以產(chǎn)生很多應用價值。
3 大眾標注中情報學基本原理的體現(xiàn)
基本原理的精髓在于具有一定的概括性,能夠統(tǒng)攝具體的原理,并且相互之間應具有一定的邏輯性關系。情報學基本原理應基于情報學以用戶需求為中心的宗旨和目的,具有一定的抽象性和普適性,并應避免現(xiàn)象和操作的一般性總結。鑒于此,本文在大眾標注的新型情報信息環(huán)境下,基于馬費成、梁戰(zhàn)平等教授所 提出的基本原理,嘗試提出如下情報學的基本原理:最小努力性、適度相關性、混沌有序性。
3.1 基于主動參與的最小努力性原理
大眾標注中信息用戶能夠根據(jù)自身的偏好選擇資源,并根據(jù)自身對該資源的認知能力選擇相應的標簽對其標注,因而能夠較充分地體現(xiàn)信息用戶的主動參與和能動選擇特征,可較好體現(xiàn)最小努力性原理。
最小努力性原理體現(xiàn)的是用戶的能動性選擇的特征,即用戶在組織、獲取和利用信息、知識、情報時,總是趨向于簡捷、方便、易用和省力的原則,在付出的成本和獲得的效用之間權衡,從而選擇最省力且滿意的方式米進行。其衡量標準是成本最小、效用最大,因而達到效益最大化。
對數(shù)透視現(xiàn)象表現(xiàn)了情報信息在客觀的物理領域和主觀的認知領域間具有數(shù)量上的對數(shù)性差異。這種對數(shù)性差異不可避免需要考慮到用戶的能動性選擇因素,因此對數(shù)透視現(xiàn)象是最小努力性原理的體現(xiàn)。
3.2 基于交互共享的適度相關性原理
大眾標注為資源和用戶、作者和用戶之間提供了中介,使得用戶主動參與資源的組織和獲取,且相互之間能夠通過標注而進行交互和共享,從而用戶之間依托于萬維網(wǎng)而形成用戶網(wǎng)絡,且用戶集和資源集之間形成多對多的關聯(lián)對應關系。
情報的相關性具有需求相關性、社會認知相關性、中介(情景、主題和算法等)相關性等類型。情報學的相關性除了體現(xiàn)情報信息與信息用戶的相關性之外,還體現(xiàn)情報信息要素相互之間、以及信息用戶相互之間的相關性。
離散分布和小世界現(xiàn)象正是上述兩種相關性的體現(xiàn)。離散分布現(xiàn)象主要體現(xiàn)關聯(lián)要素的分散和集中的規(guī)律,也即社會領域中常見的冪率分布特征。小世界現(xiàn)象揭示的是人類信息聯(lián)系和信息對象之間的相關性,也即無論用戶和資源的范圍多大,都可以通過相關的信息達到最短的路徑聯(lián)系。
情報信息系統(tǒng)中,在分析信息用戶、信息資源以及信息中介相互之間的相互影響和制約關系時,應該相對于特定的時間階段、空間范圍、對象社區(qū),運用具有相對性的適度相關的觀點來分析。
3.3 基于社會化協(xié)同的混沌有序性原理
情報的上游是具有物理結構的數(shù)據(jù)、具有認知結構的知識,下游是具有價值效用的用戶,因此,情報應該具有物理結構的載體、認知結構的內(nèi)容、效用結構的目的。大眾標注為用戶和載體之間提供了有效的中介,較好地體現(xiàn)了上述三種結構,并且隨著標注用戶和資源的增加,用戶參與對資源屬性的揭示會越來越接近于客觀,并且在此過程中,信息用戶能夠將自身的認知偏好集中體現(xiàn)于標簽集合中。
情報結構的有序性,即情報系統(tǒng)要素所形成的相對穩(wěn)定的結構體系,既來源于科學體系的有序性,又來源于人的創(chuàng)造過程的有序性。
重組操作是通過連接、分割和結合的方法,使對象獲得改進的機會,是知識創(chuàng)新的基礎,轉化操作是信息鏈的各要素之間相互轉化,主要體現(xiàn)為隱性知識和顯性知識相互之間的轉化。無論是重組還是轉化,都是情報知識有序化的途徑。
有序性原理主要體現(xiàn)情報資源存在結構和發(fā)展過程的相對有序化。這種有序化由于涉及社會性因素,因而更顯其復雜性。絕對的有序和絕對的無序是不存在的,客觀的有序是一種相對的有序――混序,即介于絕對無序和絕對有序之間。
4 大眾標注中情報學基本原理的升華
情報信息組織和獲取的有效性評價,取決于其用戶效用價值的大小,此外,從情報信息技術的發(fā)展歷程來看,總是沿著用戶主動參與性越來越強、用戶個性化需求的體現(xiàn)越來越便捷的方向發(fā)展,從而以用戶價值為中心的情報學研究和實踐的基本原理的總結符合情報學的宗旨和目的。
情報學的基本原理的核心在于以用戶的認知和效用為中心,關注用戶和資源之間的關聯(lián)性分布及有序性演化(見圖2)。
4.1 最小努力性所體現(xiàn)的能動選擇規(guī)律
情報信息用戶在選擇性認知和獲取相應的情報信息時,具有能動性的特征,即根據(jù)自身的效用需求及認知能力來有目的性的選擇合適的情報信息屬性進行認知,因而,其獲得的情報信息帶有一定的主觀“修正”痕跡,不是傳統(tǒng)的客觀量化結果。
最小努力性原理取決于用戶所付出的成本和所獲得的效用之間的權衡,權衡的標準取決于信息用戶在獲取情報資源時的能動性選擇。在大眾標注中,情報信息用戶通過大眾標注的手段和中介,能夠主動參與情報信息資源的組織和獲取,因而能夠較充分地體現(xiàn)自身的認知水平和效用需求,從而較好地體現(xiàn)了信息用戶的能動選擇規(guī)律。
4.2 適度相關性所體現(xiàn)的關聯(lián)分布規(guī)律
情報信息系統(tǒng)的要素主要有用戶、情報信息、中介(如社會化標簽等),這些要素在情報信息的組織和獲取中,相互之間具有某種關聯(lián)性對應和作用關系,從而能夠形成多樣化的分布特征。
適度相關性原理主要體現(xiàn)情報資源與事物的屬性特征以及用戶的效用目標的相關性。這種相關性主要體現(xiàn)在情報信息載體能否真實反映事物的客觀屬性特征,以及能否恰當滿足用戶的效用目標。大眾標注條件下,用戶不但能主動參與對情報信息資源的標注,使得用戶和資源之間聯(lián)系更緊密,而且用戶與用戶之間能夠相互瀏覽和借鑒彼此的標注結果,能夠交互共享相應的情報信息資源,從而能夠構建起更加緊密的關聯(lián)關系,較好體現(xiàn)了情報信息要素間的關聯(lián)分布規(guī)律。
4.3 混沌有序性所體現(xiàn)的混序演化規(guī)律
情報系統(tǒng)要素間相互作用,所形成的要素結構具有相對穩(wěn)定性,并隨著情報環(huán)境、用戶效用偏好及信息技術條件的改變而不斷演化。
混沌有序原理主要體現(xiàn)情報系統(tǒng)要素結構的相對穩(wěn)定性特征。社會化標注使得信息用戶能夠自下而上持續(xù)地參與信息的組織和獲取,所形成的社會性涌現(xiàn)特征不僅能夠較真實地反映最終用戶的認知需求,而且也體現(xiàn)出了情報結構的混沌有序的演化規(guī)律。
5 總結與討論
情報學是一門交叉性、綜合性的學科,既有自然科學的技術性特征,又有社會科學的人文性特征,因而,情報學的基本原理不能僅局限于客觀自然規(guī)律的描述,還應該包含有主觀社會規(guī)律的闡釋。
大眾標注技術彌補了傳統(tǒng)信息技術的不足:大眾標注所體現(xiàn)的信息用戶主動參與,不同于傳統(tǒng)信息環(huán)境下的信息用戶被動瀏覽,能夠較充分體現(xiàn)信息用戶的認知和效用特征,是對最小努力性原理的較好體現(xiàn);大眾標注所體現(xiàn)的信息資源的交互共享,不同于傳統(tǒng)信息環(huán)境下的信息用戶之間相互隔離,能夠較充分體現(xiàn)不同信息用戶之間、不同信息資源之間以及信息用戶與信息資源之間的關聯(lián)性特征,是對適度相關性原理的較好闡釋;大眾標注所體現(xiàn)出的社會化標簽的社會化協(xié)同,不同于傳統(tǒng)的自上而下的專家分類,能夠較充分體現(xiàn)信息用戶自下而上參與的,較全面和持續(xù)的協(xié)作性分類特征,是對混沌有序性原理的較好闡釋。
因此,情報學的基本原理應該是在大眾標注中所體現(xiàn)出的能夠反映信息用戶能動選擇規(guī)律的最小努力性原理、能夠反映信息要素關聯(lián)分布的適度相關性原理以及能夠反映信息中介混序演化規(guī)律的混沌有序性原理。情報學理論和實踐中較為具體的現(xiàn)象和操作過程,如離散分布、小世界、對數(shù)透視、重組及轉化等,都能夠涵蓋于上述相應的基本原理之中,
傳統(tǒng)的情報學研究的關注點在上述三個基本原理中都可找到相應的影子。信息推薦研究和信息語用研究主要側重于最小努力性原理方面的探討,其中滲透著用戶能動選擇的規(guī)律;信息檢索研究、信息分類研究和信息語義研究主要側重于適度相關性原理方面的探討,其中滲透著信息要素關聯(lián)分布的規(guī)律;信息排序研究和信息語法結構研究主要側重于混沌有序性原理方面的探討,其中滲透著信息結構混序演化的規(guī)律。
相關熱詞搜索:情報學 探析 大眾 基于大眾標注的情報學基本原理探析 文獻信息的基本概念 管理學原理論文
熱點文章閱讀