python可視化編程【引文分析學(xué)形成與發(fā)展的可視化分析】
發(fā)布時(shí)間:2020-03-07 來源: 短文摘抄 點(diǎn)擊:
[摘要]以引文分析領(lǐng)域的1906篇論文、65426條引文為研究對象,借助知識(shí)計(jì)量和知識(shí)圖譜及先進(jìn)的可視化技術(shù)Citespaee等軟件工具,繪制引文分析領(lǐng)域的發(fā)展趨勢知識(shí)圖譜,揭示引文分析領(lǐng)域的初始形成期、發(fā)展繁榮期、深化拓張期三個(gè)階段的演進(jìn)歷程;通過加菲爾德、普賴斯、斯莫爾等主要代表人物文獻(xiàn)的可視化圖譜,具體呈現(xiàn)出他們各自在不同時(shí)期對引文分析領(lǐng)域發(fā)展的獨(dú)特貢獻(xiàn)以及他們有關(guān)引文分析的經(jīng)典文獻(xiàn)對引文分析領(lǐng)域演化路徑的關(guān)鍵作用。
[關(guān)鍵詞]引文分析 文獻(xiàn)共引分析 科學(xué)計(jì)量學(xué) 可視化圖譜
[分類號]G306
1 引 言
科學(xué)知識(shí)可視化圖譜是在信息技術(shù)的推動(dòng)下發(fā)展出來的一個(gè)新領(lǐng)域,當(dāng)前已經(jīng)成為科學(xué)計(jì)量學(xué)的一個(gè)新熱點(diǎn)。陳悅和劉則淵…認(rèn)為科學(xué)知識(shí)圖譜是顯示科學(xué)知識(shí)的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一種圖形,它是揭示科學(xué)知識(shí)及其活動(dòng)規(guī)律的科學(xué)計(jì)量學(xué)從數(shù)學(xué)表達(dá)轉(zhuǎn)向圖形表達(dá)的產(chǎn)物,是顯示科學(xué)知識(shí)地理分布的知識(shí)地圖轉(zhuǎn)向以圖象展現(xiàn)知識(shí)結(jié)構(gòu)關(guān)系與演進(jìn)規(guī)律的結(jié)果。引文分析作為一個(gè)廣闊領(lǐng)域,是否業(yè)已形成一門作為相對獨(dú)立學(xué)科的引文分析學(xué)?對此,直到2007年劉則淵在《科學(xué)知識(shí)圖譜:方法與應(yīng)用》一書(人民出版社,2008年)的導(dǎo)言(2007年)中,才明確指出:“從普賴斯、加菲爾德到斯莫爾,已確立起日臻完備的引文分析理論與方法,構(gòu)成科學(xué)計(jì)量學(xué)的基礎(chǔ)與主流,在一定意義上也可以說在科學(xué)計(jì)量學(xué)中已形成一門成熟的分支學(xué)科――引文分析學(xué)”。但“引文分析”是否成為“學(xué)”確實(shí)還存在一些爭論,對其是否成為學(xué),筆者曾經(jīng)單獨(dú)做過一些考察,也有一些特征顯示這個(gè)研究領(lǐng)域逐漸走向成熟,不過這個(gè)問題不是本文要論證的主要內(nèi)容,本文試圖運(yùn)用知識(shí)計(jì)量與知識(shí)圖譜方法對引文分析領(lǐng)域的形成歷程進(jìn)行探討。
2 數(shù)據(jù)來源與方法
研究所用的數(shù)據(jù)均來源于美國科學(xué)情報(bào)研究所創(chuàng)建的Web of Science數(shù)據(jù)庫。下文3.1節(jié)中以“Citationanalysis”為檢索詞在SCI和SSCI中聯(lián)合檢索了1900-2008年間的文獻(xiàn)記錄,其中SSCI收錄的時(shí)間是從1974-2008年。在數(shù)據(jù)下載的過程中,選擇“Article”,共檢索到1906篇文獻(xiàn),其中共包含引文65426條,繪制引文分析領(lǐng)域的整體脈絡(luò)如圖1所示:
下文3.2以及3.3節(jié)對加菲爾德、普賴斯以及斯莫爾三人發(fā)表的論文和被引用的論文進(jìn)行引文分析。分析的數(shù)據(jù)來自于Web of Science平臺(tái),包括SCI-Ex-panded、SSCI、A&HCI三大引文數(shù)據(jù)庫,檢索時(shí)間選擇1900-2008年。研究采取兩種數(shù)據(jù):一種是分別對三人發(fā)表的論文進(jìn)行分析,檢索策略是在Web of Science中分別輸入作者名,即加菲爾德E Garfield,普賴斯Price DJD、Price DD、Price DJ以及Price D等,斯莫爾Small H與Small HG等,經(jīng)過辨認(rèn)和甄選,分別得到1530、47、68條被WoS數(shù)據(jù)庫收錄的論文;另一種數(shù)據(jù)是利用Web of Science數(shù)據(jù)庫中的被引文獻(xiàn)檢索功能,檢索得到1359篇引用加菲爾德的論文、1455引用普賴斯的論文、424篇引用斯莫爾的論文。利用CiteSpace進(jìn)行文獻(xiàn)共引分析,每個(gè)階段選前50篇文章。
3.4節(jié)中對陳超美發(fā)表的論文進(jìn)行共作者分析。選擇數(shù)據(jù)庫同上,經(jīng)過辨認(rèn)和甄選,得到26條被WoS數(shù)據(jù)庫收錄的論文。利用CiteSpaee進(jìn)行共作者分析,每個(gè)階段選前20篇文章。
3 引文分析領(lǐng)域形成和發(fā)展的可視化圖譜
3.1
引文分析領(lǐng)域的整體發(fā)展脈絡(luò)
由圖1可以看到,引文分析領(lǐng)域大致可以分為幾個(gè)時(shí)期:初始形成期、繁榮發(fā)展期、深化拓張期。20世紀(jì)50年代至60年代,為引文分析領(lǐng)域的初始形成期,可以看出關(guān)鍵點(diǎn)有加菲爾德和普賴斯二人,他們開創(chuàng)了引文分析的先河,是引文分析領(lǐng)域的奠基人。20世紀(jì)70年代至80年代,是引文分析領(lǐng)域的發(fā)展繁榮期,其重要人物有斯莫爾和麥克羅伯特,他們發(fā)展了引文分析,其中斯莫爾提出著名的共引理論和方法,而麥克羅伯特則思考了引文分析存在的問題。從20世紀(jì)90年代起,引文分析領(lǐng)域進(jìn)入了深化拓張期。在共引理論的基礎(chǔ)上,引文分析的可視化有了較大的發(fā)展,重要的人物有懷特、麥肯恩和陳超美等。90年代中后期,隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)引文分析也成為引文分析的熱點(diǎn),其代表人物有英格沃森、塞沃爾與魯索等人。由于閾值的設(shè)置,這張圖譜只能大致反應(yīng)引文分析領(lǐng)域的最重要的人物和著作。
3.2 引文分析領(lǐng)域的初始形成期
3.2.1 科學(xué)引文索引的建立 尤金?加菲爾德是美國著名的情報(bào)學(xué)家和科學(xué)計(jì)量學(xué)家,也是ISI的創(chuàng)始人。他最重要的貢獻(xiàn)是創(chuàng)建科學(xué)引文索引和提出引文索引法。
?加菲爾德發(fā)表的1530篇SCI論文的文獻(xiàn)共引分析,如圖2所示:
加菲爾德論文的文獻(xiàn)共引網(wǎng)絡(luò)可以分為較為明顯的6個(gè)聚類。這幾個(gè)聚類是加菲爾德不同時(shí)期科學(xué)發(fā)現(xiàn)的重要基礎(chǔ),當(dāng)然也反映了加菲爾德不同時(shí)期的研究主題?梢钥吹紺。聚類包含最多的節(jié)點(diǎn),也是加菲爾德的核心知識(shí)群,就是一系列的綜合的有關(guān)引文索引和引文理論、應(yīng)用的文章。每個(gè)聚類之間都有一些關(guān)鍵節(jié)點(diǎn)連接,說明每個(gè)知識(shí)群之間都有或多或少的聯(lián)系。這些研究都為加菲爾德的引文研究提供了豐富的素材,加菲爾德從這些研究中汲取了豐富的營養(yǎng),進(jìn)一步豐富和發(fā)展了其引文的基礎(chǔ)理論。
可以看出中心度最大的是加菲爾德博士1955年發(fā)表的具有劃時(shí)代意義的論文――《引文索引應(yīng)用于科學(xué)》,這篇論文有一個(gè)非常重要的副標(biāo)題:“文獻(xiàn)學(xué)中貫穿觀念聯(lián)系的一個(gè)新維度”。他闡明文獻(xiàn)之間的引文關(guān)系本質(zhì)上是觀念的聯(lián)系,也就是知識(shí)的傳遞流動(dòng)過程,由此成為他以引文索引作為文獻(xiàn)情報(bào)檢索手段的新思路,成為他創(chuàng)建科學(xué)引文索引的理論基礎(chǔ)。同時(shí),也為世界各地的研究人員深入進(jìn)行研究和評估他們的工作,為廣泛使用的湯姆森科技網(wǎng)絡(luò)平臺(tái)ISI Web of Knowledgess奠定了基礎(chǔ)。1964年,加菲爾德博士推出了第一個(gè)Science Citation Index,正如加菲爾德博士所設(shè)想的,研究人員們狂熱地投身到引文及論文分析的研究中。加菲爾德后來的文章也都是圍繞科學(xué)引文索引的建立和發(fā)展,引文索引法的應(yīng)用以及有引文分析的問題展開。因此,加菲爾德做為引文索引法的創(chuàng)始人,他的大量的研究論文為引文分析奠定了知識(shí)基礎(chǔ)。同時(shí),可以看到他還較多地吸收了一些其他科學(xué)學(xué)領(lǐng)域的先驅(qū)的思想,如普賴斯、默頓等。
?引用加菲爾德發(fā)表1359篇論文的文獻(xiàn)共引分析。如圖3所示:
加菲爾德為引文分析作了許多前瞻性的工作,其一系列具有開創(chuàng)性的論文和著作(如1972、1979年等)構(gòu)成了引文分析的知識(shí)基礎(chǔ)。圍繞著這個(gè)知識(shí)基礎(chǔ),在《科學(xué)引文索引》連續(xù)出版以后,特別是推出SCI光 盤版和網(wǎng)絡(luò)版之后,引文分析法在圖書情報(bào)學(xué)、科學(xué)學(xué)、科學(xué)政策與管理等領(lǐng)域得到了廣泛的應(yīng)用。
3.2.2 科學(xué)引文網(wǎng)絡(luò) 學(xué)術(shù)大師普賴斯不僅是物理學(xué)家、科學(xué)史家,而且是舉世公認(rèn)的科學(xué)學(xué)家和科學(xué)計(jì)量學(xué)家,有“科學(xué)計(jì)量學(xué)之父”的美譽(yù),他重塑了引文索引法的主導(dǎo)功能。
?普賴斯發(fā)表的47篇SCI論文的文獻(xiàn)共引分析,如圖4所示:
由圖4看到,中心度最大的幾個(gè)節(jié)點(diǎn)分別是普賴斯1963年的《小科學(xué),大科學(xué)》,1965年的《科學(xué)論文的網(wǎng)絡(luò)》以及庫恩1962年的《科學(xué)革命的結(jié)構(gòu)》,還有Fairthome RA的《文獻(xiàn)計(jì)量學(xué)描述和預(yù)測的雙曲線分布》?梢钥吹狡召囁沟难芯颗d趣十分廣泛,包括科學(xué)社會(huì)學(xué)、科學(xué)哲學(xué)、科學(xué)技術(shù)史、科學(xué)交流、科學(xué)革命、技術(shù)創(chuàng)新、科技倫理、科學(xué)發(fā)展規(guī)律、科學(xué)生產(chǎn)力、知識(shí)組織和信息檢索等,其中比較突出的一塊就是對引文分析的規(guī)律的研究和對科學(xué)引文索引理論和應(yīng)用的研究。普賴斯從這些研究的先賢那里吸收到了豐富的養(yǎng)分,形成了自己獨(dú)特的科學(xué)學(xué)研究的理論和范式。
?引用普賴斯的1455篇論文的文獻(xiàn)共引分析,如圖5所示:
圖中最重要的節(jié)點(diǎn),也是中心度最大的幾篇論文和專著分別是普賴斯1963年的《小科學(xué),大科學(xué)》,1965年的《科學(xué)論文的網(wǎng)絡(luò)》,1961年的《巴比倫以來的科學(xué)》以及斯莫爾1974年的《科學(xué)文獻(xiàn)的結(jié)構(gòu)I:學(xué)科的辨認(rèn)和繪圖》。
普賴斯在1965年以加菲爾德的SCI為數(shù)據(jù)來源,在《科學(xué)》雜志上發(fā)表了一篇科學(xué)計(jì)量學(xué)的杰作《科學(xué)論文的網(wǎng)絡(luò)》,為實(shí)現(xiàn)他的宏大構(gòu)想做了開創(chuàng)性的奠基工作。他認(rèn)為引文索引法意外引起的“副產(chǎn)品”,已經(jīng)變“副”為“主”,既造就了科學(xué)計(jì)量學(xué)的主流方向,又重塑了引文索引法的主導(dǎo)功能。
通過以上文獻(xiàn)共引分析,可以看到加菲爾德和普賴斯都對引文分析領(lǐng)域的理論做出了開創(chuàng)性的工作。
3.3 引文分析領(lǐng)域的發(fā)展繁榮期
3.3.1共引理論的提出和發(fā)展
?斯莫爾發(fā)表的68篇SCI論文的文獻(xiàn)共引分析,如圖6所示:
由圖6可以看到C。聚類包含最多的節(jié)點(diǎn),也是斯莫爾的核心知識(shí)群,就是一系列的綜合的共引理論、模型和方法和引文理論等內(nèi)容。這些都說明斯莫爾的主要研究是共引理論,其他的自動(dòng)檢索、共引方法、科學(xué)史、科學(xué)社會(huì)學(xué)也為斯莫爾的理論提供了養(yǎng)分,同時(shí)共引理論和方法也在一些方面得到應(yīng)用。
圖6中最重要的節(jié)點(diǎn),也是中心度最大的幾篇論文和專著分別是斯莫爾1973年的《科學(xué)文獻(xiàn)的共引:兩個(gè)文獻(xiàn)關(guān)系的新測度被引圖》,斯莫爾1974年的《科學(xué)文獻(xiàn)的結(jié)構(gòu)I:學(xué)科的辨認(rèn)和繪圖》以及斯莫爾1985年的《利用共引的科學(xué)引文索引的聚類:科學(xué)地圖》等。
?引用斯莫爾的424篇論文的文獻(xiàn)共引分析,如圖7所示:
可以看到C。聚類包含最多的節(jié)點(diǎn),也是共引理論的核心知識(shí)群。其中包含了共引理論、方法和模型應(yīng)用。其他4個(gè)聚類也都是共引理論衍生出來的相關(guān)研究。
斯莫爾1973年創(chuàng)造性地提出了論文“共引”(也稱同被引,共被引)的概念和共引分析的方法,并定義了共引強(qiáng)度以測量論文之間的共引程度,認(rèn)為共引是測量兩篇文獻(xiàn)相關(guān)度的一個(gè)新工具。1974年斯莫爾提出了著名的圓環(huán)模型。他還和著名科學(xué)計(jì)量學(xué)家格里菲斯以及其他學(xué)者又先后提出雙引、多引、作者共引、期刊共引等多種共被引分析方法;闡述了建立在耦合強(qiáng)度和共引強(qiáng)度基礎(chǔ)上的文獻(xiàn)聚類分析及其在科學(xué)計(jì)量學(xué)中的作用。
斯莫爾可以說是共引分析的開創(chuàng)者,對引文分析的進(jìn)一步發(fā)展起到了中流砥柱的作用,共引分析也是引文分析獨(dú)特的分析方法,迄今為止,共引分析仍舊是引文分析的主流方法,還沒有太大的突破。
3.3.2 引文分析存在的問題盡管引文索引和引文分析得到了大量使用,也為文獻(xiàn)計(jì)量學(xué)和科學(xué)計(jì)量學(xué)開辟了新的研究領(lǐng)域,但是,任何一個(gè)科學(xué)理論的產(chǎn)生和發(fā)展都不是一帆風(fēng)順的,都有一個(gè)不斷成熟和完善的過程,引文分析領(lǐng)域也不例外。
1989年,麥克羅伯茨(MacRoberts MH)系統(tǒng)討論了引文分析存在的問題,并對其進(jìn)行了評論。他指出,數(shù)據(jù)問題將會(huì)一直伴隨著引文分析的過程,因此,應(yīng)該認(rèn)真檢查數(shù)據(jù),只有這樣,用引文分析獲得的結(jié)果才被認(rèn)為是符合假設(shè)的。然而,沒有人盡力去研究這些問題,這些問題應(yīng)該引起引文分析領(lǐng)域的研究者的注意。他提醒學(xué)者們思考本領(lǐng)域的基本問題,他也為引文分析的進(jìn)一步順利發(fā)展做出了理論的貢獻(xiàn)。
3.4引文分析領(lǐng)域的深化拓張期
3.4.1 引文分析的可視化美國德雷塞爾大學(xué)信息科學(xué)技術(shù)學(xué)院著名科學(xué)計(jì)量學(xué)家懷特和麥肯恩,荷蘭雷頓大學(xué)科學(xué)技術(shù)學(xué)中心的諾洋思、瑞安和穆德,都不約而同地以共引分析為基礎(chǔ),與多種多元統(tǒng)計(jì)分析結(jié)合起來,采用相關(guān)的統(tǒng)計(jì)繪圖軟件,開展科學(xué)文獻(xiàn)的計(jì)量研究,建立了基于多維尺度分析的知識(shí)圖譜方法。陳超美博士在1999年出版的《信息可視化與虛擬環(huán)境》(2004年增訂第二版改為《信息可視化:跨越地平線》和在2003年出版的《科學(xué)前沿圖譜:知識(shí)可視化探索》這兩部奠基性著作,以其在信息可視化與科學(xué)知識(shí)圖譜的突出成就而在國際科學(xué)計(jì)量學(xué)界嶄露頭角。圖8是陳超美共作者知識(shí)圖譜,顯示了他的研究興趣和研究領(lǐng)域。
從圖中可以看到,他的主要合作者有Lin x(林夏),McCmnK,BfirnerK以及Boyack KW等。他們也都為知識(shí)可視化領(lǐng)域做出了貢獻(xiàn)。陳超美憑借在理論數(shù)學(xué)、計(jì)算機(jī)科學(xué)與計(jì)算軟件方面的深厚理論功底與優(yōu)勢,開發(fā)了引文網(wǎng)絡(luò)分析CiteSpace系列應(yīng)用軟件,形成了適于多元、分時(shí)、動(dòng)態(tài)的復(fù)雜網(wǎng)絡(luò)分析的第二代信息可視化技術(shù);他創(chuàng)造性地把信息可視化技術(shù)和科學(xué)計(jì)量學(xué)結(jié)合起來,開創(chuàng)了以知識(shí)領(lǐng)域?yàn)榉治鰡卧目梢暬C合性學(xué)術(shù)與應(yīng)用領(lǐng)域,把對科學(xué)前沿的知識(shí)計(jì)量和知識(shí)管理研究推進(jìn)到以知識(shí)圖譜與知識(shí)可視化為輔助決策手段的新階段。
3.4.2網(wǎng)絡(luò)引文分析
?Peter Ingween的貢獻(xiàn)。目前通用的名稱Webometrics是艾曼德(Almind TC)和英格沃森(Ingw―ersen P)在1997年首先提出的。1998年,英格沃森受期刊影響因子的啟發(fā),率先提出了網(wǎng)絡(luò)影響因子的概念及其算法,并將其用于測度域或站點(diǎn)的影響力。
?Mike Thelwall的貢獻(xiàn)。南京大學(xué)姚貫虹對從1996年以來至2004年問國外關(guān)于網(wǎng)絡(luò)計(jì)量學(xué)的75篇研究文獻(xiàn)進(jìn)行了歸類和統(tǒng)計(jì)分析,得出了核心作者,其中英國wolvethamPton大學(xué)的塞沃爾(Thelwall M)以17篇論文位居榜首。從圖1也可以看出他是一個(gè)非常活躍的作者,他的4篇論文都是非常關(guān)鍵的點(diǎn)。
?Ronald Rousseau的貢獻(xiàn)。1997年,魯索在Cy-bermetrics發(fā)表了《網(wǎng)絡(luò)引文》(Sitation),迅速成為被科學(xué)計(jì)量學(xué)界引證頻次最高的網(wǎng)絡(luò)計(jì)量學(xué)文獻(xiàn),也引發(fā)了對網(wǎng)上信息的相互引證、傳遞、分布、組織等一系列的計(jì)量研究,使得網(wǎng)絡(luò)計(jì)量學(xué)研究成為僅次于引文分析可視化研究的引文分析領(lǐng)域的第二大重要方向。
4 結(jié) 論
本文利用CiteSpace軟件繪制了引文分析領(lǐng)域的發(fā)展趨勢圖并對圖譜的內(nèi)容進(jìn)行詳細(xì)解讀,得出以下結(jié)論:①從可視化圖上可以明晰地看出引文分析領(lǐng)域的發(fā)展歷程主要分為幾個(gè)時(shí)期:初始形成期、繁榮發(fā)展期、深化拓張期;②重要作者的作品也可以很清晰地顯示在圖譜上,利用圖譜信息,分析了各個(gè)時(shí)期的一些重要人物的研究成果,總結(jié)了他們在引文分析領(lǐng)域的貢獻(xiàn);③對于不了解引文分析領(lǐng)域的讀者,可以使他們盡快了解到引文分析的現(xiàn)狀,而不需閱讀大量的文獻(xiàn);④通過可視化圖,可以發(fā)現(xiàn)一些平時(shí)不注意的作者,他們并非是最重要的作者,但是卻起到對本領(lǐng)域修正的作用。
相關(guān)熱詞搜索:分析 引文 可視化 引文分析學(xué)形成與發(fā)展的可視化分析 可視化分析的發(fā)展 具發(fā)展?jié)摿Φ目梢暬治?/a>
熱點(diǎn)文章閱讀