基于共引的專利情報(bào)與學(xué)術(shù)文獻(xiàn)對比分析:國內(nèi)外文獻(xiàn)數(shù)據(jù)庫對比分析
發(fā)布時(shí)間:2020-03-07 來源: 歷史回眸 點(diǎn)擊:
[摘要]專利情報(bào)和學(xué)術(shù)文獻(xiàn)間既存在著共通性,同時(shí)也具有差異性。為了考察兩者差別,采用情報(bào)方法中的共引分析法分別構(gòu)建專利情報(bào)和學(xué)術(shù)文獻(xiàn)的共引矩陣,進(jìn)一步聚類成產(chǎn)業(yè)公司群和學(xué)術(shù)團(tuán)體群;然后將其可視化,以直觀的方式將兩者進(jìn)行對比。通過比較,觀察到產(chǎn)業(yè)集群更為集中,而學(xué)術(shù)集群略為分散。同時(shí)也發(fā)現(xiàn)中國公司與國外公司在研究方面存在著較大差距。
[關(guān)鍵詞]共引 可視化專利情報(bào)學(xué)術(shù)文獻(xiàn)
[分類號]G353
在情報(bào)研究中,通過分析專利引用或論文引用數(shù)據(jù),可以發(fā)現(xiàn)相關(guān)技術(shù)分布,然后,采用統(tǒng)計(jì)學(xué)的方法對技術(shù)進(jìn)行比較、歸納,可進(jìn)一步知曉他們之間的相似性或差異性,這種方法已逐漸成為目前常用研究方法之一。在日益受寵的專利地圖分析中,包括多個(gè)引證指標(biāo)的引文分析也已成為必不可少的組成部分。而在引文分析中,最具影響力的是共引分析方法。它通過兩篇文獻(xiàn)同時(shí)被后來的一篇或多篇文獻(xiàn)所引用的數(shù)量情況,利用聚類分析、多維尺度等多元統(tǒng)計(jì)分析理論,借助計(jì)算機(jī),把眾多分析對象之間錯(cuò)綜復(fù)雜的共引網(wǎng)絡(luò)關(guān)系簡化為若干類群之間的關(guān)系表示出來,在此基礎(chǔ)上分析研究不同學(xué)科及文獻(xiàn)的結(jié)構(gòu)與特點(diǎn)。因此,其評價(jià)更客觀、分類更科學(xué)、方式更直觀。
1 研究背景
共引分析最早出現(xiàn)在學(xué)術(shù)文獻(xiàn)的分析中。1973年,美國情報(bào)學(xué)家H.G.Small提出共引理論,之后,這方面的研究工作在國外便廣泛開展起來,其主要分為兩個(gè)系列:一是H.G.Small進(jìn)行的以文章為分析單位所做的共引分析研究;另一是以H.D.White為代表的以作者為分析單位進(jìn)行的研究。此外,還有部分學(xué)者以期刊為分析單位進(jìn)行研究。國內(nèi)從上世紀(jì)90年代起吸收了國外的共引理論,并對國內(nèi)文獻(xiàn)情況進(jìn)行了相關(guān)分析,如北京大學(xué)信息管理系針對中文農(nóng)業(yè)期刊進(jìn)行共引分析;中國科學(xué)院文獻(xiàn)情報(bào)中心曾對中國科技期刊引文網(wǎng)絡(luò)的國內(nèi)外影響力進(jìn)行分析。
專利共引研究同樣基于H.G.Small的共引理論,國外在20世紀(jì)80 90年代就開始呈現(xiàn)出激烈研究態(tài)勢同,而國內(nèi)在最近才開始這一熱潮。武漢大學(xué)于2008年對專利計(jì)量的多個(gè)指標(biāo)進(jìn)行研究,其中采用共引法對有機(jī)電激光技術(shù)專利進(jìn)行專利權(quán)人的聚類和可視化分析。如今,各種共引分析指標(biāo)層出不窮,共引分析方法也正不斷應(yīng)用于新的領(lǐng)域中。
在這些共引分析中,多數(shù)只針對于專利情報(bào)或?qū)W術(shù)文獻(xiàn)中的一項(xiàng)進(jìn)行研究,同時(shí)涉及兩者的研究較少。國外著名引文分析機(jī)構(gòu)CHI研究公司在1998年對美國和歐洲專利中的專利與論文引用關(guān)系進(jìn)行了研究,但其只是討論了被專利引用的專利與非專利文獻(xiàn),并未涉及公司或研究機(jī)構(gòu)的對比,也未進(jìn)行共引結(jié)果的比較。
我們針對這一情況,分別對專利情報(bào)的專利權(quán)人和學(xué)術(shù)文獻(xiàn)的發(fā)表研究機(jī)構(gòu)進(jìn)行共引分析,并以固體氧化物燃料電池(sOFC)為例,對兩者結(jié)果進(jìn)行比較,找出產(chǎn)業(yè)界公司(專利權(quán)人)與學(xué)術(shù)界研究機(jī)構(gòu)在研究方向上的共通性與差異性。
2 研究方法
由于需要考察專利情報(bào)與學(xué)術(shù)文獻(xiàn)兩者的關(guān)系,所以首先要分別構(gòu)建兩者的共引關(guān)系矩陣,并將其可視化,在此基礎(chǔ)上進(jìn)行最后的對比分析。
2.1 專利情報(bào)的共引分析
2.1.1 數(shù)據(jù)采集數(shù)據(jù)源是分析的基礎(chǔ),為了全面、嚴(yán)格地進(jìn)行分析,我們需要選擇的是具有世界范圍的專利信息,同時(shí)需要有較強(qiáng)大引文信息支持的數(shù)據(jù)庫。所以Derwent Innovations Index數(shù)據(jù)庫將是最好的方案。該數(shù)據(jù)庫具有100多個(gè)國家的專利信息,并含有10余個(gè)國家的專利引文信息,因此最適合進(jìn)行數(shù)據(jù)采集。在制訂了相應(yīng)的檢索策略后,在此數(shù)據(jù)庫中進(jìn)行檢索,下載數(shù)據(jù)。
2.1.2 數(shù)據(jù)整理在下載的海量數(shù)據(jù)中,首先要區(qū)分每個(gè)公司的專利信息,也就是根據(jù)專利權(quán)人進(jìn)行統(tǒng)計(jì),F(xiàn)在,不少專利分析軟件,如TDA(Thomson Data An山一zer)等已可進(jìn)行此項(xiàng)工作。根據(jù)Derwent公司代碼,可統(tǒng)計(jì)出每個(gè)公司的被引專利量、兩個(gè)公司的共引專利量,并構(gòu)建共引矩陣。
2.1.3 聚類將得到的共引矩陣在統(tǒng)計(jì)分析軟件SPSS中進(jìn)行聚類分析(Cluster),并通過多維尺度分析(MDS)將結(jié)果可視化。
2.2 學(xué)術(shù)文獻(xiàn)的共引分析
2.2.1 數(shù)據(jù)采集眾所周知,在學(xué)術(shù)文獻(xiàn)的引文系統(tǒng)中,最權(quán)威的就是SCI系統(tǒng)。該系統(tǒng)目前不僅具有期刊類的學(xué)術(shù)文獻(xiàn),而且集成了會議中的學(xué)術(shù)文獻(xiàn),其收錄范圍廣、質(zhì)量高已得到公認(rèn)。因此,在確定檢索策略后,在此數(shù)據(jù)庫中檢索,并下載數(shù)據(jù)。
2.2.2 數(shù)據(jù)整理學(xué)術(shù)文獻(xiàn)的引文信息與專利的引文信息不同。學(xué)術(shù)文獻(xiàn)的引文記錄中僅有作者信息,不具有研究機(jī)構(gòu)的信息。因此,首先需要將作者與研究機(jī)構(gòu)相關(guān)聯(lián),即構(gòu)建作者與研究機(jī)構(gòu)的矩陣,然后,根據(jù)此矩陣將被引信息中的作者與研究機(jī)構(gòu)一一對應(yīng);最后將每家機(jī)構(gòu)的所有作者被引信息集合、去重,得到最終的研究機(jī)構(gòu)被引情況。之后,構(gòu)建共引矩陣。
2.2.3 聚類通過得到的共引矩陣,進(jìn)行聚類和多維尺度分析。
2.3 比較分析
將專利聚類和學(xué)術(shù)文獻(xiàn)聚類中的公司(或研究機(jī)構(gòu))進(jìn)行比較,發(fā)現(xiàn)兩者在研究方向上的差異,同時(shí),觀察中國的公司(或研究機(jī)構(gòu))與國外公司(或研究機(jī)構(gòu))的差距。
3 實(shí)例研究與討論
我們以SOFC為例,按照上述方法,分別進(jìn)行專利情報(bào)聚類與學(xué)術(shù)文獻(xiàn)聚類。
3.1 專利情報(bào)聚類
截止到2008年6月,我們在Derwent InnovationsIndex中共檢索到7 057項(xiàng)SOFC相關(guān)專利族,通過統(tǒng)計(jì)找出被引次數(shù)在100次以上的37家高被引公司(專利權(quán)人)。
然后構(gòu)建這37家公司的37×37共被引矩陣。根據(jù)矩陣,在sPss中進(jìn)行聚類的結(jié)果和多維尺度分析。
虛線(聚類的平均值)可將高被引專利權(quán)人劃分成三個(gè)不同的專利權(quán)人集群:西屋電氣(A群);三菱重工(B群);其他公司(c群)。
從群的角度可以看出,唯一的大群(c群)內(nèi)的各個(gè)公司在SOFC的研發(fā)方面有著很大的關(guān)聯(lián)性,他們擁有的優(yōu)質(zhì)專利基本研究方向相似,很有可能既是競爭者,又是合作者。
同時(shí),從SOFC專業(yè)角度看,由于SOFC技術(shù)已趨向于成熟,使得各個(gè)公司在研發(fā)、產(chǎn)業(yè)化的方向趨于一致,這也是造成多家公司形成一個(gè)集群的原因之一。而西屋電氣與三菱重工分別形成兩個(gè)孤點(diǎn)群也表明了其在SOFC的研究中有著自己獨(dú)特的方向和特點(diǎn),真實(shí)地反映出這兩家公司在SOFC領(lǐng)域的領(lǐng)先地位。
多維尺度分析的結(jié)果與聚類結(jié)果非常吻合,從檢驗(yàn)值看,區(qū)分度也較好,清晰地將三個(gè)群在坐標(biāo)軸內(nèi)可視化,從他們間的距離可以更加直觀地看出他們之間關(guān)系的親近程度。就如西屋電氣和三菱重工兩個(gè)點(diǎn)距離c群有著明顯距離,形成兩個(gè)孤點(diǎn),因此形成兩個(gè)單獨(dú)的群。
3.2 學(xué)術(shù)文獻(xiàn)聚類 截止到2008年12月,在SCI中,共檢索到SOFC相關(guān)文獻(xiàn)5 330篇。根據(jù)前述方法,篩選出論文發(fā)表量在40篇以上的研究團(tuán)體,對其進(jìn)行共引矩陣的構(gòu)建。
根據(jù)矩陣,在SPSS中進(jìn)行聚類的結(jié)果和多維尺度分析結(jié)果。
我們按虛線(聚類的平均值)劃分不同的研究機(jī)構(gòu)類群,共分為4個(gè)群:倫敦大學(xué)帝國理工學(xué)院(A群);美國能源部西北太平洋國家實(shí)驗(yàn)室(B群);德國核研究中心有限公司、丹麥瑞索國家實(shí)驗(yàn)室、日本國立材料與化學(xué)研究所和日本東北大學(xué)(c群)以及其他公司(D群)。
多維尺度分析的結(jié)果也可分為4個(gè)群,而且可視化的圖形可以更清晰的發(fā)現(xiàn)群內(nèi)關(guān)系。如D群中,各個(gè)點(diǎn)的距離較近,表示群內(nèi)研究機(jī)構(gòu)的研究方向更為接近;而c群內(nèi)各個(gè)點(diǎn)相對分散,他們之間的關(guān)系比D群內(nèi)各點(diǎn)的關(guān)系略為疏遠(yuǎn)。
3.3 產(chǎn)業(yè)與學(xué)術(shù)聚類的比較分析
3.3.1 產(chǎn)業(yè)的集中化學(xué)術(shù)的分散化通過兩個(gè)聚類得到的群可以發(fā)現(xiàn),由專利情報(bào)得出的SOFC產(chǎn)業(yè)集群僅有3個(gè),其中2個(gè)群為獨(dú)立公司,而另一個(gè)群則包括了幾乎所有重要公司;由學(xué)術(shù)文獻(xiàn)得出的SOFC學(xué)術(shù)集群為4個(gè),且2個(gè)大群內(nèi)的點(diǎn)比產(chǎn)業(yè)大群(產(chǎn)業(yè)c群)內(nèi)的點(diǎn)更分散。因此,對于一項(xiàng)技術(shù)而言,在學(xué)術(shù)階段,可能呈現(xiàn)出更多的分散趨勢;到了產(chǎn)業(yè)階段,則會優(yōu)選其中的最佳方案,朝著更實(shí)用的方向發(fā)展,由此呈現(xiàn)出技術(shù)集中的特點(diǎn)。
3.3.2 產(chǎn)業(yè)公司與學(xué)術(shù)機(jī)構(gòu)的兩極化在兩個(gè)集群中,我們未發(fā)現(xiàn)一個(gè)在學(xué)術(shù)與產(chǎn)業(yè)中都有著較大影響力的團(tuán)體機(jī)構(gòu)。學(xué)術(shù)影響力較強(qiáng)的機(jī)構(gòu)基本均為研究機(jī)構(gòu),在產(chǎn)業(yè)影響力較強(qiáng)的機(jī)構(gòu)中多為生產(chǎn)型公司,僅有兩家是學(xué)術(shù)研究機(jī)構(gòu)。這也表明在如今的技術(shù)發(fā)展過程中,學(xué)術(shù)研究機(jī)構(gòu)與產(chǎn)業(yè)公司還存在著明顯的職責(zé)和分工差異。學(xué)術(shù)機(jī)構(gòu)在技術(shù)初期進(jìn)行大量研究,但很難將其直接產(chǎn)業(yè)化,只能選擇轉(zhuǎn)讓或與其他公司合作實(shí)現(xiàn)產(chǎn)業(yè)化;而生產(chǎn)型公司注重產(chǎn)品的知識產(chǎn)權(quán)保護(hù),視申請專利為企業(yè)戰(zhàn)略之一,因此擁有大量產(chǎn)業(yè)化技術(shù)專利。但其在初期的理論研發(fā)力量較弱,需要借助大專院校等研究機(jī)構(gòu)。
3.3.3 中國公司的差距在產(chǎn)業(yè)集群中,均為國外公司,表明中國公司在研究力上與國外公司有著較明顯的差距;而在學(xué)術(shù)集群中有4家中國的研究機(jī)構(gòu),但這4個(gè)研究機(jī)構(gòu)均在一個(gè)集群中,這也表示其研究方向較為一致,不夠多樣化;同時(shí),也還沒有形成自己的特有技術(shù)和研究方向。因此,無論中國的公司或研究機(jī)構(gòu)在SOFC領(lǐng)域內(nèi)都需要進(jìn)一步借鑒國外公司的先進(jìn)技術(shù)與經(jīng)驗(yàn),尋求突破點(diǎn),謀求發(fā)展。
4 結(jié)論和改進(jìn)
通過共引分析及其可視化結(jié)果,我們能明確地觀察到產(chǎn)業(yè)集群(專利情報(bào))和學(xué)術(shù)集群(學(xué)術(shù)文獻(xiàn))的狀況,由此發(fā)現(xiàn)兩者在研究方向、政策上的不同;并發(fā)現(xiàn)中國的產(chǎn)業(yè)團(tuán)體和學(xué)術(shù)團(tuán)體與國外先進(jìn)者的差距,以供中國機(jī)構(gòu)借鑒。
在研究過程中,我們也發(fā)現(xiàn)了一些問題,比如:學(xué)術(shù)論文的引文信息中不含機(jī)構(gòu)信息,需要進(jìn)行作者和機(jī)構(gòu)的核對,但由于作者的同名或跳槽現(xiàn)象,會造成研究機(jī)構(gòu)被引統(tǒng)計(jì)的不準(zhǔn)確。另外,如在找出集群后,對每個(gè)集群的技術(shù)特征進(jìn)行進(jìn)一步具體分析,可能演變出包含技術(shù)特征的機(jī)構(gòu)集群,將會對中國的公司和研究機(jī)構(gòu)有著更明確的技術(shù)指引。在今后的研究中,將進(jìn)一步解決這些問題,以使共引分析的結(jié)果更完善,對中國公司的借鑒更具體,在競爭情報(bào)工作中起到更大作用。
相關(guān)熱詞搜索:情報(bào) 文獻(xiàn) 學(xué)術(shù) 基于共引的專利情報(bào)與學(xué)術(shù)文獻(xiàn)對比分析 國內(nèi)外專利研究的比較分析 情報(bào)科學(xué)
熱點(diǎn)文章閱讀