文獻內容特征_系列報告的文獻研究:樞架內容研究和詞頻分新
發(fā)布時間:2020-03-07 來源: 人生感悟 點擊:
[摘要]主要采用框架內容研究扣詞頻分析方法對2000-2008年《中國軍力報告》系列報告進行文獻研究,其中詞頻分析主要采用WordSmith分析軟件對該系列報告的詞頻統(tǒng)計、用詞模式和關鍵詞變化趨勢進行研究,以此考察圖情方法在系列報告文獻研究中的應用情況,并對國際關系領域進行情報學意義的研究和探討,對專家、媒體的觀點與報告進行情報學價值的補充。
[關鍵詞]系列報告框架內容詞頻分析
[分類號]G350
在許多領域中,國家政府、機構團體等經常會發(fā)表一些年度系列報告,如中國政府發(fā)布的年度《中國國防白皮書》、美國國防部發(fā)表的年度《中國軍力報告》等,對于這類系列報告的研究通常是由相關領域的專家學者研讀具體報告內容,根據他們自身的學科知識和經驗觀點對報告內容進行定性判斷、各抒己見,這類研究根據各個專家學者的學識背景、政治立場、生活經歷等情況的不同,所闡述的觀點應該說具有一定的主觀性,但仍然是目前研究的主流方式。
與此同時,由于數字化文本的普及應用和相關工具的逐步成熟,對文本內容的進一步定量分析研究已經成為當前的熱門。筆者認為,對單篇文章的定量分析往往會因為參照物的缺失而難以立論,在這方面,系列報告可能恰恰是一個突破口,因為一般而言,系列報告無論在格式還是用語上都屬于比較嚴格意義上的同類文獻,因此對系列報告進行的各種定量分析實驗,可能會比其他文獻在系統(tǒng)性方面略勝一籌。
本文以《中國軍力報告》系列報告作為研究樣本,嘗試采用圖情領域的方法,對系列報告進行定量為主、定性為輔的文獻研究。
1 《中國軍力報告》簡介與研究目的
1.1《中國軍力報告》簡介
2000年,美國國會通過國防授權法案,其中要求美國國防部長必須每年就中華人民共和國當前與未來的軍事戰(zhàn)略遞交報告,內容包括人民解放軍目前及未來20年間軍事技術的發(fā)展走向,以及中國大戰(zhàn)略、安全戰(zhàn)略、軍事戰(zhàn)略、軍事組織與作戰(zhàn)概念的要旨和可能的發(fā)展。由此,每年一份的《中國軍力報告》誕生了,這份美國國防部遞交國會的年度例行報告,除2001年因總統(tǒng)換屆而取消外,每年都會發(fā)布,到2008年一共出版了8份。
1.2研究背景與目的
本文試圖采用圖情領域的分析方法,嘗試對系列報告進行分析研究,采用的分析樣本是美國國防部公開發(fā)表的《中國軍力報告》系列報告。本文的研究基礎來源于國家社會科學基金項目“美國精英對華研究的信息源分析”,該項目主要研究美國精英在對華研究過程中撰寫著作、報告等文字性資料時參考的信息源情況,課題研究對象選取了10本圖書、51份報告和50份期刊論文,研究這些文獻的引用情況。經過統(tǒng)計,樣本總計文獻類引文數量超過16 000條,而在這些被引文獻中,由美國國防部發(fā)表的《中國軍力報告》系列報告出現頻次居首位,由此可見,該系列報告在美國精英進行對華研究過程中,起到了非常重要的作用,是最主要的信息來源之一。
由此,本文將美國國防部2000年至2008年公開的8份《中國軍力報告》作為獨立樣本進行研究,從圖情方法角度考察該份系列報告的重點內容和變化趨勢以及美國精英對華研究主要信息源的一些特點。
2 系列報告的框架內容研究分析方法
由于系列報告與其他類型文獻相比具有周期性、連續(xù)性,各年度報告之間有時間和內容上的承接關系,因此在報告關注主題和具體內容上也存在著許多關聯之處,分析系列報告的框架結構,可以從總體上考察各年度報告的內容變化發(fā)展,了解報告出版和撰寫者的主要目的與內容重點,同時又不必逐字逐句研讀所有報告的具體內容。
因此,本文提出一種系列報告的框架內容研究分析方法,從總體上研究系列報告的框架體系內容,可以較為有效地在短時間內有重點的了解這些系列報告的核心內容,挖掘系列報告重點內容的變化趨勢。
研究系列報告的框架內容最直接有效的方法就是分析對比報告的主要章節(jié)標題內容。章節(jié)標題是對報告各個段落部分主要內容的高度濃縮和概括,從時間角度縱向對比研究每份報告章節(jié)標題的內容變化,可以從總體上發(fā)現各時期報告關注的主題變化和研究重點,同時考察其今后的發(fā)展趨勢與規(guī)律。
以《中國軍力報告》系列報告為例,對報告的一級章節(jié)標題的文字內容進行分析對比,由表1可以發(fā)現,報告寫作框架格式可以分為兩個階段,第一階段是從2000年到2004年,報告逐步形成規(guī)范格式;第二階段從2005年至今,報告按照固定格式撰寫。2005年與2006年的報告一級章節(jié)標題完全相同,2006年與2007年相比僅僅在第四、第五章順序上改換了一下,其他內容沒有改變。2007和2008年報告相比,后者僅在最后增加了一個特別專題章節(jié),其他一級章節(jié)標題也是完全一致。
從報告框架的章節(jié)內容也可以看出歷年報告主要關注內容。首先,中國軍事戰(zhàn)略和臺海安全問題一直是中國軍力報告關注的重點,每份報告都有章節(jié)論述。另外,中國軍事現代化的發(fā)展也引起的美國國防部的關注。從2002年開始,中國軍事現代化一直有獨立章節(jié)進行介紹。
由上述分析發(fā)現軍力報告已經按照固定格式撰寫,說明《中國軍力報告》在整體內容上已經定下了基本框架,以此還可以判斷今后《中國軍力報告》的主要撰寫框架內容。在中美關系、中國軍事戰(zhàn)略未發(fā)生重大改變的前提下,通過框架內容分析,可以推測2009年度《中國軍力報告》依舊會采用已經形成的框架結構。
值得一提的是,在2008年12月底完成的國家社會科學基金項目“美國精英對華研究的信息源分析”中的“《中國軍力報告》系列報告研究”專題報告,也通過采用框架內容分析方法得出過以下結論:“在報告的寫作班子和美國政府對華戰(zhàn)略沒有發(fā)生重大改變的情況下,可以大膽判斷2009年的《中國軍力報告》將仍然沿用之前已經形成的寫作框架體系,改變之處可能就是像2008年版那樣對于某一主題做一特別專題研究!倍2009年3月25日,美國國防部正式公布了2009年版《中國軍力報告》的主要框架內容正是如此,其主要框架僅將第一章節(jié)與第六章節(jié)位置互換,名稱雖改為“每年更新”,但二級標題內容仍然是關于“中國的主要發(fā)展”,并且也繼續(xù)保留特別章節(jié)內容,而其他章節(jié)標題沒有改變。由此,系列報告的框架內容分析結果也得到了印證。同樣的框架內容分析方法也可以應用于其他各個領域的系列報告。3詞頻分析方法考察系列報告:關鍵詞、用詞模式和變化趨勢一
詞頻分析方法的詞頻統(tǒng)計、關鍵詞分析經常被用于描述某學科領域的研究狀況,進而揭示該領域的研究熱點和發(fā)展趨勢。本文也采用WordSmith分析軟件的幾個詞頻分析功能來考察《中國軍力報告》系列報告的關鍵詞、用詞模式和變化趨勢。
3.1 總體詞頻統(tǒng)計分析
首先采用WordSmith詞頻分析軟件對《中國軍力 報告》系列的文獻全文內容進行詞頻統(tǒng)計,研究其用詞規(guī)律,考察中國軍力報告關注重點。通過詞頻分析軟件的Wordlist功能,統(tǒng)計出歷年報告共用到近7 500個詞匯以及每個詞匯的詞頻數量并按照詞頻高低排列。表2列出了2000-2008年全部報告內容去部分虛詞后排名前50位的統(tǒng)計結果:
由表2的詞頻列表可以考察《中國軍力報告》的主要關注內容!癈hina"和"Military”分別是排序最高的兩位,隨后排名前十中“PLA(第4位),Defense(第5位),Force(第7位),Forces(第9位)”這些表明軍事防御和軍事力量的詞匯占據了主要位置,理所當然的,美國國防部出臺《中國軍力報告》研究的主要對象就是中國軍事和軍力情況。另外,“Taiwan”一詞排名第三位,顯然臺灣問題是軍力報告關注的重點。
進一步研究詞頻發(fā)現,在軍事領域主題中詞頻中,依次有“Operations(第13位),Strategy(第16位),Technology(第20位),Modernization(第23位)”,這些詞匯相應表明軍力報告關注的軍事主題包括軍事行動、戰(zhàn)略、技術和現代化等領域內容。
在軍事武器裝備方面,通過表2的詞頻列表還可以發(fā)現表征各類武器裝備的詞匯,依次有“Aircraft(第18位),Missile(第22位),Weapons(第24位),Missiles(第25位),Nuclear(第37位),Space(第40位),Ground(第49位),Naval,(第53位)”,基本可以看出軍力報告主要關注的武器裝備有飛機、導彈、核武器、空間武器、地面武器和艦船武器。
從表2中還能發(fā)現,除了表示軍事領域的詞匯外,還有一些其他領域的詞匯也列入了前50位。如經濟方面有"Economic(第30位),政治方面有“Political(第45位)”,還有和人物有關的有"People(第34位),Training(第38位),Leaders(第44位)”,表明軍力報告還對經濟、政治、國家領導人以及相關人員培訓的情況進行了研究。
3.2詞頻分析考察系列報告用詞變化趨勢
至2008年年底,《中國軍力報告》已經出版了8份,除了可以從總詞頻中發(fā)現報告的關注重點,還可以通過對歷年報告的詞頻分析研究各個年度報告用詞的變化,考察各年度報告關注的內容的變化趨勢。
3.2.1各領域關注度變化趨勢 結合表2的詞頻列表,選取“Military,Strategy,Technology,Economic,Poli-ey"五個詞匯分別代表軍事、戰(zhàn)略、技術、經濟和政治5個領域,并且將一些單復數、詞性變化的詞匯也進行合并,如將“Economy,Economics,Economic”合并入“Eco-nomic”,“Strategic,Strategies,Strategy"合并入"Strategy”等,匯聚成一類詞頻,可得到了歷年《中國軍力報告》關于5個領域的絕對詞頻變化情況。每年度《中國軍力報告》的詞匯數量各有不同,因此,根據各年度報告詞匯量對詞頻數據進行修正后得到了相對詞頻變化趨勢。
從圖1中可以發(fā)現表示軍事的"Military”詞頻一直保持上升趨勢,而且詞頻一直高于其他幾個領域的詞匯,差距也逐年拉大,到2006年達到最高峰?梢哉f報告對于軍事領域的關注度逐年加大。而表示技術領域的詞匯“Technology”則逐年呈下降趨勢,直到2008年才稍有回升。分別表示戰(zhàn)略、經濟和政治的詞匯"Strategy,Economic,Policy”一直保持較為平穩(wěn)的詞頻,相對軍事領域來說,報告對于中國戰(zhàn)略、經濟和經濟問題關注度變化不大。
3.2.2軍事裝備關注度變化趨勢歷年《中國軍力報告》關注最多的還是中國軍事領域情況的變化,而各種武器裝備的情況也是歷年報告主要的構成部分,因此,對"Space,Nuclear,Ground,Aircraft,Navy”這幾個詞進行分析,考察報告對于各類武器裝備的關注度變化。其中將"Naval,Navy"的詞頻合并入"Navy”進行統(tǒng)計,然后再根據歷年報告詞匯量考察各詞匯的相對詞頻變化趨勢。
從圖2看出,2000-2003年之間,各個詞頻略有變化,但"Aircraft,Navy”詞頻量一直高于“Ground,Space,Nuclear”,其中表明核武器的“Nuclear”排在最后。而2004年開始報告對各種軍事裝備的關注度開始有了較大的波動和差異,特別對于核武器與空間武器裝備,“Nuclear"的詞頻從2004年開始快速上升,到2006年超過其他所有領域詞匯到達最高峰。而"Space”的詞頻在2007年突然驟然上升,并在2007年和2008年都保持在各個領域第一。表示地面部隊和裝備的“Ground”一詞,從2003年的第三位開始下降到2005年以后的最后一位。而表示海軍和空軍的“Navy,Air-craft”僅在2002年有所上升,之后一直小幅下降,2004年以后基本保持恒定。應該說這個詞頻變化情況大致反映了歷年《中國軍力報告》對中國各種軍事力量和裝備的關注變化一一從常規(guī)性武器裝備逐步轉向核武器、空間武器等裝備。
3.3關鍵詞用詞模式分析
Wordsmith軟件具有Concord用詞模式分析功能,可以進行詞組研究,特別是分析指定關鍵詞的用詞搭配方式,以此了解關鍵詞用詞規(guī)律和模式。
臺灣問題一直是中美關系中最為重要和敏感的話題之一,每年度《中國軍力報告》都會有對臺灣問題進行專門論述。采用WordSmith的Concord功能對所有年份報告中"Taiwan”一詞進行模式分析(見表3),在去除部分虛詞后可以發(fā)現"Taiwan"之前的動詞主要是“Preventing,Compel,Degrade,Attack,Prevent”這類具有進攻、迫使、防止等敵對意義的詞語。
另外,通過用詞模式分析也可以發(fā)現,除了“TheTaiwan Strait”一部分名詞詞組外,和"Taiwan"搭配使用頻率較高的動詞詞組主要有“Force Agajnst Taiwan”,“Invasion 0f Taiwan”和"Action Against Taiwan”等。這表明《中國軍力報告》在臺灣問題方面主要關心的是臺海軍事力量平衡以及臺灣地區(qū)受到武力威脅的問題。
當然,其他任何關鍵詞都可以采用同樣的方法進行用詞模式分析,分析它們在文中主要的詞組搭配,尋找語義規(guī)律。
4 圖情方法在《中國軍力報告》中應用研究的結論和體會
本文采用圖情研究方法對《中國軍力報告》系列報告進行了研究分析,考察系列報告的總體框架結構、關鍵詞、用詞模式和變化趨勢,研究方法與結論是對相關領域專家及學者研究的一種補充,作為一個獨立的研究,并非取代或駁斥他們的研究方法和觀點。
通過采用框架內容研究發(fā)現了《中國軍力報告》系列報告已經形成固定框架格式,同時在中美關系、中國軍事戰(zhàn)略未發(fā)生重大改變的前提下,通過框架內容分析,也可以推測2009年度《中國軍力報告》仍會采用固定的框架結構,并且也得到了相關印證。通過采用詞頻分析中的關鍵詞用詞模式和變化趨勢分析,可以發(fā)現歷年報告的關注重點以及各個領域內容的變化趨勢。因此,由于系列報告在時間和內容上的連續(xù)性,框架內容研究和詞頻分析在系列報告研究中可以發(fā)現相關的規(guī)律與特點。
另外,本文選擇的樣本《中國軍力報告》涉及軍事、政治等內容,因此,詞頻分析等圖情方法在對中美關系等其他學科領域的研究中也具有用武之地。當然,詞頻分析這一方法是具有其局限性的,特別對于中美關系這樣較為復雜和敏感的領域,并非能夠依據簡單的詞頻高低來判斷所述內容的重要性的,而且詞語在句中不同的位置和組配方式也可能形成完全不同的含義。
當然,單獨來看本研究的結論本身可能在中美關系的研究領域里不具有很大學術價值,但是作為情報分析研究的成果,這樣的工作對于那些專業(yè)研究人員應該有所啟發(fā)和幫助,可以為他們定性地研判提供某些新的視角。在方法上,本研究僅僅是初步嘗試,希望以這樣的思路有更多領域的試驗,并可以嘗試工具化軟件化,以逐步提高實用的效果。
相關熱詞搜索:詞頻 研究 文獻 系列報告的文獻研究:樞架內容研究和詞頻分新 系列報告的文獻研究 文獻中詞頻分布規(guī)律的研究
熱點文章閱讀