大數(shù)據視野下的檔案信息化建設
發(fā)布時間:2019-08-13 來源: 人生感悟 點擊:
摘 要隨著互聯(lián)網技術和信息技術的廣泛應用,直接推動了大數(shù)據時代的到來,對我國檔案管理工作產生了直接影響。數(shù)據檔案已經在電子商務和電子政務等各個領域發(fā)揮著重要作用。文章分析了檔案信息化建設中的大數(shù)據內涵和檔案信息大數(shù)據特征,探討了大數(shù)據時代的檔案信息化建設面臨的機遇和挑戰(zhàn),并提出了相應的應對措施和建議。
關鍵詞大數(shù)據 檔案信息化建設 數(shù)據檔案
大數(shù)據時代的檔案管理,是對傳統(tǒng)檔案管理思維和方式的創(chuàng)新和顛覆,檔案搜集、檔案整理、檔案利用等,都可以通過大數(shù)據挖掘,實現(xiàn)檔案管理和服務的創(chuàng)新。因此,檔案信息化建設面臨著前所未有的挑戰(zhàn)和亙古未有的機遇。
一、檔案信息化建設中的大數(shù)據
1.大數(shù)據內涵界定。根據國際數(shù)據公司對大數(shù)據的內涵界定,大數(shù)據是通過高速捕捉、發(fā)現(xiàn)和分析,從大量數(shù)據中所獲得價值的新型技術架構。
大數(shù)據具有規(guī)模大、種類多、速度快和價值密度低的“4V”特點。首先,規(guī)模大是指數(shù)據的完整性和巨大的數(shù)據量。其次,多樣性是指數(shù)據類型較多,其傳播方式和途徑較多,所以要在規(guī)模龐大的數(shù)據間,發(fā)現(xiàn)其內在的關聯(lián)性,這些數(shù)據可能具有非結構化、半結構化和結構化的關聯(lián)性,從而對數(shù)據處理能力提出了很高要求。再次,速度快是針對大數(shù)據的時效性來談的,大數(shù)據時代的信息傳遞速度很快,其具有的時效性特點更為明顯。無論是數(shù)據的產生,還是數(shù)據的獲取、存儲及應用,都具有很強的時效性。最后,大數(shù)據價值密度低是對大數(shù)據質量的強調,它是指大數(shù)據的價值性和精確度都比較低,單個信息的價值不大,所以必須要在海量的大數(shù)據中,通過數(shù)據挖掘技術的應用,獲取更有價值的信息。
2.大數(shù)據時代檔案信息資源的大數(shù)據特征。大數(shù)據時代的檔案資源大數(shù)據,主要是指在一定時間和空間范圍內,各類檔案數(shù)據的集合。檔案作為信息資源中的重要組成部分,具有一般信息所具備的特征,檔案大數(shù)據和互聯(lián)網大數(shù)據具有規(guī)模大、種類多、速度快和價值密度低的特征。具體而言,大數(shù)據時代的檔案信息資源大數(shù)據,具有以下四個方面的特征。
第一,大數(shù)據時代的檔案信息資源大數(shù)據具有體量大和增長快的特點。雖然,我國單個檔案館數(shù)據資源總量體量還不夠大,但是各個和各類檔案館資源總和起來,其形成的數(shù)據總量則可稱之為海量。并且,隨著這些檔案館所接收的電子檔案信息資源不斷增加,其數(shù)量已經形成了海量規(guī)模。
第二,大數(shù)據時代的檔案信息資源大數(shù)據具有種類多和結構復雜的特點。我國檔案涉及教育、科學、技術、政治、經濟、文化、商業(yè)等各個領域和行業(yè),每個行業(yè)的信息數(shù)據各不相同,不僅有傳統(tǒng)的紙質檔案,也有現(xiàn)代的圖片、視頻和音頻等電子檔案,其格式和特征差異很大,從而形成了大量異構數(shù)據,這些非結構化、半結構化和結構化的數(shù)據,最終構成了種類繁多的檔案信息資源數(shù)據。
第三,大數(shù)據時代的檔案信息資源大數(shù)據具有處理速度快的特征。在大數(shù)據時代,檔案信息資源同樣具有十分明顯的時效性特征,這就給檔案獲取、存儲和應用提出了更高的要求,對檔案信息資源大數(shù)據處理速度提出了更高要求。
第四,大數(shù)據時代的檔案信息資源大數(shù)據具有資源價值高的特征。和其他數(shù)據信息資源的“價值總量高、密度低”不同的是,檔案信息資源是具有權威性、可靠性、真實性和憑證性的信息資源,而且對于檔案信息資源來說,其使用客戶越多,價值發(fā)揮得越明顯。但是,檔案信息資源同時也具有分散性的特征,由于保管期限和歸檔范圍的分割,導致一定時期內所形成的檔案分布在不同檔案管理部門保管,其數(shù)量十分龐大,很難做到“齊全”;單個檔案的數(shù)據價值密度高,主要是指經過歸檔后的檔案數(shù)據價值密度要比未曾歸檔的檔案數(shù)據價值高,而且這種價值密度主要來源于檔案自身。檔案信息資源的可靠性和真實性,也與檔案信息資源自身的原始記錄性相關聯(lián)的,檔案數(shù)據是大數(shù)據中最有價值的“富礦”,對檔案信息資源的價值進行充分挖掘,提煉有價值的信息,對于檔案信息化建設具有很重要的意義。
二、大數(shù)據時代的檔案信息化建設面臨的機遇和挑戰(zhàn)
客觀來說,大數(shù)據是時代發(fā)展的必然趨勢,作為一種全新的理念和技術,對于檔案信息化管理,既是機遇也是挑戰(zhàn)。
1.大數(shù)據時代的檔案信息化建設機遇。首先,大數(shù)據有利于檔案信息價值挖掘。隨著我國各級和各類檔案館館藏資源數(shù)據化的快速推進和檔案信息的不斷增加,可供利用和分析的檔案信息資源正在匯聚成數(shù)量龐大的海量信息,通過大數(shù)據挖掘技術的應用,更有利于其中價值的發(fā)掘。其次,大數(shù)據有利于檔案信息資源共享。通過大數(shù)據技術的應用,可以更好地實現(xiàn)檔案信息資源的共享。大數(shù)據技術的應用,可以對不同檔案館之間的信息資源進行整合,構筑一個全新的信息共享空間,把各級和各類檔案信息資源系統(tǒng)連接在一起,形成全新的信息。最后,大數(shù)據有利于檔案信息資源的存儲。大數(shù)據時代的檔案管理,直接面對社會公眾進行檔案信息資源的搜集、整理、保管和利用等,特別是面對TB級的數(shù)據增長,大數(shù)據存儲技術大大提升了檔案信息資源的存儲能力。
2.大數(shù)據時代的檔案信息化建設面臨的挑戰(zhàn)。第一,檔案信息資源的泛濫。大數(shù)據時代,各類檔案信息資源呈現(xiàn)出指數(shù)級增長,如果僅靠傳統(tǒng)的檔案管理和處理技術,很難對其進行處理和優(yōu)化,而傳統(tǒng)的檔案信息化只是通過信息技術手段,把有限的檔案信息資源歸檔和整理。面對著呈現(xiàn)出指數(shù)級增長的檔案信息資源,要想對其進行分析和挖掘,發(fā)現(xiàn)其價值,增強數(shù)據的可靠性和真實性,這對于檔案信息化建設提出了更高的要求。第二,檔案信息化管理能力的不足。通過先進檔案信息化設備和工具的使用,可以提升檔案信息資源的管理能力,但是這種硬件實力和軟件能力并不匹配,特別是許多檔案管理人員的素質能力難以滿足需求,與傳統(tǒng)檔案管理理念和方式是截然不同的,檔案管理人員不僅要具備信息識別和數(shù)據分析的能力,還要通過人工智能手段的使用自動實現(xiàn)檔案信息數(shù)據的檔案化,即通過大數(shù)據技術和手段,對檔案進行自動搜集和整理,這些都對檔案信息化建設提出了更高的要求。第三,檔案信息化管理理念未能轉變。在大數(shù)據時代,檔案信息化建設的包容性是在不斷增強的,傳統(tǒng)信息管理業(yè)務中的數(shù)據也應該是檔案管理的內容,以及在辦公平臺上形成的數(shù)據也是檔案信息化管理的內容,這些都要求檔案管理人員必須要使用更先進的技術來吸收和消化,及時轉變工作理念和工作思路,而這些在短時期內,都對檔案信息化建設提出了很大的挑戰(zhàn)。
熱點文章閱讀