基于Hadoop的中醫(yī)藥大數(shù)據(jù)平臺基礎(chǔ)架構(gòu)的設(shè)計與研究
發(fā)布時間:2018-06-23 來源: 日記大全 點擊:
[摘要] 大數(shù)據(jù)技術(shù)在當(dāng)下被廣泛關(guān)注,構(gòu)建中醫(yī)藥大數(shù)據(jù)平臺是未來強化中醫(yī)藥行業(yè)競爭力的有力武器。本文通過解析中醫(yī)藥大數(shù)據(jù)特性,設(shè)計和研究中醫(yī)藥大數(shù)據(jù)平臺的基礎(chǔ)架構(gòu),通過合理設(shè)計和部署集群、網(wǎng)絡(luò)和服務(wù)器等環(huán)境,力求提供穩(wěn)定可靠的中醫(yī)藥大數(shù)據(jù)基礎(chǔ)平臺環(huán)境。
[關(guān)鍵字] Hadoop;大數(shù)據(jù)平臺;中醫(yī)藥;基礎(chǔ)架構(gòu)
[中圖分類號] R2-05 [文獻標(biāo)識碼] A [文章編號] 1673-7210(2018)02(c)-0158-05
Design and research of traditional Chinese medicine big data platform infrastructure based on Hadoop
WANG Li WANG Ping SHEN Junhui
Information Center, Beijing University of Chinese Medicine, Beijing 100029, China
[Abstract] Big data technology has been widely concerned in the present and building a big data platform for traditional Chinese medicine is a powerful weapon to strengthen the competitiveness of traditional Chinese medicine in the future. In this paper, through the analysis of traditional Chinese medicine data characteristics, architecture design and research of traditional Chinese medicine data platform, through reasonable design and deployment of cluster, server and network environment, so as to provide a stable and reliable traditional Chinese medicine data base platform.
[Key words] Hadoop; Big data; Traditional Chinese medicine; Infrastructure
在當(dāng)今社會,信息技術(shù)與經(jīng)濟社會的交匯融合已近引發(fā)了數(shù)據(jù)迅猛增長,數(shù)據(jù)已成為國家基礎(chǔ)性戰(zhàn)略資源。2015年8月31日,國務(wù)院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》(以下簡稱《綱要》),系統(tǒng)部署大數(shù)據(jù)發(fā)展工作[1]!毒V要》明確指出,推動大數(shù)據(jù)發(fā)展和應(yīng)用,在未來5~10年打造精準(zhǔn)治理、多方協(xié)作的社會治理新模式,建立運行平穩(wěn)、安全高效的經(jīng)濟運行新機制,構(gòu)建以人為本、惠及全民的民生服務(wù)新體系,開啟大眾創(chuàng)業(yè)、萬眾創(chuàng)新的創(chuàng)新驅(qū)動新格局,培育高端智能、新興繁榮的產(chǎn)業(yè)發(fā)展新生態(tài)。堅持創(chuàng)新驅(qū)動發(fā)展,加快大數(shù)據(jù)部署,深化大數(shù)據(jù)應(yīng)用,已成為穩(wěn)增長、促改革、調(diào)結(jié)構(gòu)、惠民生和推動政府治理能力現(xiàn)代化的內(nèi)在需要和必然選擇。
近幾年,中醫(yī)藥醫(yī)療行業(yè)的數(shù)據(jù)增長迅猛,中醫(yī)藥醫(yī)療行業(yè)也應(yīng)抓住契機緊跟時代的步伐,大力發(fā)展信息化建設(shè)。2015年,國務(wù)院公布的《中醫(yī)藥健康服務(wù)發(fā)展規(guī)劃(2015-2020)》,特別提到了運用云計算、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等信息技術(shù)開發(fā)智能化中醫(yī)健康服務(wù)產(chǎn)品[2]。2016年2月22日,國務(wù)院發(fā)布了《中醫(yī)藥發(fā)展戰(zhàn)略規(guī)劃綱要(2016-2030年)》,其中明確了未來十五年我國中醫(yī)藥發(fā)展方向和工作重點,以及今后一個時期中醫(yī)藥發(fā)展的重點任務(wù)!吨嗅t(yī)藥健康服務(wù)發(fā)展規(guī)劃(2015-2020)》中明確指出推動“互聯(lián)網(wǎng)+”中醫(yī)醫(yī)療作為重點任務(wù)之一,將推進中醫(yī)藥信息化建設(shè)作為完成重點任務(wù)的保障舉措[3]。在推進中醫(yī)藥信息化建設(shè)的保障舉措中要求按照健康醫(yī)療大數(shù)據(jù)應(yīng)用工作部署,在健康中國云服務(wù)計劃中,加強中醫(yī)藥大數(shù)據(jù)應(yīng)用。在若干政策的大力支持下,大數(shù)據(jù)技術(shù)與中醫(yī)藥醫(yī)療行業(yè)相結(jié)合,必將產(chǎn)生巨大的經(jīng)濟和社會效益。
1 行業(yè)背景
目前在學(xué)術(shù)界和產(chǎn)業(yè)界對于大數(shù)據(jù)(Big data)并沒有一個嚴(yán)格的定義[4]。研究機構(gòu)Gartner定義“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。麥肯錫全球研究所對大數(shù)據(jù)給出的定義是一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征[5]。而對于大數(shù)據(jù)的特征也是眾說紛紜,基本上容量、種類和速度是大數(shù)據(jù)公認(rèn)的3個基本特征[6-8]。
在中醫(yī)藥醫(yī)療行業(yè)領(lǐng)域中,中醫(yī)藥信息具有非常典型的大數(shù)據(jù)特征。首先從數(shù)據(jù)量上看,北京的一所三甲中醫(yī)醫(yī)院平均1 d的門診量可達1萬人次,每年住院患者可達5萬以上,如果將這些患者的診療過程全部數(shù)據(jù)化,每人次就診產(chǎn)生的醫(yī)學(xué)數(shù)據(jù)以10 M計,那么每年產(chǎn)生的數(shù)據(jù)量將高達70 TB,如果把全國中醫(yī)院的臨床數(shù)據(jù)都匯聚起來,其規(guī)模之大可想而知。其次,數(shù)據(jù)類型復(fù)雜。在中醫(yī)醫(yī)院,每個患者不但要經(jīng)過辨證論治的個體化診療,還會經(jīng)過各種檢查檢測進行疾病及其預(yù)后診斷,所以不光有病歷資料中包含的信息,還包括檢查、多種影像或病理切片檢查的生物學(xué)信息。這些眾多類別的數(shù)據(jù)通過分析處理可以產(chǎn)生多種多樣的數(shù)據(jù)存儲形式。再者,在數(shù)據(jù)的時效性方面,醫(yī)療數(shù)據(jù)每時每刻都在產(chǎn)生,例如臨床診斷等都具有實時處理的需求,具有時效性。
但是目前絕大多數(shù)中醫(yī)藥醫(yī)療行業(yè)數(shù)據(jù)均處于歸檔狀態(tài),使用傳統(tǒng)關(guān)系型數(shù)據(jù)庫技術(shù)使得數(shù)據(jù)的存儲、數(shù)據(jù)結(jié)構(gòu)擴展、數(shù)據(jù)分析和檢索都無法發(fā)揮數(shù)據(jù)的真正的價值,數(shù)據(jù)的價值和利用率受到了嚴(yán)重制約,大數(shù)據(jù)技術(shù)的引入將很好的解決這些問題,并為使用者帶來超乎預(yù)期的數(shù)據(jù)服務(wù)。
相關(guān)熱詞搜索:中醫(yī)藥 架構(gòu) 基礎(chǔ) 數(shù)據(jù) 研究
熱點文章閱讀