前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的醫療數據存儲方案主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:區域 PACS 集中式 分布式 混合式
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2015)11-0000-00
在我國隨著大型醫學影像設備在臨床診療方面的應用越來越廣泛,減少病人重復檢查,緩解大型醫院醫療資源緊張的需求變得日益迫切。在醫院集團內部和區域醫療機構之間,建立高效、安全的醫學影像存儲、共享和管理平臺是有效的解決辦法之一。傳統的中心化PACS系統仍是企業級和區域PACS系統建設的主流建設方案。區域PACS系統通過對醫院患者診療信息資源的整合,實現對各聯網醫院的診療信息的數字化存儲與歸檔管理,實現院際間患者診療信息的互相調閱。從患者、從臨床的角度實現體現出現代化醫學技術及提高了醫療服務的質量,減少誤診或錯診的可能性,通過減少對傳統影像膠片的使用,從而降低對環境的污染。
1 區域PACS系統的建設目標
目前區域影像信息系統的建設主要達到兩個目標。一是實現區域影像信息共享,即市民在任何一家接入區域平臺的醫療機構進行影像檢查時,能方便在線獲得自己當前和過去檢查的影像、診斷報告與專家診斷的意見以及其他相關信息。二是要統籌解決小型醫療機構PACS系統的應用,在提高小型醫療機構診斷準確性的同時提高基層放射醫生的診斷水平,讓在社區就診的居民享受到三甲醫院的診斷。
2 標準規范與技術路線
2.1 標準及規范體系的建設是區域PACS的重點工作之一
首先業務標準遵循衛生部《基于健康檔案的區域衛生信息平臺建設指南》(以下稱《指南》)中關于區域范圍內的影像業務流程規范所述內容;其次數據交換標準,醫療企業集成(Integrating the Healthcare Enterprise, IHE)計劃已成為具有高度影響力的國際性HCIT 標準協調組織,是本方案在區域衛生信息網絡環境下實現信息數據交互最重要的標準、規范之一;再次技術標準,IHE(Integrating the Healthcare Enterprise)――集成化醫療保健企業,已成為具有高度影響力的國際性HCIT 標準協調組織,而基于IHE XDS的區域平臺解決方案能夠滿足集團醫院和區域醫療機構間的高性能訪問、大容量分布存儲、數據備份、系統容災和降低系統擁有總成本的要求,此方案可以為我國醫院集團企業級醫療影像系統和醫療機構間區域影像系統的建設提供良好的借鑒和指導作用,提高我國醫學系統信息化同時,讓廣大病人享受到高科技信息服務帶來的便利和好處;最后管理標準范包括標準管理、安全管理、數據管理、項目管理,用于指導數據中心日常運行管理、數據維護管理規范等內容的制定。
2.2 技術路線
區域PACS系統建設中關于軟件系統部分的整體技術路線,要根據系統的需求分析以及對系統架構設計以及相關規范的要求,系統的設計與實現整體上要考慮國際技術先進性與國內技術的成熟性相結合的原則,同時還要兼顧醫療系統的實際情況發展以及其行業的發展。為此,可以采用如下的技術路線:
(1)采用面向服務技術架構(SOA-Service-Oriented Architecture),松耦合的設計模式,這是信息行業主流解決方案,并保證系統的靈活性、可擴展性和良好的維護性;(2)采用廣泛接受的標準如IHE XDS、XML、Web Service和SOAP等標準保證不同設備接口的兼容性,并且遵循國內公共衛生行業準化指南及相關標準,保證系統之間的互聯互通;(3)在需求分析和設計中,對業務要求正確理解,確保系統業務處理的準確性;(4)充分關注系統易用性,保證系統使用方便,操作簡便,易于學習;(5)采用成熟的軟件技術和軟件產品,保證系統的穩定性和可靠性;(6)設計中充分注意系統安全性,能提供多種安全檢查審計手段,確保系統不被非授權用戶侵入,數據不丟失,傳輸時數據不被非法截獲、篡改。
2.3 系統邏輯架構的設計
區域PACS系統的邏輯結構參考IHE XDS技術框架和有關協議,以數據集中存儲為例,區域PACS系統的邏輯架構是由業務層、數據流管理層、數據存儲管理層和擴展應用層四個層次組成。
3 系統數據存儲方式的設計
數據是PACS系統中最為重要的資源,為保證系統數據的準確性、一致性、完整性、安全性,支持整個系統安全、穩定、正常、持久地運行,PACS信息系統建設中主要采用的數據存儲方式主要采用混合式模式。
混合數據存儲策略:在這種數據分布策略中,數據采用分布式存儲,用于交換和共享的部分數據存放到中心數據庫服務器,同時數據中心保存地方醫院的數據存儲目錄,地方醫院可以根據數據中心提供的查詢服務定位發現數據存放的醫院。這種存儲方式既能滿足決策分析、網站應用、以及對數據的進一步應用,也能夠實現患者信息重新信息的整合。
區域PACS實現了醫改中的信息共享、降低醫療費用,PACS實現了拓展解決在一定范圍內不同醫院之間影像互認,滿足資料共享的需要是發展趨勢。
參考文獻
[1] 麥其遠.PACS系統的發展及相關技術[J].基層醫學論壇,2008(8).
同有飛驥的專業服務貫穿于產品的整個生命周期,從咨詢、解決方案設計、實施安裝、客戶培訓到售后服務等不同階段,其獨有的系統級和應用級專業服務,可更有效幫助客戶規劃、實施和管理數據系統。遍布全國的分支機構和商為用戶提供專業、快速、統一的現場服務和本地化支持。
同有飛驥憑借對客戶需求、產業發展的深入理解,秉持“數據安全是信息安全基礎”的理念,率先完成了從傳統的存儲廠商向數據安全基礎架構提供商的轉變,走在了技術發展的前沿。“秉承“技術立足,服務為本”的企業發展理念,同有飛驥率先在國內建立了一流的研發基地,在北京、上海、廣州、成都、西安、濟南等城市建有客戶體驗中心及解決方案中心,保證覆蓋全國的服務能力。對技術創新的不懈追求,對服務能力的高度重視,使同有飛驥持續領跑中國市場。
同有飛驥擁有業界最完善的產品線,覆蓋存儲、備份、快速恢復、數據備份和管理,以及安全存儲等所有關鍵應用領域。同有飛驥旗下NetStor系列已成為國內最具影響力的存儲品牌之一,為用戶提供最優化的解決方案。
同有飛驥率先通過質量管理體系認證(ISO9001)和軍工產品質量體系認證(國軍標GJB 9000),成為國內唯一一家擁有雙質量體系認證的存儲公司。
案例:同有飛驥助廣州市中醫醫院實現數據整體安全
廣州市中醫醫院始建于20世紀30年代, 是一所集醫療、科研、教學、預防保健于一體的綜合性三級甲等中醫醫院。
廣州市中醫醫院PACS 影像系統采用Oracle 數據庫。目前每年產生PACS 圖片數據量大小約為3TB 左右。遵照相關的醫療法規,PACS 圖片數據需要進行10 年以上的長期保存。
同有飛驥向廣州市中醫醫院推薦的數據安全整體解決方案由以下三個部分組成:雙機高可用系統、數據存儲系統、數據備份和恢復系統。采用產品包括:NetStor HA 雙機軟件、NetStor iSUM720 光纖存儲系統、NetStor VTL150G2-F 虛擬磁帶庫和NetStor TA224LTO3 物理磁帶庫、NetStor Backup Express 備份軟件。
隨著大數據在醫療與生命科學研究過程中的廣泛應用和不斷擴展,其數量之大和種類之多令人難以置信。比如,一個CT圖像含有大約150MB的數據,而一個基因組序列文件大小約為750MB, 一個標準的病理圖則大得多,接近5 GB。如果將這些數據量乘以人口數量和平均壽命,僅一個社區醫院或一個中等規模制藥企業就可以生成和累積達數個TB甚至數個PB級的結構化和非結構化數據。
在中國,2010年,國家公布的“十二五”規劃中指出要重點建設國家級、省級和地市級三級衛生信息平臺,建設電子檔案和電子病歷兩個基礎數據庫等諸項目標,也就是推進醫療信息化的“3521”工程。
過去由于缺少統一的電子病歷系統(EMR)標準,中國的電子病歷系統發展比較緩慢,醫院之間不能實現病患信息共享,醫療服務水平也因此受到影響。
為改善這一現狀,國家會逐漸加大對電子病歷的投入。適應這一趨勢,各級醫院也將加大在數據中心、IT外包等領域的投入。而隨著醫療信息數據的幾何倍數增長,醫院信息存儲將越來越受到重視,醫療信息中心的關注點也將由傳統計算領域轉移到存儲領域上來。
有弊就有利
對于許多醫療和生命科學機構而言,努力控制大數據造成的呈螺旋上漲的成本、復雜性和風險已經成為一個至關重要的問題。然而,從另一個角度來看,醫療大數據能夠帶來的收益要遠遠超出管理它們的成本,如開放新的具有醫療價值的信息源,提高診斷準確性和速度,預測疾病和健康形態,以及取得生命科學創新的不同見解。美國管理咨詢公司麥肯錫全球研究院(MGI)預測,如果美國的醫療行業能夠有效利用不斷增長的大數據來提高效率和質量,那么每年可創造超過3000億美元的額外價值。而且,在歐洲的發達國家中,僅在提高運行效率一項上,政府行政管理部門就可以利用大數據節省1000億歐元以上的費用。
任何事物都有兩面性。醫療大數據的確對數據管理、存儲、分布和保護等諸多方面形成挑戰。但是,對于大多數成功的醫療機構來說,利用大數據已經成為提高生產力、改進護理水平、增強競爭力、加快增長和創新的關鍵策略。那么,我們該如何在兩方面進行平衡,實現可觀的效果和利潤呢?
答案存在于數據經濟學中,即如何使從數據中獲取價值的成本低于數據能產生的效益。如果我們能夠有效地將數據存儲、處理和保護成本降至極低,然后利用尖端技術將數據轉化成支持臨床需要與業務增長的可執行信息,我們就能實現極高的數據經濟效益。
醫療大數據的挑戰
然而,如何有效地將大數據存儲成本降至最低,是企業和IT領導者,尤其是內容驅動的醫療和生命科學企業面臨的根本性挑戰。因為除了數據數量和形態的迅速增加,醫療數據還需要越來越長的保留期。患者的病歷可能需要保存70或80年,甚至更長。許多情況下,病歷還必須以原始格式永久保存,以滿足法規遵從的要求。同樣,生命科學研究機構有選擇性地選擇價值足以保留和維護數十年的數據,以期為新研究提供依據。
另外,許多醫療與生命科學研究機構在竭力應對資源緊張、持續的業務增長和新醫療技術帶來的挑戰。不斷變化的外部環境常常造成醫療機構存儲架構的無序擴張,多種系統和工具并存,使得管理變得更加復雜。
事實上,存儲消費速度加快,存儲資產未得到充分利用,對空間的持續需求以及動力和冷卻成本的增加,都推動了總體擁有成本的不斷攀升。而且,一旦存儲系統的安全性出現問題,導致醫療數據丟失,醫院會面臨更嚴重的局面。對于研究機構來說,數據存取是創新和競爭力的核心。這樣看來,文件數據不斷增長導致的管理成本提升被認為是當今全球著名公司面臨的五大難題之一,這種結論就不足為奇了。
醫療行業大數據理想基礎架構
要實現高額數據經濟效益,關鍵是能夠對包括結構性數據和非結構性數據在內的所有醫療大數據進行集成,實現集中管理和更好的資源配置。
為了整合醫院不同部門或不同生命科學系統的大數據,實現充分的信息搜索和共享,理想的存儲架構必須是一個適用于塊數據、文件和內容的集成系統,并且擁有強大的容量、性能和吞吐量,在處理、移動和訪問多個大型數據集和大量數據(數量常常達到數個TB甚至是PB)時能夠保持運行的一致性。為了盡量降低存儲成本并滿足臨床業務需要,理想的存儲架構還必須支持臨床創新的數據互操作性,必須能夠實現智能分層,根據訪問頻率、臨床價值和實際存儲成本自動完成數據分布。這種動態分層功能有助于進一步提高容量利用和資源配置水平,從而全面優化存儲資源的成本效率。
此外,醫療與生命科學研究機構要求大量的存儲空間和動態擴展能力,以便處理不斷增長但無法預測的數據和圖像,以達到高水平的合規性要求,保證遵從關于數據長期保留、完整性和數據保護的政策。最重要的是,一個適當的存儲系統必須具有內容感知能力,能夠將數據轉化為可執行信息。
內容感知是指動態地進行信息分類并為非結構化數據文件分配策略,將非結構化數據轉化為有價值的信息,從而能夠采用最佳方式,更快進行決策并保護公司敏感數據。
HDS文件和內容解決方案
HDS文件和內容解決方案由Hitachi Content Platform、Hitachi NAS Platform、Hitachi Data Discovery Suite 以及Hitachi Data Ingestor組成,可以滿足在醫療和生命科學研究領域中存儲、管理、保護和搜索各類數據嚴苛的要求,無論這些數據是PDF文件、醫學影像還是病患人口數據。另外,Hitachi Clinical Repository(HCR)為管理業務和健康數據、固定內容和圖像,應對DICOM/HL7數據讀取、數據整合、數據挖掘和數據分布這些獨特挑戰而設計的。它由Hitachi Content Platform(HCP)和DICOM/HL7網關組成,可基于HDS平臺、客戶解決方案或合作伙伴的應用平臺使用。這些解決方案所具有的獨特功能包括:
集成存儲 ——文件、內容和塊服務在單一管理界面中融合。通過跨平臺創建存儲池和利用虛擬化,客戶可以簡化管理,提高利用水平,并恢復或延長現有資產的使用壽命。
智能分層——動態分層存儲架構通過預定義存儲層、數據索引和制定自動將數據遷移到對應層的策略,管理基于文件的數據(如PDF文件或醫學影像)。通過自動將活躍數據遷移到適當的平臺,你可以優化磁盤要求(例如在低成本的SATA硬盤里存儲更多數據,同時減少在費用高昂的光纖通道、SAS或固態硬盤(SSD)上存儲數據)。這一策略根據精確的業務運行需求管理內容,不僅使文件和內容存儲更有效、更加智能化,還提高了整個存儲系統的成本效率。
存儲優化——動態分層使閑置容量可以輕松得到再利用,重新確定現有資產用途以延長使用壽命,并自動將非活躍數據遷移到具有復制功能的內容倉庫。這使容量效率和利用率達到極大化,同時可以減少備份卷,并且能夠優化存儲資產的投資回報率。
內容感知搜索———本地自動感知能力可以識別所存儲數據的相關性。對使用單一接口的多種資源還可以進行聯合查詢,以便搜索數據并提供索引。內容感知搜索實現了文件和內容服務的真正同化,以滿足法律監管和企業要求,并可以管理內容引發的遷移和其他整體數據活動。
低成本存儲———通過集中建立存儲池、跨系統智能擴展和利用動態分層自動完成數據遷移,減少管理節點,提高存儲資產的使用經濟效率,也降低了對硬件的要求。管理、備份、容量規劃、動力和冷卻成本隨之降低,這些使固定資本(CAPEX)和運營成本(OPEX)都大大降低。事實上,已經有數據證明,HDS文件和內容解決方案可以極大地降低管理成本和備份成本。
邊緣到核心存儲———中心醫院還可以選擇為偏遠的醫療中心提供無縫的邊緣到核心的數據訪問支持,增強臨床醫師間的協作,通過進行有效控制來實現免備份存儲。
HDS文件和內容解決方案——旨在幫助相關機構管控好大數據環境,利用統一、可擴展的管理平臺簡化大數據存儲的復雜性,整合資源促進利用,調動數據以滿足業務需求,改進數據保護以提高合規性水平并降低風險。
關鍵詞:醫療監護;MSP430;微功耗;數據存儲;電源
隨著近年來微電子技術的快速發展和工藝的進步,醫用電子領域中,常用的一些醫療監護設備有向著便攜式、微型化及家庭化發展的新趨勢,一些小型化、簡便易用的監護儀器在社區醫療、家庭護理方面扮演著越來越重要的角色。這其中,基于微功耗架構設計的新型微控制器和一些低功耗優勢明顯的新型器件為這種趨勢提供了新的助力并為之奠定了堅實的基礎。
系統設計
為滿足社區、家庭醫療監護的需要,便攜式醫療監護系統往往需要在現場采集并存儲一些人體生理信號的相關數據,如心電信號、血氧飽和度、心率及體溫等,以達到監控人體重要生理參數的目的,并能夠對這些生理參數的信號進行相應的識別和處理(如關鍵指標不正常時自動報警),能夠提供簡便的人機交互界面,數據可以傳輸給PC機進行后續的處理。便攜式醫療監護系統的結構框圖如圖1所示。
考慮到本系統的應用需求,系統總體設計中尤其要滿足微功耗、微型化和可靠性的要求,系統內的電路設計、電路形式、器件選擇和電路板制作均應緊密圍繞這三點展開。
圖1中傳感器、血氧模塊、信號調理模塊構成了系統內的前向通道。傳感器(如測量心電信號的電極)用于將人體的微弱生理信號轉換為電信號,其輸出信號需要經過信號調理模塊的放大、濾波等處理。血氧模塊能夠通過探頭直接檢測人體的血氧飽和度、心率等,目前市面上已經有供二次開發使用的監測血氧飽和度、心率等的集成電路板,其內往往已經集成了相應信號處理的內核,這種集成電路板的輸出已經是符合一定格式要求的數字信號,可以由中央控制單元直接接收。
為有效放大傳感器輸出的有用差分信號,信號調理模塊中的信號放大電路應具有較強的共模抑制和差動放大能力。同時信號調理模塊中的濾波器應采用同相結構的精密運放和RC網絡組成高階有源濾波器。信號調理模塊同時要具有微功耗特點,能夠在單電源下工作,其信號放大范圍要與A/D轉換時所需要的信號幅度相一致。
中央控制單元可采用新型的16位微控制器,其片內具有較高精度的多通道A/D功能模塊、大容量的FLASHROM和數據RAM,可以在無需片外A/D芯片的基礎上實現生理信號的采集、接收和處理。
數據存儲模塊可以根據存儲容量的不同要求,選擇不同形式的數據存儲芯片。
顯示與鍵盤接口模塊提供了設置和操作系統的鍵盤接口,并通過圖形點陣液晶實現漢字菜單顯示、生理參數的數值顯示和波形回放等功能,為系統提供智能化的人機交互界面。
時鐘模塊為系統提供實時的時間坐標。
數據通信模塊提供本系統與PC機之間的數據交換手段,既可以是串行、USB、TCP/IP網絡通信等有線接口方式;又可以通過無線收發芯片組建一個固定頻點下(如433MHz)的無線通信網絡。
電源模塊為系統內的模擬和數字電路部分分別供電,提供不同的工作電壓和一定的電源分區管理功能,其輸出質量直接關系到系統的精度和可靠性。
便攜式醫療監護系統的現場使用性要求其電流消耗小,以降低系統的功耗,延長電池的使用時間。因此,微功耗設計是系統總體設計的重要內容。微功耗設計的核心是最小功耗系統的設計,它不僅能降低系統功耗,還使系統具有較低的電磁輻射和較高的可靠性。
微控制器
TI公司的MSP430F149正是具有超低功耗特點的16位微控制器,其功耗可以達到微安級。
F149的軟件結構也針對低功耗而設計,從備用模式喚醒MCU僅需6μS。中斷和子程序調用無層次限制,這種豐富的中斷能力減少了系統查詢的需要,可以方便地設計出基于中斷結構的數據采集及存儲程序。
采用MSP430F149作為便攜式醫療監護系統的中央控制單元,提升了系統的先進性、可靠性和集成度。
數據存儲器
在便攜式醫療監護系統中,在數據存儲容量要求不高的情況下(幾十K字節以內),可以通過一定的軟件設計技巧將數據存儲在MCU內的FLASH存儲器中。F149內有60KB的FLASH ROM,由2段信息存儲器和118段主存儲器構成,主存儲器中除了放置控制程序的存儲段以外,系統采集到的人體生理參數數據也可以逐段地依次存入到其它的空余存儲段中。這樣就可以節省專用的數據存儲芯片,使得在便攜式監護系統中,一片16位微控制器-F149芯片就足以替代以前“單片機+數據存儲芯片+A/D芯片”的常規組合,既降低了成本又有效提高了系統的集成度。
對于數據存儲容量在幾百K~1M字節的,可以采用12C接口的AT24LC系列數據存儲芯片,尤其若干個AT24LC系列芯片進行級聯后存儲容量可以大幅提高。
對于需要實時存儲多通道生理參數數據的監護系統,可采用ATMEL公司的AT45系列SPI串行接口低電壓FLASH存儲器。
對于更進一步的數據存儲容量要求(1 G字節以上)可以考慮目前優盤中常用的并行高容量FLASH存儲芯片,其缺點是占用MCU的I/O資源過多,功耗稍高。
數據采集
F149的A/D轉換模塊ADC12具有四種轉換模式:單通道單次轉換、單通道重復轉換、序列通道單次轉換及序列通道重復轉換。在監護系統中往往需要采集多通道、連續變化的數據,則序列通道單次轉換模式的時序控制較為簡單,靈活性較高。
采用序列通道單次轉換模式時,應相應設置控制寄存器ADC12CTL1的SHP=1,同時將SHS(采樣輸入信號源選擇控制位)設置為1,即由F149內的Timer_A.OUT1觸發采樣定時器。定時器A可以工作在增計數模式,其定時間隔就是A/D轉換的采樣時間間隔。采用定時器輸出信號觸發采樣的優點在于:能精確控制采樣時間間隔,由于采用硬件定時,因此MCU可以在定時間隔內進入休眠狀態,并由中斷喚醒,這就完全符合了基于中斷的微功耗程序設計原則。
在數據采集過程中應注意以下幾個問題:
?避免可能的“丟幀”問題,即要注意數據采集和數據存儲之間的時序配合。解決方法是:在F149的數據RAM內開辟兩塊緩沖區,緩沖區大小與FLASH存儲器的一個存儲頁面的大小相同。利用兩塊緩沖區切換,并結合FLASH存儲器的頁面批量數據寫入功能,使得采樣數據能及時存儲。
?數據采集過程中保證穩定的時鐘源。應注意在F149進入低功耗休眠狀態時,保證相應的時鐘信號可用,否則會引起采樣時間間隔上的嚴重誤差甚至錯誤,而這種錯誤往往還不易察覺。
由于人體的一些生理信號均為低頻信號,且人體的很多生理參數都是緩慢變化的,很多情況下無需以很高的頻率進行實時數據采集,對變化較緩慢的生理參數如體溫可以1分鐘采集和記錄一次數據。另一方面,通過在軟件上采用可伸縮尺度的存儲方法也能大大節省數據存儲空間,即始終以恒定的采樣率進行生理信號的連續采集并放入F149的數據緩沖區內,但對經識別連續正常的生理信號采用相對長的存儲時間間隔,而對識別到的異常生理信號進行連續實時記錄(即采集到多少數據就連續存儲多少數據)。這樣可以有效節省數據存儲空間,并降低了平均功耗。
電源模塊
由于便攜式醫療監護系統內往往同時存在模擬和數字電路,電源模塊必須對模擬電路和數字電路部分同時供電。
便攜式監控系統中一般可采用堿性或可充電電池組成的電池組供電。
圖2是便攜式監護系統電源模塊的結構圖。
采用中央控制單元、模擬電路和數字電路分別單獨供電的電源結構。系統中,由MCU控制DC-DC升壓變換電路的開、關,實現對模擬電路的供電管理;由MCU控制3V低壓差穩壓電路的使能引腳,以控制數字電路部分的供電。
再加上數據開始越來越多地從專有存儲設備轉向云、軟件定義和基于服務器的產品,存儲市場的銷售數據越來越不景氣。2016年也許是存儲市場開始長期下滑的一年。
根據 IDC 的全球企業存儲系統季度追蹤報告稱,2016年第一季度企業存儲系統工廠收入同比下滑 7%至 82 億美元。2016 年第二季度全球企業存儲系統工廠收入同比持平,增幅 0.0%為 88 億美元。2016年第三季度整個全球企業存儲系統工程收入同比下滑3.2%至88億美元。2016年第四季度全球企業存儲系統工廠收入總體同比下滑6.7%至111億美元,總出貨容量同比增長18.3%達到52.4EB。
在面臨新技術沖擊和銷售數字不斷下滑的巨大打擊下,存儲市場該何去何從?
曙光加碼存儲
早在2014年,IBM就了一系列軟件定義存儲產品,并推動成立了“中國閃存聯盟”。致力打造新型存儲生態圈。2016年,紫光集團旗下紫光股份與美國西部數據成立紫光西部數據有限公司,共同開拓存儲市場,聯想和中科曙光也紛紛推出了自己的超融合產品。
不久前,中科曙光宣布與喬鼎資訊成立“曙光存儲科技有限公司”,中科曙光總裁歷軍更是將目光瞄準在了中國存儲市場前三的位置。存儲市場風云再起。
2017年2月24日,中科曙光、喬鼎資訊與天津濱海高新技術產業開發區在京舉行聯合簽約儀式,共同宣布中科曙光與喬鼎資訊將在天津濱海高新區注冊成立“曙光存儲科技有限公司”,開展存儲產品和技術的研發、銷售,并提供配套服務。合資公司將合力研發和推廣符合中國大陸和全球市場需求的存儲產品,面向快速增長的國內外存儲市場開發創新解決方案。
此前,中科曙光、寧波曙光創新股權投資合伙企業、喬鼎資訊與喬鼎(上海)計算機科技有限公司已在北京簽署了《合資經營合同》。根據約定,合資公司的注冊資本總額為 7500萬元人民幣,其中中科曙光公司擬以現金出資 4,500 萬元人民幣,持股比例為60%。
根據協議,合資公司將基于中科曙光和喬鼎資訊的市場和技術,研發主要面向Server SAN、超融合和閃存等產品。經營范圍為技術開發、技術咨詢、技術服務、技術轉讓、網絡安全設備、存儲設備、系統集成(最終以工商機關核準的營業執照上登記的經營范圍為準)。此外,合資公司將在天津濱海高新技術產業開發區內建設存儲產品研發中心、運營中心、客服中心、銷售總部等,同時面向全球市場開展存儲業務。
中科曙光總裁歷軍表示,喬鼎資訊是全球知名的存儲行業領導者,也是領先的高性能存儲產品的研發廠商,其存儲解決方案被數據中心、監控系統、云端及富媒體市場廣泛采用。存儲作為實現曙光“數據中國”戰略的重要基礎支撐之一,對大數據、大規模集群計算而言不可或缺。中科曙光與喬鼎資訊在天津濱海高新區成立合資公司,不僅將使曙光的存儲業務邁上一個新的臺階,更將加快曙光的“數據中國”戰略的進程。
據公開資料顯示,喬鼎資訊成立29年來專精存儲產業, 擁有眾多的存儲技術核心技術,包括RAID技術、雙控/多控的存儲硬件、NAS,以及Data Service件,且在超融合(Hyperconverged Infrastructure, HCI)、全閃存(All Flash Array, AFA)等存儲產業新趨勢方面有多項創新。而且喬鼎信息在歐美市場耕耘已久, 更在全球都建立了銷售及服務團隊。因此, 從信息產業鏈的完整性上來看,雙方的合作是各取所需,相互補充。此外,雙方本次的合作是面向全球的,將有力地提升各自的品牌競爭力。
喬鼎資訊董事長李志恩表示,中科曙光與喬鼎資訊的合作將集中雙方的優勢進行互補。既幫助喬鼎資訊快速融入國內市場,又能夠幫助中科曙光加快走向世界的步伐。他相信未來喬鼎與曙光強強連手, 將能發揮“1+1 >2”的效,果,不僅著眼于國內市場的拓展, 未來更能放眼全球。
據中科曙光存儲產品事業部總經理惠潤海介紹,合資公司有三個愿景:第一,通過自身的努力來引領整個國內存儲技術的發展;第二,做出一系列有競爭力的產品,且這些產品可以跟國際巨頭的產品媲美,處于國際領先地位。第三,能成為中國大陸前三、全球前十的專業存儲廠商,在中國市場希望達到15%的存儲市場占有率。
惠潤海還給出了合資公司的產品路線圖:基于現在雙方在存儲技術上的經驗和積累,本著這種市場優先和分布推進的原則,逐步推出三代產品,即分布式SAN、超融合、閃存。這些產品將會更加適用于客戶的需求,可以更加滿足中國用戶的應用。
布局新型存儲市場
紫光西部數據有限公司的主要發力方向是大數據存儲解決方案,不久前,紫光西部數據有限公司和中信建投證券股份有限公司共同宣布,中信建投證券海量數據存儲創新項目實施獲得成功。通過采用紫光西部數據動態歸檔存儲系統,中信建投證券成功實現了對于海量離線數據的深入挖掘分析,并通過創新型“近線存儲”方案,有效節省了整體存儲成本,提高了存儲系統性能,保證了數據存儲的穩定性,并為中信建投證券未來金融業務創新奠定了堅實基礎。
中信建投證券在日常業務處理過程中,生成了海量的非結構化數據,如:票據掃描、柜臺影像、文件存檔等。為從海量數據中持續獲取業務價值,中信建投證券需對這些數據進行深入挖掘,精準分析客戶需求,不斷提升服務質量。在此背景下,中信建投證券與紫光西部數據合作,采用全球領先的動態歸檔存儲系統,實現了金融行業海量數據存儲創新。
通過深入研究相關業務場景,紫光西部數據和中信建投證券團隊共同設計了“海量數據近線存儲架構”,既能夠對離線歸檔數據進行實時調取、有效分析,也能夠對在線業務數據進行快速分類、歸檔存儲。同時,該方案還能有效節約在線系統存儲空間、提高數據存儲效率,顯著降低海量非結構化數據的總體存儲成本。
通過實施紫光西部數據“一體式”動態歸檔存儲系統,中信建投證券對傳統存儲方案中需要增設額外硬件設備、設置復雜應用配置的繁瑣流程進行了有效簡化,并通過與主流數據歸檔軟件的無縫對接,僅憑借簡單IP地址和網j實施部署,快速開展業務、全面實現功能。在后期操作維護方面,“一體式”動態歸檔存儲系統也具有操作簡單、易于管理等特點。相較于傳統存儲方案,該方案還幫助中信建投證券顯著降低了整體運營維護成本,從而實現更高的投資回報率。
據悉,紫光西部數據即將在3月推出一系列存儲新產品。
在閃存市場,IBM日前宣布推出專為大中型企業而設計的新的全閃存存儲解決方案,以滿足對這些企業而言至關重要的高可用性、連續運行和性能方面的需求。這些全閃存存儲解決方案將提供大中型企業所需的速度及可靠性,來處理企業資源規劃(ERP)和金融交易以及認知應用(如機器學習和自然語言處理)等廣泛的工作負載。此次宣布推出的全閃存存儲解決方案旨在支持認知工作負載,這些負載能幫助客戶發現趨勢和模式、從而提升決策能力、改進客戶服務并提高投資回報率。
2016年年底,聯想首次面向企業客戶和合作伙伴了超融合全新戰略――聚焦新一代超融合技術創新與落地,進而全方位支持企業抓住智能時代帶來的業務機遇,深入踐行推進其超融合市場發展與產業成熟的承諾。的全新超融合產品家族,是基于通用x86服務器的軟件定義基礎架構,具有可快遞、零負擔、很包容等優勢,實現了虛擬化和存儲的深度融合。它通過對云管理平臺、計算、網絡和存儲系統的無縫集成,構建了云計算基礎設施即服務的一站式解決方案,為用戶提供了一個高度簡化的一站式基礎設施云平臺。
最早提出大數據時代到來的是麥肯錫:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”
那么什么是大數據呢?
從目前比較公認的定義上看,大數據從數據量上看,至少也要達到PB級別(1PB=1024TB=1048576GB)。公開資料顯示,阿里巴巴集團目前的數據系統之一“云梯”中總存儲容量50PB,實際使用容量超過了40PB。百度搜索引擎抓取的數據綜合,大概是10-50PB,這個范圍很大,因為這個情況是每隔一小時就會發生很大變化。另外其的UGC,也就是用戶產生的內容,例如百度貼吧、百度知道、百度文庫中的內容,這些內容是廣大互聯網網民自己產生、自己上傳的,大家一起分享的數據,這部分數據目前達到1PB。
歸結起來,大數據便是海量的(Volume)、多種類的(Variety)、需要大規模的處理才能夠凝聚足夠價值的(Value)、處理和檢索響應速度快的(Velocity)數據。處理大數據所需要的系統,和傳統的數據挖掘工作所需要的系統有根本性區別。同時,大數據時代越發強調數據的關聯性,將各種數據之間關聯組合,以產生更大的價值。
互聯網上的每一個網頁、每一張圖片、每一封郵件,通信行業每一條短消息、每一通電話,電力行業每一戶用電數據等等,這些足跡都以“數據”的形式被記錄下來,并以幾何量級的速度增長。這就是大數據時代帶給我們最直觀的沖擊。
正因為數據量之大,數據多為非結構化,現有的諸多存儲介質和系統極大地限制著大數據的挖掘和發展。為更好地解決大數據存儲問題,國內外各大企業和研究機構做了許許多多的嘗試和努力,并不斷摸索其商業化前景,目前形成了如下兩種比較成熟的商業模式:
可擴展的存儲解決方案。該存儲解決方案可幫助政府、企業對存儲的內容進行分類和確定優先級,高效安全地存儲到適當存儲介質中。而以存儲區域網絡(SAN)、統一存儲、文件整合/網絡連接存儲(NAS)的傳統存儲解決方案,無法提供和擴展處理大數據所需要的靈活性。而以Intel、Oracle、華為、中興等為代表的新一代存儲解決方案提供商提供的適用于大、中小企業級的全系存儲解決方案,通過標準化IT基礎架構、自動化流程和高擴展性,來滿足大數據多種應用需求。
云存儲是一個以數據存儲和管理為核心的云計算系統,其結構模型一般由存儲層、基礎管理、應用接口和訪問層四層組成。通過易于使用的API(應用程序編程接口),方便用戶將各種數據放到云存儲里面,然后像使用水電一樣按用量進行收費。用戶不用關心數據的存儲介質、網絡狀況以及安全性的管理,只需按需向提供方購買空間。包括國外的亞馬遜、微軟,國內的網易、盛大等公司都提供非常成熟的云存儲服務。據研究企業MarketsandMarkets公司最新的報告稱,全球大數據市場規模將在未來五年內迎來高達26%的年復合增長率――從今年的148.7億美元增長到2018年的463.4億美元。
在紅紅火火的大數據時代,隨著數據的累積,數據本身的價值也在不斷升值。一些掌握海量有效數據的公司和企業找到了一條行之有效的商業路徑:對源數據直接或者經過簡單封裝銷售。在互聯網領域,以Facebook、Twitter、微博為代表的社交網站擁有大量的用戶和用戶關系數據,這些網站正嘗試以各種方式對該源數據進行商業化銷售,Google、Yahoo!、百度等搜索公司擁有大量的搜索軌跡數據以及網頁數據,它們可以通過簡單API提供給第三方并從中盈利;在傳統行業中,中國聯通、中國電信等運營商擁有大量的底層用戶資料,可以通過簡單地去隱私化,然后進行銷售盈利。
【關鍵詞】大數據微信傳播;安全威脅;安全保障
大數據背景下微信安全的技術文化建構應該從兩個方面展開,一是如何保障微信大數據自身的安全,再者是微信大數據如何用以保障安全。前者涉及的是微信大數據自身的生產、采集、傳輸、存儲、處理等方面的安全,后者則是將微信大數據用以提升安全效能和能力,指向信息安全系統問題的解決。隨著智能手機、平板電腦、筆記本電腦等智能移動終端的普及,當下的移動終端業已滲透進人們生活的方方面面。工信部的2014年通信運營業統計公報顯示,2014年,移動電話用戶凈增5698萬戶,總數達12.86億戶,移動電話用戶普及率達94.5部/百人,比上年提高3.7部/百人;2G移動電話用戶減少1.24億戶;4G用戶發展速度超過3G用戶,新增4G和3G移動電話用戶分別為9728.4和8364.4萬戶,總數分別達到9728.4和48525.5萬戶,在移動電話用戶中的滲透率達到7.6%和37.7%。據統計,2014年全國移動互聯網接入流量消費達20.62億G,同比增長62.9%,比上年提高18.8個百分點。月戶均移動互聯網接入流量突破200M,達到205M,同比增長47.1%。手機上網流量達到17.91億G,同比增長95.1%,在移動互聯網總流量中的比重達到86.8%,成為推動移動互聯網流量高速增長的主要因素。
一、微信傳播的應用狀況
微信是由騰訊公司2011年初研發的主要針對手機智能終端提供免費即時通訊服務的應用程序。據騰訊官方數據顯示,微信應用已經覆蓋了90%以上的智能手機,滲透到了人們的日常生活、商業、行政管理等各個領域。2015年第一季度末,微信每月活躍用戶已達到5.49億,用戶覆蓋200多個國家、超過20種語言。此外,各品牌的微信公眾賬號總數已經超過800萬個,移動應用對接數量超過85000個,微信支付用戶則達到了4億左右。微信運營跨越了運營商、系統平臺的技術藩籬,為用戶提供免費的語音短信、視頻、圖片和文字傳輸服務,與此同時,還有新增的社交插件,諸如“搖一搖”、“漂流瓶”、“朋友圈”、“公眾平臺”、“語音記事本”等服務插件。據統計,25%的微信用戶每天打開微信超過30次。55.2%的微信用戶每天打開微信超過10次。截止2015年,微信直接帶動的生活消費規模已達到110億元。以微信的主要服務公眾號為例,在微信平臺下,企業和媒體的公眾賬號受關注比例高達73.4%,業已成為商業、公共服務進行傳播擴散的主要渠道。到2015年,微信已實現中國大部分城市的社會公共服務,公共交通、生活設施繳費、醫療、市政等領域的服務覆蓋。
二、微信大數據的技術安全威脅
無論是在發達國家還是在發展中國家,網絡安全都被視為關乎社會穩定發展,甚至國家安全的重要方面。在信息化時代,個人信息安全已經面臨嚴峻挑戰,微信作為社交媒體,作為社會各類信息的集中地,所造成的影響、受關注的程度也自然更高。世界范圍內,各社交媒介都將各自經營范圍的網絡數據安全、用戶隱私等信息作為重點進行保護,在此領域的投入也是巨大的。無論是當下還是在未來,社交媒體的信息安全都將是社交媒介競爭的核心環節。微信所屬騰訊公司是中國大型綜合服務提供商,匯聚了海量的數據信息。該公司的數據挖掘分為5個層級,即為:數據層、分析層、算法層、輸出層、投放層。各層級各司其職,例如算法層負責定向規則過濾;輸入層控制細分人群的投放概率;投放層控制投放頻次的算法配置。
(一)微信大數據的設施安全威脅
微信大數據的基礎設備包括存儲、運算、一體機和其他基礎軟件等。處理微信大量的數據信息,需要創建支持大數據環境的相應設施。比如高速的信息收集網絡、海量數據存儲的設備;相應的運算設備。設備是大數據運用的物質基礎,同時也是可能遭受安全威脅的源頭。在設施安全環節存在著諸多安全隱患。比如,未經授權進行微信信息資源的使用。網絡黑客可以使用假冒、非法用戶進入等形式有意回避系統訪問控制機制,對網絡設備、資源進行無限權限的操作、使用。信息大數據是虛擬數字信息,其傳輸渠道也是容易產生泄露和信息丟失的環節。網絡黑客可以利用電磁泄漏、搭線竊聽等隱蔽渠道竊聽敏感信息。尤其是設備加密度不夠的信息更容易被竊取或篡改。木馬病毒是大數據設備經常遇到的安全威脅,這些針對網絡虛擬數據的安全攻擊可以利用虛擬機管理系統自身的漏洞入侵宿主機。
(二)微信大數據的存儲安全威脅
微信傳播的爆炸性增長產生的TB(1TB=1024GB)級甚至日后的PB(1PB=1024TB)級的規模數據,就要求存儲設備得具備相應的安全支撐。微信傳播中涉及到各種數據形式,文字、圖片、視頻等各式各樣的數據內容要求存儲結構具有強大的擴展能力,并且要求操作過程的快捷、便利。數據存儲可以根據存儲類型劃分為關系型數據存儲、非關系型數據存儲。前者是數據存儲的傳統方案,此種方案要求數據庫信息處理前后的一致性。在數據完成之后可以保持其持久性,也就是數據在遇到系統故障后也不會丟失信息。關系型數據存儲在管理上便于加密、處理和分類,增強數據的安全效果。但同時,關系型數據存儲難以有效的處理微信傳播過程中的文字、視頻、圖片等多維數據信息,擴展性及成本較高。鑒于微信大數據設備數據的多維、海量、高增長、低價值密度的特性,80%以上的非結構數據的處理、存儲通常采用的是NOSQL技術來完成。非關系型數據存儲的可擴展性、靈活性都較關系型數據存儲具有優勢,但是也有更多的安全隱患:首先,此種模式的自身技術就不夠成熟,NOSQL模式列和行級的安全性更為重要,NOSQL允許數據屬性的不斷添加。從客戶端軟件來看,NOSQL模式沒有內置的足夠安全機制,其安全身份驗證應用更復雜。NOSQL系統的應用程序過多,容易造成系統漏洞。基于騰訊大數據處理的三大平臺,微信數據存儲和處理由于離線分布式數據倉庫平臺、騰訊數據銀行平臺和在線實時計算平成。
(三)微信大數據的網絡安全威脅
微信社交平臺是通過收集網絡數據來搭建營銷平臺。通過對用戶數據進行分析然后向用戶推送個性化服務。騰訊公司使用的分布式數據倉庫TDW平臺現擁有機器總量8400臺,最大集群約2000個節點,總存儲100PB,日新增數據200TB,月數據增長率10%,日均JOB數100萬,日均計算量5PB。從以上數據可以看出,微信數據信息的激增勢頭,而作為傳播技術基礎的網絡在不斷對人們的日常生活進行滲透,安全問題與使用數字成正比增長。如今的網絡攻擊手段和工具也在呈現著平臺化、集成化、自動化的特點,具有隱蔽性更強、潛伏期更長、攻擊目標更明確等特點。
(四)微信大數據的隱私安全威脅
微信軟件從2011年“成型”發展至今,注冊用戶量已經突破11.2億,在亞洲的同類軟件中,微信已成為用戶量最多的即時通訊應用軟件。其中包含著海量的身份、屬性、行為等信息數據。在存儲、傳輸等各環節都存在隱私泄露的威脅。大數據環境的信息處理不同于傳統信息的簡單數據集合處理,多源交叉驗證容易造成用戶的真實信息暴露。在大數據的存儲、傳輸、處理等環節都容易出現隱私泄露。比如在微信朋友圈功能中,用戶可以通過微信傳輸終端查看好友的動態,也可將圖片、照片和生活感悟發送的朋友圈同好友分享,這種強關系的社交網絡,導致其間蘊涵的關系資源在一次受攻擊后受到連帶泄露。
三、微信大數據的安全保障
大數據的應用過程大致可以劃分為采集、存儲、挖掘、四個環節。我們也可以對微信大數據安全進行四個方面的考量。首先在微信大數據的采集環節,主要的安全問題存在于傳輸過程的安全保障。數據的采集是應用流程的源頭,要盡量避免數據的損壞、丟失、泄露等。采集環節的技術保障要完善身份認證、數據加密等安全機制。其次是微信大數據的存儲安全,價值的低密度是大數據的主要特征之一,而大數據的經濟價值在于其海量關聯信息帶來的連帶效果。這就要求微信大數據要具備生命周期長、頻繁使用等特征。在這個過程中要完善數據變換的隱私保護技術,讓攻擊者難以發現真實的原始數據。充分運用數據加密技術、匿名化等技術手段保障數據的存儲安全。第三,微信是以免費軟件服務為平臺,通過增值服務獲得利潤的商業模式。微信大數據挖掘是商家給用戶提供針對的基礎信息。在挖掘信息價值的過程中,如果引入第三方挖掘需要進行數據挖掘者的身份驗證和訪問管理,保障系統程序不會遭到惡意程序的攻擊、侵入。最后,是大數據運用的最后環節,是輸出挖掘結果,實現挖掘價值得出口環節。數據需要符合安全審計的規范以達到穩定、可靠、可用的標準。
參考文獻:
[1]張尼、張云勇.大數據安全技術與應用[M].北京:人民郵電出版社,2014.
[2]王帥、汪來富、金華敏、沈軍.網絡安全分析中的大數據技術應用[J].電信科學,2015(7).
[3]余秀才.微博輿情研究中的大數據風險與挑戰[J].華中科技大學學報,2015(5).
[4]車凱、龍鐵茜.國內外社交網絡(SNS)大數據應用比較研究——以Facebook和騰訊為例[J].圖書館學研究,2014(7).
記者在甲骨文于3月22日在北京召開的甲骨文存儲峰會上了解到,在企業面臨著信息量增長所帶來的存儲成本不斷增高、存儲耗電攀升、數據重用性不斷減小等一系列挑戰的今天,分層存儲策略將越來越被受到關注,磁帶作為分層存儲的組成部分,將發揮非常重要的作用。
信息爆炸帶來的挑戰
來自甲骨文的資料稱,在信息量飛速增長的今天,信息存儲面臨著前所未有的挑戰:數據類型日益多元化,其中80%以上的數據為非結構化數據;數據重用性不斷減小,80%的數據在90天后永不再使用;歸檔需求不斷增加,68%的公司要求100年的歸檔時間;存儲管理成本更高,如果任其發展,存儲成本將達到總IT預算的30%;存儲耗電大約為數據中心耗電的40%,并以20%的復合年增長率增長。
面對這些挑戰,分層存儲應運而生。所謂分層存儲,就是將不同價值的數據采取不同級別的存儲設備保存:將經常使用的、對讀取速度要求最高的數據存在閃存上,將容量大、不經常使用的數據存在磁帶上,將其他數據存在磁盤上。這樣就避免了所有數據都保存在企業花高額費用購買的高速讀寫存儲介質上,而非像以往的存儲解決方案那樣是將所有數據視作同等重要、同等有用來進行處理,集成到單一的存儲體系中。在醫療保健、國防、氣象、廣播電視等數據量巨大的領域,分層存儲的需求尤其旺盛。
比如說,隨著三網合一的技術的發展,如果客戶要調出1000部電影進行在線媒體播放,這需要占用很多存儲空間。但是如果客戶把一部分電影(馬上要播放的內容)存在磁盤上,一部分存在磁帶上,就可以毫無障礙地把電影看完。
解決方案很重要
對用戶來說,采用分層存儲解決方案將帶來一個新的挑戰,那就是到底什么樣的數據存儲在閃存、磁盤或磁帶上。
甲骨文公司亞太區存儲業務副總裁Chee Beng Ong表示,分層存儲解決方案的部署需要先提需求、搭架構、測試,要幾個月時間才能完成。
Chee Beng Ong表示:“很長一段時間人們都是使用分層存儲來優化成本,但是這些往往是要通過手動來完成的。現階段,甲骨文通過提供允許某些情況下沒有管理員進行干預以轉移到成本較低的存儲層的機制來優化結構化與非結構化的數據。通過這些方式,我們可以大幅提高業務就緒存儲系統的能力,來為客戶提供更為行之有效的存儲服務。”
關鍵詞:數據倉庫;電子政務
中圖分類號:TP393文獻標識碼:A文章編號:1009-3044(2007)18-31509-02
Research of e-government Based on Data Warehouse Model
LI Zhen-hua
(Zhejiang Vocational College of Commerce, Hangzhou 310053, China)
Abstract:As the development of IT, e-government has become the hot task. Data warehouse is one of important technology. This thesis primary research of e-government based on data warehouse model.
Key words:data warehouse; e-government
1 引言
電子政務位于世界各國積極倡導的“信息高速公路”――電子政務、電子商務、遠程教育、遠程醫療、電子娛樂五個領域之首。政府信息化是社會信息化的基礎。
電子政務系統建設的主要內容是“三網一庫”。電子政務中較為復雜的是具有公開化、透明化、數據化以及科學化的特點的決策支持系統。最為引人注目的是建立分析環境,對積累的數據進行再加工,以支持政府的科學決策。
2 電子政務需要數據倉庫
電子政務的內容非常廣泛,它的應用技術也比較多。根據服務對象的不同,電子政務主要包括以下四種模式:政府與政府的電子政務(G to G),政府與企業的電子政務(G to B),政府與公眾的電子政務(G to C),政府與公務員的電子政務(G to E)。在實際應用過程中,經過不斷的積累,數據倉庫中的數據越來越多。如何從這些大量數據中有效地提取有用的數據信息,是目前亟需解決的一個問題。
電子政務系統需要的不是簡單的數據信息的直觀羅列,而是需要一種對工作具有指導意義和幫助意義上的數據信息,基本要求如下:
(1)對復雜的動態社會環境作出及時響應,要求在大量的數據中找出有價值的信息和情報作為決策時參考的依據;
(2)在決策過程中,一旦需要,決策人員可以很快得到方方面面詳盡的信息和情報支持,包括歷史的、當前的、未來的各種信息和情報資源;
(3)支持對分布在不同地點的數據或信息進行調閱操作,包括內部、外部或遠程的數據和信息;
(4)支持對不同類型和格式的數據或信息進行操作,包括結構化、半結構化、非結構化的信息類型;
(5)更多的政府主管領導和職能部門的輔助決策需要數據信息的支持;
(6)要求信息資源能實現充分共享與快速交流。
在電子政務中可進行數據挖掘:通過運用數據挖掘的聚類分析可以自動發現在電子政務服務器以及瀏覽器日志記錄上的數據信息中包含著的系統的訪問模式和應用的行為模式,從而進行預測分析;通過運用文本數據挖掘及多媒體數據庫挖掘改進搜索引擎的算法,提高網絡數據信息的準確度和精確度,從而改善檢索效果等。
基于數據倉庫模型電子政務能夠將其內部分散的、跨平臺的數據重新組合與加工,建立數據倉庫的最終目標是建立一個較全面、完整的信息應用平臺,進行數據分析和數據挖掘,支持政府的決策分析。
3 建立基于數據倉庫模型的電子政務
根據以下擬定切實可行的基于數據倉庫模型電子政務的電子政務系統:
3.1 建設基于數據倉庫模型的電子政務系統
對于數據倉庫的模型,可選擇采用DB(源數據庫)―ODS(操作數據存儲)―DW(數據倉庫)與DB(源數據庫)―DW(數據倉庫)兩種模式。
基于操作數據存儲(ODS)的政務系統是基于數據倉庫所提出的面向主題的、全局一致的數據環境概念,為電子政務建設提供多層次的信息處理環境,并建立起DB―ODS―DW三層體系結構。
ODS作為一個中間件,一方面包含全局一致的、細節的、當前的或接近當前的數據,可以進行全局聯機操作型處理;另一方面,它是一種面向主題的、集成的數據環境,而且數據量小,適合于輔助完成日常決策的數據分析處理。
在DB―ODS體系結構中,ODS的實現機制表現在記錄系統定義的數據傳送關系上,操作型環境中各分散的DB記錄經過過濾后形成了ODS系統的記錄系統,向ODS系統中提供數據。記錄系統定義了原有分散DB中那些數據送到ODS,并且指明與ODS數據相應的數據表。通過ODS的定義可以把分散于應用的DB中的數據復制到ODS中去,這樣原來的分散DB中的記錄就形成了ODS中的面向主題的記錄。
DB(源數據庫)―ODS(操作數據存儲)―DW(數據倉庫)與DB(源數據庫)―DW(數據倉庫)兩種數據倉庫模式的差別在于:操作數據存儲的數據量遠遠小于數據倉庫;操作數據存儲只保存細節數據,數據倉庫保存細節數據與綜合數據;操作數據存儲支持記錄更新,數據倉庫支持裝入與存取;操作數據存儲用于即時決策,數據倉庫用于長期趨勢分析或戰略決策。
3.2 應用系統的業務流程重組改造
信息技術和業務流程重組改造等業務改革方法相結合后,使得政府效率得到突飛猛進的提高。流程再造把大量信息沿著電子政務邏輯相關的思路演繹、設計和應用得盡善盡美,這才使得電子政務在服務、速度等方面取得顯著甚至根本性的改善。對政府行政部門來說,業務程序的改善,業務本身廢棄的重新評估加上信息技術的應用,不僅提高了業務效率,還減輕了政府職員制作資料數據的業務負擔,數據資源和局域網實現充分共享。
同時還要設置系統的高安全性。大量信息關聯管理對于政府來說,安全性是主要的性能指標之一。大信息平臺必須整合最好的安全方案提供平臺的安全服務。包括了用戶標識與鑒別、存取控制、審計、數據加密、傳輸加密、服務器安全等。
電子政務數據倉庫建立在元數據數據庫、文檔和多媒體數據庫、面向主題操作數據庫等一系列政務資源數據庫基礎上,為實體政府實行全社會的電子化管理提供政務信息數據資源的采集、分析、管理、挖掘和決策支持。
4 結束語
總體上,建設基于數據倉庫的電子政務將為政府帶來如下的好處:為政府機關提供一個信息獲取的平臺;為政府機關提供統一的信息源;數據倉庫解決方案,不僅從功能上,而且在實現的過程中,都能適應相關決策人員需求的不斷變化;為政府的各種決策分析系統提供基礎的數據平臺。
電子政務資源庫建立的最終目的是為政府提供各類決策分析應用,而不是簡單的數據累積。從近期看,可以建立管理系統的構建基地――數據倉庫。從遠期考慮,可以建立完整的管理分析應用系統。
參考文獻:
[1] 劉紅璐,張真繼,彭志鋒. 電子政務系統概論[M]. 北京:人民郵電出版社,2005.4.