民革中央網站>>團結雜志>>往期目錄文章庫>>2018>>2018第三期
大數據風險與防控     呂海霞 王宇霞 何明智    2018年08月27日09:25

         數據是國家基礎性戰略資源,是21世紀的“鑽石礦”。 隨著大數據的快速發展和融合創新,大數據正成為全球范圍內加速企業技術創新、推動傳統產業轉型升級和生產方式變革、促進政府職能轉變、引領社會管理變革的利器。同時,隨著大數據與各領域廣泛深入融合滲透,大數據安全事件頻頻發生,大數據安全已上升為關系到個人安全、經濟安全、社會安全和國家安全的關鍵領域,加強大數據風險防控迫在眉睫。

  一、大數據的內涵和主要特征

  (一)大數據的內涵

  大數據是一種針對數據的分析處理應用,目的是在數據量爆發性增長的背景下,能夠使用一定技術手段,從龐雜數據中挖掘出有用信息,實現對海量數據的有效利用。當前,大數據尚未形成統一的定義,各個機構對大數據都有自身的理解。雖然“大數據”直接代表的是數據集合這一靜態對象,但“大數據”並不僅僅是大規模數據集合本身,而應當是數據對象、技術與應用三者的統一。從對象角度看,大數據是大小超出典型數據庫軟件採集、儲存、管理和分析等能力的數據集合。從技術角度看,大數據是從各種各樣類型的大數據中,快速獲得有價值信息的技術及其集成。從應用角度看,大數據是對特定的大數據集合集成應用大數據技術獲得有價值信息的行為。

  (二)大數據的特征

  綜合業界的多種理解,可以從體量、類型、速度、價值四個方面概括大數據的特征。

  體量大。體量大的表現之一是,大數據的容量規模可觀,不斷刷新量級單位,目前正從TB、PB級別躍升至EB、ZB級別。數據統計顯示,2011年全球數據總量達1.8ZB,並以每兩年翻一番的速度增長,預計到2020年全球數據總量將達40ZB,增長22倍。體量大的另一表現是,大數據的數據條數可觀,數以億計已成為常態。如臉譜(Facebook)每月要共享300億條信息,百度每天要收集幾千億個網頁。

  類型多。若數據僅是文本等常規數據,即使體量大,對分析處理能力的要求也未必高。之所以出現新的技術需求,是因為大數據中包含著多種類型的數據,主要包括結構化數據、半結構化數據和非結構化數據。隨著微博、社交網等互聯網應用以及娛樂、媒體、醫療保健的快速發展,圖像、音頻、視頻等非結構化數據大量涌現。

  速度快。大數據體量大、類型多,處理相對困難、耗時﹔但由於大數據應用與決策緊密相關,又需要迅速的提供分析結構,包括數據創建、處理和分析的數據持續在加快。所以,對數據的採集與分析的執行速度日益趨近時,線性搜索、事后分析等技術已無法適應大數據處理要求。

  價值不定。大數據的價值特征有著辨証的兩個方面。對於待分析處理的大對象整體而言,其數據價值密度低。以視頻為例,敏感地點安裝的攝像頭24小時運轉,會產生大量視頻數據,這些視頻數據非常枯燥、乏味,可能有用的數據僅僅有一兩秒。但對由大數據分析處理得到的結果而言,其數據價值密度相當地高。

  二、大數據應用現狀

  當前,大數據在各行業的全面深度滲透,應用場景的不斷豐富,有力地促進著產業格局重構,驅動生產方式和管理模式變革,推動制造業向網絡化、數字化和智能化方向發展。

  在政務領域,我國不斷加強大數據在政府治理和社會服務領域的應用,整合宏觀調控、稅收監管、商事管理、信用體系建設、維穩、公共安全等數據資源,加快數據共享開放,提升政府治理能力。例如中興智慧政務解決方案,通過智慧銀川項目建立了十個數據系統,形成13個子模塊,涵蓋了智慧政務、智慧環保、智慧交通、智慧安全、智慧醫療、智慧社區、智慧旅游等多個方面,進行數據匯集、整合、分析挖掘,進行整合最終達到輔助政府科學決策的目標。

  在工業領域,通過運用大數據技術對工業企業產生的海量數據進行分析挖掘,得到有價值的分析結果,實現工業與信息技術的融合創新發展不斷深入。例如東方國信打造BIOP工業大數據平台,具備數據實時採集、數據整合處理等功能,可以實現從設備端到服務端的無縫銜接,通過整合現有生產端的 MES、ERP、CPS等實時數據,統一匯總分析,提供實時監控、生產管理等多種生產運行管理的服務。

  在金融領域,我國積極推動大數據等信息技術在金融行業的廣泛應用,培育發展了一批以網商銀行為代表的新業態、新模式,推動金融產業不斷轉型升級,引領我國金融產業快速發展。例如,百度開放大數據風控平台“般若”,實現信貸業務流程全覆蓋,利用央行征信數據和百度數據將客戶群的風險區分度提升13%,並大幅提升識別騙貸團伙的成功率。

  在商貿領域,在電商企業的帶動下,越來越多零售商將大數據技術應用到商業模式中,降低管理費用的同時擴大業務范圍。電子商務平台、社交網絡、移動終端、傳感設備等應用的逐漸成熟,帶來了消費者數據的爆炸式增長,我國電子商務市場逐漸進入大數據時代,我國電商企業等依托自身已有的數據資源基礎,逐漸加大對大數據的挖掘、分析與應用,京東、阿裡等電商企業依托其各自的電子商務交易平台,拓展大數據在電子商務領域的應用價值。

  在醫療健康領域,國家持續引領提升醫療大數據發展基礎環境,各地政府積極制定健康醫療大數據應用及推動產業園建設國家試點,我國醫療大數據發展環境不斷優化。2018年1月4日,國家衛生計生委官網正式發布《關於印發進一步改善醫療服務行動計劃(2018-2020年)的通知》,提出自2018年起,醫療機構要建立預約診療制度、遠程醫療制度、臨床路徑管理制度、檢查檢驗結果互認制度、醫務社工和志願者制度。在此之前,2017年,國家衛計委批復了32家委屬(管)醫院的信息化建設項目建議書,預計總投入43451萬元,管理信息大數據、臨床信息大數據、院內信息大數據、區域醫療資源大數據、醫藥大數據等領域引領醫療健康大數據快速發展。

  在電信領域,電信行業由於數據積累量巨大而成為大數據技術應用的重要領域,其發展可以優化基礎設施建設和管理,幫助電信運營商實現精准營銷,強化業務運營監控和經營分析預測,推動電信大數據的商業化發展。當前,我國大數據應用市場需求不斷增長,大數據相關產業技術不斷成熟,電信大數據應用正處於快速發展期,呈現蓬勃發展態勢。

  三、大數據的主要發展趨勢

  (一)產業將繼續保持快速增長態勢

  隨著新一代信息技術產業加速變革,經濟社會各領域信息網絡化程度不斷加深,國內旺盛的應用需求和巨大的市場空間將為大數據創新提供強大驅動力,我國大數據產業發展將繼續保持高速增長勢頭,預計大數據核心產業規模將突破5700億元,未來2-3年市場規模的增長率仍將保持35%左右。與此同時,隨著我國大數據產業進入黃金發展期,企業主體的整體實力將大幅提升,產業鏈條將更加完善,並且產業鏈各環節企業布局將更趨合理,產業鏈協同能力將進一步增強。

  (二)融合滲透效應向更深層次延伸

  大數據的融合滲透效應將進一步凸顯,在全球生產、流通、分配、消費以及經濟運行機制、社會生活方式和國家治理能力等各個方面的應用將向更深層次拓展。大數據與集成電路、基礎軟件、核心元器件、新一代人工智能等領域的融合應用和集成創新不斷加快。基於大數據的數字化生產、數字化制造、數字化服務等新業態不斷涌現,成為推動數字經濟發展的主動能。同時,大數據的技術與人工智能、區塊鏈、邊緣計算等技術的聯系將更加緊密,融合創新業態不斷涌現。

  (三)工業大數據成為智能制造的切入點

  隨著智能制造深入實施,我國工業大數據相關核心技術、產品和解決方案的研發與產業化步伐將進一步加快,裝備制造、航空航天、船舶等重點行業領域的大企業工業大數據平台以及面向中小企業的工業大數據服務平台建設工作將快速推進,國家層面和地方層面的工業大數據試點示范工作將全面開展,工業大數據龍頭骨干企業和創新型中小企業的服務供給能力將不斷提升,以大數據驅動制造業數字化轉型的新模式、新業態將不斷涌現,大數據在制造業數字化轉型中的核心引擎作用不斷強化。

  (四)產業生態體系加快完善

  大數據相關政策將加快落地實施,更多創新性政策將加快出台,大數據產業發展環境將進一步優化。國家大數據綜合試驗區建設不斷深入,我國大數據產業特色化發展態勢將日益凸顯,進一步優化資源配置、形成集聚效應、發揮輻射帶動作用。隨著大數據公共服務機構以及大數據專業服務機構不斷發展,面向大數據領域的軟服務能力將不斷提升。此外,隨著投入力度的不斷加大,標准體系建設、創新型組織建設、大數據人才培養也將取得較大進展,大數據產業生態體系將逐步邁入成熟完善階段。

  四、發達國家大數據發展實踐

  (一)制定國家大數據戰略

  美國、歐盟、日本等發達國家紛紛將大數據發展上升為國家戰略,從國家戰略的高度推進大數據發展。美國率先把大數據上升為國家戰略,2012-2016年共實施了四輪政策行動,成立“大數據高級指導小組”,實施“聯邦大數據研究與開發計劃”,加強在大數據研發和應用方面的布局。歐盟力推《數據價值鏈戰略計劃》,推出了“數據驅動的經濟”戰略。日本發布《創建最尖端IT國家宣言》,將實施數據開放、大數據技術開發與運用作為2013-2020年的重要國家戰略之一。

  (二)推動數據開放共享

  推進數據開放共享是實施大數據戰略的基礎和核心。自2009年美國政府開放數據門戶網站data.gov上線以來,各國政府掀起開放數據運動。截至目前,已有英國、法國、加拿大、澳大利亞等50多個國家和地區相繼建立了政府數據開放網站平台。根據開放政府伙伴計劃(Open Government Partnership)的記錄,目前全球共有超過60個國家加入了伙伴計劃,而作為伙伴計劃成員,其中一項需要承諾的便是開放政府數據。

  (三)強化技術研發創新

  美國、歐盟、日本等發達國家紛紛將大數據技術創新作為制高點,加大力度進行大數據科技研發項目的投入。美國政府投資2億美元提高大數據分析的技術與工具,重點資助大數據核心技術研發(包括數據的儲存、分析、收集)。英國注資6億英鎊發展8類高新技術,發展大數據技術資金達1.89億英鎊。韓國投入6444億韓元,推進大數據及相關產業發展。

  (四)促進驅動大數據創新應用

  大數據應用是催生需求和產業發展的驅動力,各國政府高度重視並積極推動大數據的應用。美國在公共政策、輿情監控、犯罪預測、反恐等領域依據大數據分析輔助決策,以大數據應用增強社會服務能力。英國積極促進大數據技術從科研向應用領域轉化,支持大數據在醫療、農業、商業、學術研究領域的應用。法國經濟、財政和工業部通過投資政府項目,促進法國在大數據應用領域的發展。

  (五)加強數據安全防護和數據主權維護

  美國在進行外資安全審查之后,要求簽署“安全協議”,規定“禁止外資通信公司將用戶的通信數據和個人數據存儲在境外”,並採用商用軟件程序監視網絡流量。歐盟施行《通用個人數據保護條例》(GDPR),明確禁止向尚未建立充分的數據隱私保護法律的國家傳輸數據。英國建立數據開放的隱私保護程序,強制要求所有政府部門在數據開放全流程中開展隱私影響評估。俄羅斯《數據本地化法》要求數據運營商在線上或線下收集俄羅斯公民的個人資料時有義務確保該等資料在俄羅斯領域內數據庫中的記錄、系統化、積累、存儲、更新、變更和檢索。

  五、大數據發展存在的問題

  (一)數據資源開放共享程度仍然較低

  雖然國家層面和地方層面均出台了推動數據資源開放共享的相關政策,並將推動政府數據、公共數據集聚與開放共享作為主要任務,但目前我國各級部門數據資源開放共享程度依然較低。一是由於信息系統分散獨立以及信息技術能力欠缺。目前各級、各部門、各行業各行其是、條塊分割的現象仍然大量存在,政府各個部門之間多套信息系統同時並行,互相之間信息資源無法共享的“信息孤島”現象仍然突出。二是由於數據共享開放的法律法規體系不完善、流程不規范、責任主體不明確等問題導致的政府和社會企業對數據資源“不敢開”、“不想開”、“不會開”等問題依然存在。三是開放的數據資源也存在質量不高,可機讀性、完整性等較差,交易流通不暢等問題。

  (二)技術創新對產業發展的引領作用仍然不強

  目前我國在新型計算平台、分布式計算架構、大數據處理、分析和呈現等方面技術水平與國外仍存在較大差距,在前瞻性技術研發方面仍處於跟隨狀態,技術創新對於大數據產業的引領作用仍然不強。一是國內企業對大數據核心技術和生態系統影響力總體較弱,如商用數據庫等主流產品市場仍由國外企業主導。二是大多數大數據企業的創新仍以模仿性、漸進性創新為主,突破性、顛覆性創新偏少,自主研發具有國際影響力的先進技術較少。三是企業、科研機構、高校之間尚未建立起知識創新、技術研發和成果轉化密切結合的有效機制,產學研用的渠道尚未徹底打通。

  (三)助推數字轉型程度亟待提升

  大數據向經濟社會各領域的融合滲透不斷加快,但目前仍存在應用范圍不廣、應用層次不深等問題,大數據在助推經濟社會數字化轉型的支撐能力仍有待提升。一是部分制造業企業信息化、數字化水平仍有待提升,數據採集、分析、處理能力較弱,大數據在制造業數字化轉型中的作用不能充分發揮。二是面向農業、服務業等領域的大數據軟硬件產品和解決方案供給能力仍有待提升,應用模式、商業模式、服務模式有待探索,參與主體有待進一步集聚。三是大數據在助推政府決策科學化、社會治理精准化、公共服務高效化方面的效能尚未充分釋放,以數據流動和處理為紐帶與核心的跨層級、跨地域、跨系統、跨部門、跨業務的協同管理和服務體系尚不完善,政企合作、多方參與的社會治理格局尚未形成。

  (四)產業統計和標准體系急需構建

  大數據作為戰略新興產業,傳統的國民經濟統計體系已經無法覆蓋和准確衡量其產業發展水平,工業和信息化部制定的軟件與信息技術服務業統計體系中亦缺少專門衡量其產業發展水平的統計指標,適合大數據產業的精確統計標准和測算方法急需制定。此外,雖然我國早在2014年12月就成立了全國信息技術標准化技術委員會大數據標准工作組,大數據標准工作也取得了諸多進展,但由於大數據發展速度快、涉及面廣、技術復雜,當前大數據標准化工作仍然面臨著諸多挑戰,大數據標准化工作仍需加強。

  六、大數據風險防控

  (一)大數據安全問題迫在眉睫

  隨著大數據廣泛深入發展,大數據安全已上升為關系到個人安全、經濟安全、社會安全和國家安全的關鍵領域。近年,大數據安全事件頻頻發生,為數據生命周期安全、個人隱私敏感數據安全、基礎設施安全等多個領域帶來挑戰。

  數據生命周期安全領域:大數據本身具有體量巨大、價值稀疏、類型多樣、分布協同等特征,為安全防護聚焦帶來困難。並且數據從產生到銷毀存在多個環節,每個環節都面臨著泄露、竊取、篡改等風險,防護能力薄弱的物聯網、路由器等數據採集和傳輸設備,集中存放和處理海量數據資源的雲計算數據中心,大數據開放共享和交易平台等均可能成為了安全攻擊的目標。

  個人隱私安全領域:伴隨著信息技術的廣泛應用,個人數據在交易、社交等過程中不斷被收集和利用,而由於仍無明確的個人數據獲取和使用規范,以及行之有效的個人敏感數據的安全防護手段,個人敏感數據仍然面臨著泄露、失真、篡改、非法利用等風險。據《中國網民權益保護調查報告2016》顯示,84%的網民感受到了由於個人信息泄露帶來的不良影響(過去一年網民因個人信息泄露等造成的總體經濟損失約為915億元)。

  基礎設施安全領域:國家重要網絡信息系統,重要工業控制系統,金融、能源、電力、通信等關系國計民生的重要行業領域的信息基礎設施中不斷產生、存儲並流轉著大量國家經濟、社會數據,這些數據的安全關系到國家的經濟安全、社會安全和國家安全。由於部分信息基礎設施自身安全防護能力薄弱等問題,導致國家關鍵信息基礎設施的數據安全問題依然嚴峻。

  (二)我國在大數據安全管理方面存在的問題

  雖然我國在加強大數據安全管理方面已經開展了一些工作,並取得了一定進展,但依然存在一些不可忽視的問題。一是數據安全管理與防護關鍵技術欠缺,安全可靠的數據存儲架構、存儲形式、訪問控制機制、傳輸控制協議、脫敏與匿名化技術、追溯取証技術等方面能力均存在不同程度的不足﹔二是法律法規體系有待完善,《中華人民共和國網絡安全法》作為基本上位法未對數據資源利用、數據安全管理作出細致規定,而分散在其他法律法規中的關於數據安全管理的條文適用性和操作性不強﹔三是支撐數據安全管理和數據資源利用的公共服務體系有待完善,面向大數據產品和服務的安全性、可靠性檢測認証等服務的支撐能力仍不強,大數據安全相關標准建設仍有待加強。

  (三)加強大數據風險防控的建議

  一是加強大數據安全相關技術研發及產業化。引導和扶持數據安全相關企業,重點加強對傳輸安全和SSL/VPN技術、數字加密和數據恢復技術、雲平台數據安全等數據安全防護專用技術,以及敏感數據審計識別技術、數據脫敏技術等敏感數據安全防護技術的研發及產業化。支持面向特定行業的大數據安全解決方案研發,推進大數據在重點行業領域的深入應用。二是繼續強化工業領域數據安全保障能力。加強工業企業和網絡安全企業深度合作,加強數據安全和防護,開展工控安全監測和預警工作,建立國家級工控信息安全保障中心,從生產安全、網絡安全和數據安全等多維度構筑工業企業的安全防線。三是重點提升對數據安全的產業支撐能力。加快面向工業、電信、互聯網領域的數據安全態勢感知和監測,加快制定大數據技術、產品、服務、安全以及數據質量、開放、共享、交易等關鍵標准,開展大數據服務可用性、可靠性、安全性和規模質量等方面的評估、評測認証等服務,加快推進數據安全相關法規條例研究和制定,推進數據安全相關聯盟、協會等中介組織建設,優化政產學研用合作模式,進一步完善大數據產業公共服務支撐體系。■

  (呂海霞,中國電子信息產業發展研究院副研究員﹔王宇霞、何明智,中國電子信息產業發展研究院助理研究員/責編 劉玉霞)

專題推薦

  • 民革十四屆三中全會
  • 孫中山與黃埔軍校——紀念黃埔軍校建校100周年學術研討會
  • 2024全國兩會民革參政議政專題
  • 新開局 新面貌 新作為聚焦民革十四屆二中全會
  • “凝心鑄魂強根基、團結奮進新征程”主題教育專題報道
  • 民革小小圖
  • 組織換屆