——大數據滲透到各個行業領域,逐漸成爲一種生產要素髮揮着重要作用,成爲未來競爭的制高點。
在大數據時代下,信息和數據的分析處理都會變得比以前更加繁雜,管理起來也更加麻煩。大數據發展仍舊面臨着衆多問題,最受大衆關注的就是安全與隱私問題——大數據在收集、存儲和使用的過程中,都面臨着一定的安全風險,一旦大數據產生隱私泄露的情況,會對用戶的安全性造成嚴重威脅。
Hadoop是什麼?
Hadoop是一個開發和運行處理大規模數據的軟件平臺,是Apache的一個用java語言實現開源軟件框架,實現在大量計算機組成的集羣中對海量數據進行分佈式計算,是目前市場上最受歡迎的一種大數據解決方案之一。
(Hadoop架構業務及審計邏輯)
Hadoop 由許多元素構成,其核心是分佈式文件系統(HDFS)和MapReduce 引擎,並涵蓋衆多提供Hadoop應用的子項目,如:數據倉庫工具(HIVE)、NOSQL數據庫(HBASE)、大數據分析平臺(PIG,爲用戶提供多種接口)等以及衆多的編程接口。
Hadoop架構下數據庫的審計難在哪裏?
爲了滿足Hadoop架構下各種應用需求,引入了數據庫倉庫工具(HIVE)、非結構化數據庫(HBase)等子項目解決數據的處理分析與數據實時交互需求,同時爲了簡化Hadoop管理工作,HUE、Phoenix等UI工具也被引入協同工作。
各種多樣化的工具帶來最直接的問題便是多樣化的程序設計語言,多樣性的程序編程接口,增大了大數據安全審計覆蓋面,增強了大數據的數據解析難度。因此,在Hadoop大數據架構環境下要實現有效審計,必須同時對各種UI管理界面、編程接口同時審計,具備Hadoop架構各種協議解析、編程語言解析能力。
其審計難點可總結爲:
1、Hadoop大數據非結構化數據(NO SQL),傳統方案無法實現此類數據的綜合安全監控;
2、Hadoop中數據庫連接工具的多樣化,傳統方案只能對典型的C/S客戶端訪問方式進行安全監控,缺乏綜合管理手段;
3、Hadoop開放的接口和平臺,加之信息網絡共享導致數據風險點增加,竊密、泄密渠道增加;
4、安全模型和配置的複雜性導致數據流量複雜化。
更多數據庫審計內容詳見商業新知-數據庫審計