Hadoop教程:Hadoop安全部署經驗總結
通過Hadoop安全部署經驗總結以下十大建議,以確保大型和復雜多樣環(huán)境下的數(shù)據(jù)信息安全。
- 先下手為強!在規(guī)劃部署階段就確定數(shù)據(jù)的隱私保護策略,最好是在將數(shù)據(jù)放入到Hadoop之前就確定好保護策略。
- 確定哪些數(shù)據(jù)屬于企業(yè)的敏感數(shù)據(jù)。根據(jù)公司的隱私保護政策,以及相關的行業(yè)法規(guī)和政府規(guī)章來綜合確定。
- 及時發(fā)現(xiàn)敏感數(shù)據(jù)是否暴露在外,或者是否導入到Hadoop中。
- 搜集信息并決定是否暴露出安全風險。
- 確定商業(yè)分析是否需要訪問真實數(shù)據(jù),或者確定是否可以使用這些敏感數(shù)據(jù)。然后,選擇合適的加密技術。如果有任何疑問,對其進行加密隱藏處理,同時提供最安全的加密技術和靈活的應對策略,以適應未來需求的發(fā)展。
- 確保數(shù)據(jù)保護方案同時采用了隱藏和加密技術,尤其是如果我們需要將敏感數(shù)據(jù)在Hadoop中保持獨立的話。
- 確保數(shù)據(jù)保護方案適用于所有的數(shù)據(jù)文件,以保存在數(shù)據(jù)匯總中實現(xiàn)數(shù)據(jù)分析的準確性。
- 確定是否需要為特定的數(shù)據(jù)集量身定制保護方案,并考慮將Hadoop的目錄分成較小的更為安全的組。
- 確保選擇的加密解決方案可與公司的訪問控制技術互操作,允許不同用戶可以有選擇性地訪問Hadoop集群中的數(shù)據(jù)。
- 確保需要加密的時候有合適的技術(比如Java、Pig等)可被部署并支持無縫解密和快速訪問數(shù)據(jù)。
來源:大數(shù)據(jù)研究