【中培課堂】海量涌現(xiàn)的數(shù)據(jù)處理工具和強(qiáng)大的功能保障了大數(shù)據(jù)分析可能性。然而,這個(gè)大數(shù)據(jù)領(lǐng)域往往伴隨著的是數(shù)據(jù)隱私方面的問(wèn)題。在這龐大的信息庫(kù)中,個(gè)人身份信息,如姓名、地址和社保號(hào)碼可能存在,也可能從這.....
Dataguise,數(shù)據(jù)安全情報(bào)和保護(hù)解決方案的領(lǐng)先廠商,最近發(fā)布了在Hadoop中保護(hù)敏感數(shù)據(jù)安全的十種最佳實(shí)踐。專業(yè)人員可以通過(guò)遵循這些規(guī)則,為企業(yè)數(shù)據(jù)管理和安全管理保駕護(hù)航。
海量涌現(xiàn)的數(shù)據(jù)處理工具和強(qiáng)大的功能保障了大數(shù)據(jù)分析可能性。然而,這個(gè)大數(shù)據(jù)領(lǐng)域往往伴隨著的是數(shù)據(jù)隱私方面的問(wèn)題。在這龐大的信息庫(kù)中,個(gè)人身份信息,如姓名、地址和社保號(hào)碼可能存在,也可能從這些數(shù)據(jù)中發(fā)現(xiàn)大量的財(cái)務(wù)數(shù)據(jù),如信用卡和帳戶號(hào)碼,只有通過(guò)精心策劃、測(cè)試及使用前的準(zhǔn)備工作,并適當(dāng)使用技術(shù),才可緩解這些擔(dān)憂。
以下是在Hadoop中保護(hù)敏感數(shù)據(jù)安全的十種最佳實(shí)踐,這在早期規(guī)劃階段尤其重要。
1.在規(guī)劃階段確定數(shù)據(jù)的隱私保護(hù)策略,最好是在將數(shù)據(jù)遷移到Hadoop之前。這可以防止破壞數(shù)據(jù)的合規(guī)性,并避免了計(jì)劃的不可預(yù)測(cè)性。
2.確定哪些數(shù)據(jù)元素的定義在組織內(nèi)是敏感的。考慮公司的隱私保護(hù)政策,相關(guān)的行業(yè)法規(guī)和政府規(guī)章。
3.瀏覽敏感的數(shù)據(jù)是否被嵌入到環(huán)境中,收集了或?qū)⒈皇占紿adoop。
4.在收集的基礎(chǔ)數(shù)據(jù)中判斷數(shù)據(jù)的合規(guī)風(fēng)險(xiǎn)。
5.確定商業(yè)分析是否需要訪問(wèn)真實(shí)數(shù)據(jù),或者是否可以使用脫敏數(shù)據(jù)(去掉敏感數(shù)據(jù)的數(shù)據(jù)),然后,選擇合適的修復(fù)技術(shù)(掩蔽或加密)。如有疑問(wèn),請(qǐng)記住,從長(zhǎng)遠(yuǎn)看,掩蔽提供了最安全的數(shù)據(jù)修復(fù)方式,加密賦予了數(shù)據(jù)最大的靈活性。
6.如果需要分區(qū)存儲(chǔ)正常數(shù)據(jù)和脫敏數(shù)據(jù),需要考慮支持相應(yīng)功能的數(shù)據(jù)保護(hù)解決方案。
7.確保掩蔽措施所做的數(shù)據(jù)保護(hù)技術(shù)實(shí)現(xiàn)跨越所有的數(shù)據(jù)文件,保護(hù)數(shù)據(jù)分析的準(zhǔn)備性。
8.確定是否需要為特定的數(shù)據(jù)集量身定制保護(hù)措施,并考慮將Hadoop拆分成小的管理單元,數(shù)據(jù)安全的保護(hù)也落實(shí)到各管理單元。
9.確保選擇的加密解決方案可與公司的訪問(wèn)控制技術(shù)對(duì)接,允許用戶使用不同的id有選擇性的在Hadoop集群中的數(shù)據(jù)訪問(wèn)。
10.確保需要加密時(shí),適當(dāng)?shù)募夹g(shù)(JAVA,豬等)部署為允許無(wú)縫解密,并確保數(shù)據(jù)的快速訪問(wèn)。