數據治理是企業(yè)對數據資產管理行使權力和控制的活動集合(包括計劃、監(jiān)督和執(zhí)行 ),它是管理企業(yè)數據資源的一種方式、方法,旨在確保數據的質量、安全、合規(guī)和有效性。數據治理是企業(yè)實現數據戰(zhàn)略的基礎,是一個管理體系,包括組織、制度、流程和工具。
數據的生命周期包含了源頭、處理和消費這三個階段,數據的問題也可能會出現在這三個環(huán)節(jié)中。例如在數據源頭環(huán)節(jié),用戶錄入數據的規(guī)范性存在問題,導致了最終數據消費環(huán)節(jié)的數據質量低。數據表象問題的根源,可能來自于業(yè)務系統(tǒng)用戶交互設計,乃至是底層數據庫表結構設計上的缺陷。
而要想解決這些表象的數據問題,就必須解決深層次的信息化業(yè)務系統(tǒng)開發(fā)以及數據庫表約束設計等問題。例如為了保證用戶錄入數據的準確性,有三種方式去設計業(yè)務系統(tǒng):其一是設計前端的檢驗驗證,避免用戶做出相同的選擇;其二是通過程序編寫過濾判斷的邏輯,篩除掉前端誤入的數據,作為第二層驗證;其三是通過建立約束條件,例如唯一性約束、檢測約束等等來控制數據錄入準確性。
因此,企業(yè)的數據治理遠非使用一款單一的工具或產品就可以實現的,它是需要回到源頭,對企業(yè)的組織、流程制度、業(yè)務系統(tǒng)、底層架構等多個方面進行排查和重構的,它是一套復雜的管理體系。