DG

Data Governance

What is Data Governance ?

Data Governance แปลเป็นไทยว่า การธรรมาภิบาลข้อมูล ซึ่งหมายถึง การกำหนดสิทธิ หน้าที่ และความรับผิดชอบของผู้มีส่วนได้ส่วนเสียในการบริหารจัดการข้อมูลทุกขั้นตอน เพื่อให้ได้มาและการนำไปใช้ข้อมูลของหน่วยงานภาครัฐ ถูกต้อง ครบถ้วน เป็นปัจจุบัน รักษาความเป็นส่วนบุคคล และเชื่อมโยงกันได้อย่างมีประสิทธิภาพ และมั่นคงปลอดภัย โดยใช้ ข้อมูลเป็นหลักในการขับเคลื่อนประเทศ

Why Data Governance ?

เพราะ Data ที่เกิดขึ้นในองค์กร มีความกระจัดกระจาย ทำให้ไม่สามารถเข้าถึงชุดข้อมูลเดียวกันได้ แม้จะอยู่ในองค์กรเดียวกัน ส่งผลให้องค์กรไม่สามารถนำ Data นั้นไปใช้ประโยชน์ได้อย่างเต็มที่ การมี Data Governance ก่อให้เกิดกฎระเบียบในการบริหารจัดการข้อมูลที่ชัดเจนขึ้น และยังช่วยลดความเสี่ยงในการเกิดข้อมูลซ้ำซ้อน ข้อมูลไม่มีคุณภาพ และการหวงแหนข้อมูลได้อีกด้วย

ผลลัพธ์ที่ได้จากการทำ Data Governance ไม่ใช่แค่เอกสารที่เป็นกฎระเบียบขององค์กรเท่านั้น แต่ต้องมีการปรับเปลี่ยนระบบ Infrastructure ใหม่เสียด้วย เพราะการเข้าถึงข้อมูล จะต้องโปร่งใส และมีการกำหนดสิทธิในการเข้าถึงข้อมูลอย่างชัดเจน ดังนั้นในท้ายที่สุดของการผลักดันโครงการ Data Governance จะเป็นการปรับเปลี่ยนวิธีการทำงานขององค์กรทั้งหมด เพื่อรองรับการทำงานแบบ Data-Driven Business นั่นเอง

DG.png

ประเด็นในการจัดการ Data Governance มีอะไรบ้าง ?

การจัดการ Data Governance จะครอบคุมในกรอบใหญ่ๆดังต่อไปนี้ Data Quality, Data Assurances, Security, Policy โดยอธิบายเพิ่มเติมได้ดังนี้

Data Governance life circle

1.Data Ownership Discovery
การระบุแหล่งที่มาของข้อมูลและผู้รับผิดชอบ โดยจะต้องชี้แจงรายละเอียดของการได้มาซึ่งข้อมูล เช่น กรอกข้อมูลในระบบใด มีรูปแบบการเก็บอย่างไร ฝ่ายใดเป็นผู้รับผิดชอบ หรือเป็นเจ้าของข้อมูล เป็นต้น

2.Data Policy and Risk Level
การระบุความเสี่ยงของข้อมูล และ กำหนดระดับความเป็นส่วนตัวของข้อมูล โดยสามารถแบ่งระดับความเสี่ยงเป็นระดับ เช่น ข้อมูลความลับ ข้อมูลสาธารณะ เพื่อใช้เป็นตัวบ่งชี้ในการบริหารข้อมูลด้านความปลอดภัย ซึ่งผู้กำหนดระดับความเสี่ยงของข้อมูลนี้ คือ หน่วยงานผู้รับผิดชอบข้อมูลโดยตรง

3.Data Proliferation
การระบุความเชื่อมโยงของการกำเนิด ใช้งาน และทำลายข้อมูล ในขั้นตอนนี้ จะเป็นการเขียน Flow เพื่อมองหาจุดเชื่อมโยงของข้อมูล เช่น ฝ่ายบัญชี ได้รับข้อมูลมาจากระบบ POS และระบบ ERP ซึ่งผู้รับผิดชอบกรอกข้อมูลใน ERP ประกอบไปด้วยส่วนหน้าร้าน ส่วนคลังสินค้า ส่วนขนส่ง และส่วนงานออกแบบผลิตภัณฑ์ เป็นต้น โดย Flow นี้ สามารถเขียนเป็นกล่องเชื่อมโยงอย่างง่าย โดยไม่จำเป็นต้องวาดเป็น ER-Diagram เพราะวัตถุประสงค์ของ Flow เพราะให้เห็นถึงการเชื่อมโยงข้อมูลกันในเชิงปฏิบัติ ดังนั้น คนที่เขียน Flow นี้ อาจจะไม่ใช่กลุ่มงาน IT แต่อาจเป็น Data Analyst หรือ ผู้มีหน้าที่รับผิดชอบโครงการ Data Governance ทั้งนี้ ผลลัพธ์ที่ได้จากการทำ Data Proliferation คือ การออกแบบโครงสร้างของข้อมูลใหม่ เพื่อให้สามารถนำข้อมูลไปใช้ที่ปลายทางได้อย่างมีประสิทธิภาพมากขึ้น โดยมีส่วนของการเชื่อมโยงข้อมูล (Data Integration), การทำความสะอาดข้อมูล (Data Cleansing) และการออกแบฐานข้อมูลใหม่ (Database Design) มาเกี่ยวข้องด้วย

4.Data Dictionary
การร่างเอกสารเพื่อระบุสถานะ การจัดเก็บข้อมูล ซึ่ง Data Dictionary เป็นพื้นฐานที่ทุกองค์กรควรจะมี เพราะเอกสารฉบับนี้ เป็นเอกสารที่บ่งบอกได้ว่า มีการเก็บข้อมูลอะไรเอาไว้ที่ไหนบ้าง อย่างไรก็ตาม ในแต่ละช่วงเวลา Data Dictionary จะมีการเปลี่ยนแปลงไป เป็นเพราะมีข้อมูลใหม่ๆ เข้ามาในระบบมากขึ้น ดังนั้นหน่วยงานที่มีหน้าที่จัดทำ และ Update เอกสาร Data Dictionary คือ หน่วยงาน IT หรือ Data Admin ทั้งนี้ ปัญหาขององค์กรใหญ่ที่มีการลงระบบมานาน พบว่า ไม่ได้มีการเก็บ Data Dictionary เอาไว้ และเมื่อระบบเป็นระบบใหญ่ ทำให้ยากต่อการสร้าง Data Dictionary ใหม่ อาจจะเป็นเพราะก่อนหน้านี้ Vendor ที่มาลงระบบไว้ ไม่ได้มอบ Data Dictionary ให้ก็เป็นได้ แต่เมื่อต้องดำเนินการในโครงการ Data Governance ก็เลี่ยงไม่ได้ที่จะต้องมี Data Dictionary เพราะจำเป็นจะต้องระบุความรับผิดชอบของข้อมูลนั่นเอง

5.Data Protection
การออกแบบช่องทางการป้องกันข้อมูล เป็นงานต่อเนื่องจากขั้นตอนที่ 2 และ 3 โดยในส่วนที่ 5 Data Protection นี้ จะเป็นการออกแบบระบบ ตามหลักความปลอดภัย หรือ Database Security ซึ่งกระบวนการนี้ จำเป็นต้องมีการ Review การออกแบบ Infrastructure ใหม่ทั้งหมด เพื่อรอบรับระดับความเสี่ยงของชุดข้อมูลแต่ละชุด ซึ่งในยุคก่อน จะมีการสร้าง Data Warehouse ที่เดียว และติดตั้งระบบ Security แบบเดียว แต่ในปัจจุบัน เนื่องจากการเข้าถึงข้อมูล ควรมีการบริหารจัดการที่ยืดหยุ่น และเปิดให้เข้าถึงได้ตามสิทธิ์ ทำให้การออกแบบ Data Warehouse ไม่จำเป็นต้องมีแค่ที่เดียวอีกต่อไป

6.Data Access and Authorization
การออกแบบระบบเพื่อให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ตามสิทธิ หรือ ขอ Request ข้อมูลได้จากผู้มีอำนาจในการอนุมัติสิทธิ เป็นการเปลี่ยนรูปแบบการทำงาน จากที่เมื่อก่อนการจะขอข้อมูลจะมีหน่วยงาน IT เป็นคนดึงข้อมูลให้ แต่หากมีการออกแบบระบบแบบใหม่ จะสามารถเปิดโอกาสให้ผู้ใช้งานสามารถเลือกใช้ข้อมูลได้ตามระดับของความเสี่ยงของข้อมูล ซึ่งหากข้อมูลมีความลับ หรือเป็นข้อมูลที่จำกัดสิทธิ์ ก็สามารถกรอกรายละเอียดการขอข้อมูลผ่านระบบได้ เพื่อส่งรายงานไปยังผู้อนุมัติได้โดยตรง ซึ่งระบบการขออนุมัตินี้ ทางหน่วยงาน IT จะเป็นผู้รับผิดชอบออกแบบระบบ และดูแลรักษาระบบ ซึ่งการมีระบบนี้ จะทำให้ข้อมูลทั้งหมด มีความโปร่งใส และเป็นแนวทางทางในการแก้ปัญหาการหวงแหนข้อมูลได้เป็นอย่างดี จะเห็นได้ว่า ทั้ง 6 ข้อนี้ จะมีทั้งส่วนการรับผิดชอบแบ่งออกเป็น ส่วนเจ้าของข้อมูล หน่วยงาน IT และผู้มีความต้องการใช้ข้อมูล ซึ่งการดำเนินโครงการ Data Governance ที่ดี ควรคำนึงถึงการนำไปใช้จริงให้ได้มากที่สุด ไม่ใช่แค่เป็นนโยบายในกระดาษ แต่จะต้องมีการออกแบบ Infrastructure ใหม่เสียงหมด เพื่อรองรับการเข้าถึงข้อมูลได้อย่างโปร่งใส

2.webp

เรียบเรียงเนื้อหาโดย Bhoomjit Bhoominath 05/12/2563

Reference