ปลดล็อก! Data Catalog ด้วยแพลตฟอร์มไทย

ปลดล็อก! Data Catalog ด้วยแพลตฟอร์มไทย

"Data" ปัจจัยสำคัญของภาคธุรกิจในโลกดิจิทัล ที่จะทำให้การทำงานขับเคลื่อนไปได้อย่างมีประสิทธิภาพ แล้วการบริการจัดการข้อมูลให้มีประสิทธิภาพควรจะประกอบด้วยปัจจัยใดบ้าง?

ในโลกดิจิทัล “ข้อมูล” เป็นปัจจัยสำคัญที่ช่วยในการตัดสินใจ แก้ปัญหา สร้างมูลค่าและศักยภาพในการแข่งขันให้กับองค์กร แต่ไม่ใช่ทุกข้อมูลที่จะมีคุณสมบัติอันดีเหล่านี้ หากไม่ได้รับการบริหารจัดการและดูแลอย่างมีประสิทธิภาพ ข้อมูลมหาศาลที่แต่ละองค์กรมีนั้นอาจสร้างปัญหา ภาระและเป็นอุปสรรคต่อการนำข้อมูลไปใช้ประโยชน์ได้ แม้จะเป็นข้อมูลภายในหน่วยงานเองก็ตาม

ปัจจุบัน การทำงานไม่ว่าองค์กรรัฐหรือเอกชน สิ่งสำคัญที่จะทำให้การทำงานขับเคลื่อนไปได้อย่างมีประสิทธิภาพ ต้องอาศัย “ข้อมูล” เพื่อช่วยให้ตัดสินใจได้อย่างถูกต้องแม่นยำ การค้นหาข้อมูลจึงกลายเป็นจุดเริ่มต้นของกระบวนการทำงานหลายๆ อย่างในองค์กร แม้ข้อมูลที่ค้นหาและเข้าถึงได้ง่ายที่สุดคือข้อมูลของหน่วยงานเราเอง แต่บางครั้งอาจเกิดคำถามตามมามากมายว่าข้อมูลที่ต้องการเก็บอยู่ที่ไหน ถ้าข้อมูลทุกอย่างถูกเก็บรวมกันเต็มไปหมด แล้วเราจะนำมาใช้ประโยชน์ได้อย่างไร

หรือถ้าข้อมูลเราไม่เพียงพอ ต้องการข้อมูลจากหน่วยงานอื่น ในทางกลับกันหน่วยงานอื่นก็อาจจะต้องการข้อมูลจากเราเช่นกัน แล้วข้อมูลของเรามีอะไรเปิดเผยได้ อะไรเปิดเผยไม่ได้ ถ้าเปิดเผยไปแล้วจะมีความผิดหรือไม่ ใครเข้าถึงข้อมูลได้บ้าง สิ่งเหล่านี้เป็นปัญหาที่เกิดขึ้นในยุคที่แต่ละวินาทีมีข้อมูลเกิดขึ้นอย่างมากมายมหาศาล เราจึงต้องมีการบริหารจัดการข้อมูลที่ดีและมีประสิทธิภาพ เพื่อใช้ประโยชน์จากข้อมูลได้อย่างเต็มที่

  • 3 ส่วนสำคัญเพื่อบริหารจัดการข้อมูลอย่างมีประสิทธิภาพ

การบริหารจัดการข้อมูลอย่างมีประสิทธิภาพเปรียบเสมือนการตอบคำถามเกี่ยวกับข้อมูลในหน่วยงาน ที่ในอดีตอาจตอบได้ยาก โดยเฉพาะอย่างยิ่งหน่วยงานภาครัฐที่ถือครองข้อมูลมหาศาล เช่น หน่วยงานมีข้อมูลอะไรอยู่บ้าง ข้อมูลเหล่านั้นจัดเก็บอยู่ที่ไหน มีชั้นความลับเป็นอย่างไร ใครเป็นผู้รับผิดชอบ เป็นต้น

  • การบริหารจัดการข้อมูลอย่างมีประสิทธิภาพนั้น จำเป็นต้องมี 3 ส่วนสำคัญ ดังนี้

1.Data Governance คือ การกำกับดูแลข้อมูลในหน่วยงาน ตลอดวงจรชีวิตของข้อมูล ตั้งแต่การสร้าง จัดเก็บ เข้าถึง ใช้ประโยชน์ และการทำลาย โดยเน้นให้ข้อมูลมีความถูกต้อง สมบูรณ์ ทันสมัย ปลอดภัย มีความเป็นส่วนตัว สามารถเชื่อมโยงได้ และคุ้มค่ากับการจัดเก็บ

2.Data Catalog เปรียบเสมือนสมุดหน้าเหลืองที่อธิบายว่าในหน่วยงานมีรายการชุดข้อมูลอะไรอยู่บ้าง ด้วยหลักการ 5W1H ได้แก่ What : คำอธิบายรายละเอียดชุดข้อมูล, Where : แหล่งที่มาของข้อมูลและรูปแบบการจัดเก็บ, When : ระยะเวลาในการจัดเก็บและอัพเดตข้อมูล, Why : วัตถุประสงค์ในการเก็บข้อมูลและการนำไปใช้ประโยชน์, Who : หน่วยงานผู้ถือครอง/เจ้าของข้อมูล และ How : วิธีการใช้และเข้าถึงข้อมูล รวมถึงระดับในการเปิดเผยข้อมูล 

3.Data Service/Data Exchange เป็นส่วนให้บริการข้อมูลจาก Data Catalog ในรูปแบบ API ที่เป็นมาตรฐานตามความปลอดภัยและชั้นความลับ หรืออาจมีการกำหนด Data Standards ที่ใช้สำหรับการแลกเปลี่ยนข้อมูล

ถ้าหน่วยงานจัดทำ 3 ส่วนนี้จะเกิดประโยชน์มหาศาลต่อข้อมูลที่จัดเก็บ คุ้มค่ากับการลงทุนทั้งทรัพยากร คนและระบบสารสนเทศ อีกทั้งจะช่วยลดความซ้ำซ้อนในการจัดเก็บข้อมูล นำข้อมูลไปใช้ประโยชน์ได้มากขึ้น และสร้างบริการที่ดีกับประชาชนและหน่วยงานอื่นได้

เนคเทค-สวทช.จึงวิจัยและพัฒนาเทคโนโลยีเกี่ยวกับ Open Data ชื่อว่า Open-D Platform ใช้สำหรับให้บริการข้อมูลเปิดในรูปแบบ API และ Visualization ที่พร้อมใช้ ผนวกกับว่าในยุคนี้แต่ละหน่วยงานมีความต้องการที่จะเปิดเผยข้อมูลในหน่วยงานของตัวเองเพื่อแลกเปลี่ยนกับหน่วยงานอื่นมากขึ้น ทำให้เกิดการพัฒนา Open-D เพื่อตอบโจทย์แต่ละหน่วยงาน

  • ลงสนามใช้งานจริงกับการพัฒนาข้อมูลภาครัฐ

เนคเทคได้นำแพลตฟอร์ม Data Catalog ไปประยุกต์ใช้งานจริงในหน่วยงานภาครัฐอย่างหลากหลาย โดยมีรูปแบบหรือบริบทของข้อมูลที่แตกต่างกันในแต่ละหน่วยงาน โครงการแรกคือ การปรับปรุงเว็บไซต์ Open Data Portal ของประเทศ หรือ data.go.th โดยร่วมกับสำนักงานพัฒนารัฐบาลดิจิทัล (องค์การมหาชน) หรือ สพร. โดยเวอร์ชั่นแรกของเว็บไซต์ที่พัฒนาตั้งแต่ปี 2558 นั้นมีปัญหาหลักคือ ไม่สามารถให้บริการข้อมูลในรูปแบบ API ได้ รวมถึงรายการ Metadata ยังไม่เป็นไปตามมาตรฐาน

เราจึงนำแพลตฟอร์มฯ ไปปรับใช้ (Customize) ให้เข้ากับกระบวนการเผยแพร่ชุดข้อมูลเปิด (Open Data) ของเว็บไซต์ โดยมีการปรับปรุงและพัฒนาเสร็จสิ้นก่อนการแพร่ระบาดของโควิด-19 จึงทำให้กระทรวงสาธารณสุขสามารถนำข้อมูลเกี่ยวกับโควิด-19 มาขึ้นที่เว็บไซต์ดังกล่าวได้ ซึ่งเป็นชุดข้อมูลหนึ่งที่ได้รับความนิยม 

จากการพัฒนาดังกล่าวเกิดการเปลี่ยนแปลงอย่างหนึ่ง คือ นักพัฒนาสามารถนำข้อมูลไปใช้ประโยชน์ผ่าน API ได้มากขึ้น ง่ายและสะดวกในการพัฒนาแอพพลิเคชั่น ผู้ใช้ทั่วไปสามารถดึงข้อมูลที่มีการอัพเดตสร้างรายงานในรูปแบบกราฟ และแผนที่ได้

นอกจากนี้ยังนำแพลตฟอร์มฯ ไปปรับใช้ในการพัฒนาเว็บไซต์ศูนย์กลางข้อมูลเปิดภาครัฐ โดยร่วมกับสำนักงานสภาพัฒนาการเศรษฐกิจและสังคมแห่งชาติ ในบริบทของการติดตามและประเมินผลการดำเนินงานตามยุทธศาสตร์ชาติ หรือระบบ eMENSCR เพื่อให้ประชาชนสามารถเข้าถึงและติดตามการดำเนินงานของภาครัฐได้

เราหวังว่า Data Catalog Platform ที่พัฒนาขึ้น จะเป็นกลไกสำคัญที่จะช่วยผลักดันให้เกิดการใช้ประโยชน์จากข้อมูล สร้างนวัตกรรมพัฒนาประเทศต่อไปในอนาคต