'Dirty Data' ศัตรูที่ส่งผลลบต่อธุรกิจอย่างคาดไม่ถึง

'Dirty Data' ศัตรูที่ส่งผลลบต่อธุรกิจอย่างคาดไม่ถึง

ทำความรู้จัก "Dirty Data" ข้อมูลที่ไม่ถูกต้องปะปนอยู่ในฐานข้อมูล ทำให้การประมวลผลข้อมูลคลาดเคลื่อนตั้งแต่แรกเริ่ม ที่ทำให้ผลที่ได้จากการประมวลผลข้อมูลผิดพลาด จนนำมาสู่การตัดสินใจที่ผิดทิศผิดทางของธุรกิจได้

ข้อมูลบนโลกนี้เกิดขึ้นอย่างมหาศาลในทุกวินาทีเกิดเป็นสิ่งที่เรียกว่า Big Data ซึ่งทำให้เทคโนโลยี AI เข้ามาคัดกรองข้อมูลจำนวนมากเหล่านั้น เพื่อนำไปประยุกต์ใช้ประโยชน์ต่อ เพื่อช่วยอำนวยความสะดวกในกิจกรรมต่างๆ ทั้งในชีวิตประจำวันและธุรกิจ จนกลายเป็นส่วนหนึ่งของชีวิตเราทุกคนแล้วในวันนี้

ในยุคที่ทุกคนเสมือนมีสื่ออยู่ในมือผ่าน Social Media หลากหลาย Platform ยอดนิยมอย่าง Facebook, Line, Instagram, Twitter, TikTok และล่าสุด Clubhouse ซึ่งทำให้แต่ละคนสามารถแบ่งปันข้อมูลข่าวสารกันได้อย่างเสรีและรวดเร็ว ทำให้ข้อมูลมหาศาลที่เพิ่มขึ้นนี้ เต็มไปด้วยข้อมูลที่ไม่ผ่านการตรวจสอบความถูกต้อง และส่งผลให้ผู้รับสารได้ข้อมูลที่ผิดพลาด และบิดเบือนไปจากความเป็นจริงปะปนอยู่เป็นจำนวนมากโดยไม่รู้ตัว หรือที่รู้จักกันในนาม “Fake News” หรือข่าวปลอม ซึ่งถือเป็น Dirty Data ชนิดหนึ่ง

  • Dirty Data คืออะไรและเกิดขึ้นได้อย่างไร?

Dirty Data คือ “ข้อมูลที่ไม่ถูกต้อง” ซึ่งปะปนอยู่ในฐานข้อมูล ทำให้การประมวลผลข้อมูลคลาดเคลื่อนตั้งแต่แรกเริ่ม ทำให้ผลที่ได้จากการประมวลผลข้อมูล ผ่านโมเดลการวิเคราะห์ หรือแม้กระทั่ง AI/Machine Learning ต่างๆ มีความผิดพลาด จนนำมาสู่การตัดสินใจที่ผิดทิศผิดทางได้

ซึ่งเกิดขึ้นได้จากหลายสาเหตุ เช่น ความคลาดเคลื่อนจากการวัดผลของแหล่งข้อมูล รูปแบบการป้อนข้อมูลที่ไม่ชัดเจน การพิมพ์ผิด การบังคับให้เก็บข้อมูลที่ในทางปฏิบัติไม่สามารถเก็บได้จนผู้เก็บข้อมูลถูกบังคับให้ใส่ค่ามั่วๆ ลงไป ความเข้าใจในนิยามของข้อมูลที่คลาดเคลื่อน รวมถึงข้อมูลซึ่งเก่าเกินไปโดยไม่ได้ถูก Update ให้ตรงกับสถานการณ์ปัจจุบันก็ถือเป็น Dirty Data เช่นกัน โดยจากการสำรวจพบว่าประมาณ 60% ของ Dirty Data ที่แพร่หลายไปทั่วโลกนั้นเกิดจากความผิดพลาดของมนุษย์เอง ซึ่งถือเป็นปัญหาที่ท้าทาย

  • ผลกระทบของ Dirty Data ต่อธุรกิจ

เมื่อ Data ซึ่งเป็นทั้งเข็มทิศและอาวุธที่สำคัญของธุรกิจ ทำให้การปนเปื้อนด้วย Dirty Data นั้นสร้างความเสียหายให้กับภาคธุรกิจอย่างมาก ไม่ว่าจะเป็นการตัดสินใจที่ผิดพลาด การสูญเสียรายได้ การสูญเสียเวลา การสื่อสารที่ผิดพลาด จนไปถึงการให้บริการลูกค้าที่ผิดพลาด โดยพบว่าบริษัทในสหรัฐต้องสูญเสียรายได้ประมาณ 2.5 ถึง 3 ล้านล้านดอลลาร์ทุกปี โดยเฉพาะ 27% ของรายได้ที่เสียไปมาจากการที่ข้อมูลของลูกค้าหรือผู้ที่มีโอกาสเป็นลูกค้าขาดความถูกต้องนั่นเอง

ในอุตสาหกรรมการเงินเองก็ได้รับผลกระทบอย่างมากจาก Dirty Data โดยทำให้ธนาคารทั่วโลกต้องสูญเสียรายได้กว่า 4 แสนล้านดอลลาร์ ด้วยข้อมูลที่ไม่ถูกต้องที่เกิดขึ้นและเก็บไว้ภายในองค์กร นำไปสู่ความเสี่ยงด้านธุรกรรมต่างๆ เช่นธุรกรรมการเงินที่ไม่ถูกต้องหรือแม้กระทั่งการฉ้อโกงและบัญชีปลอม ซึ่งเป็นสิ่งที่ธนาคารควรตรวจพบให้ได้ตั้งแต่เนิ่นๆ เพื่อหลีกเลี่ยงการทำให้ธนาคารตกอยู่ในความเสี่ยงและปกป้องชื่อเสียงของธนาคารอีกด้วย

  • แนวทางการรับมือกับ Dirty Data

1.ลดการเก็บข้อมูลเกินความจำเป็น : ข้อมูลที่ไม่ได้ใช้ หรือไม่สามารถนำมาสร้างคุณค่าให้กับธุรกิจได้ เพราะหากมีข้อมูลที่เกินจำเป็นมากขึ้นเท่าไร ภาระในการตรวจสอบข้อมูลและการบริหารจัดการยิ่งมากขึ้น จนอาจทำให้ลดประสิทธิภาพการตรวจสอบข้อมูล และกลับกลายเป็น เพิ่มโอกาสในการเกิด Dirty Data กับข้อมูลสำคัญมากขึ้น

2.กำหนดมาตรฐานในการจัดเก็บข้อมูล : การกำหนดมาตรฐานที่ดีจะสามารถช่วยป้องกันข้อมูลสกปรกได้อย่างมีประสิทธิภาพและยั่งยืน องค์กรควรกำหนดนิยามของข้อมูล รูปแบบในการจัดเก็บข้อมูล จนไปถึงมาตรฐานของกระบวนการที่เกี่ยวข้องกับการจัดเก็บข้อมูลร่วมกัน เช่น นิยามของประเภทลูกค้า รูปแบบการใส่ยี่ห้อสินค้า หากไม่มีข้อมูลเบอร์โทรศัพท์ห้ามใส่เบอร์มั่ว เป็นต้น

3.ทำ Data Cleansing และตรวจสอบข้อมูลที่จัดเก็บทั้งข้อมูลภายในองค์กรเองและข้อมูลที่มาจากภายนอกองค์กร : หรือที่เรียกว่าการ “ทำความสะอาดข้อมูล” โดยทำการตรวจสอบคัดกรองข้อมูลที่เข้ามาในฐานข้อมูล ซึ่งการใช้อัลกอริทึมเพื่อตรวจจับความผิดปกติและระบุค่าผิดปกติที่เกิดจากความผิดพลาดของมนุษย์ จะช่วยประหยัดทั้งแรงงานและเวลาของบุคลากรเกี่ยวข้อง

4.ทำการ Update ข้อมูลอย่างสม่ำเสมอ : จากสถิติของ Discover.Org พบว่า ในแต่ละปีผู้คนมีการเปลี่ยนแปลงหมายเลขโทรศัพท์ถึง 18% ผู้คนมีการโยกย้ายทางหน้าที่การงานถึง 60% ดังนั้นองค์กรต้องทราบว่าข้อมูลชนิดใดมีอัตราการเปลี่ยนแปลงรวดเร็วเท่าไร ที่ทำให้องค์กรต้องมีการ Update อย่างต่อเนื่องทันต่อการเปลี่ยนแปลงของข้อมูลแต่ละชนิด

จะเห็นได้ว่า Dirty Data ส่งผลกระทบในแง่ลบมากอย่างไม่น่าเชื่อ ซึ่งเราสามารถหลีกเลี่ยงปัญหาและลดข้อผิดพลาดเหล่านี้ได้ ด้วยการใช้กระบวนการทำงานและเทคโนโลยีที่เหมาะสมมาช่วยจัดการข้อมูล ให้เกิดความถูกต้องและนำไปใช้ประโยชน์ได้ เพราะข้อมูลซึ่งเป็นเหมือนเข็มทิศหลักของธุรกิจในวันนี้ หากเรานำข้อมูลที่ไม่ถูกต้องมาใช้ ก็เสมือนมีเข็มทิศที่ไม่ตรง ชี้ทางพาเดินลงเหว การใช้ข้อมูลที่ไม่ถูกต้องอาจทำให้เกิดความเสียหายมากกว่าการไม่ใช้ข้อมูลดังกล่าวเลยเสียด้วย