หัวใจ “บิ๊ก ดาต้า”ต้องมีข้อมูลดิบต่อเนื่อง

หัวใจ “บิ๊ก ดาต้า”ต้องมีข้อมูลดิบต่อเนื่อง

บิ๊ก ดาต้า ไม่ใช่ข้อมูลสรุป แต่ต้องมีข้อมูลขนาดใหญ่ที่แท้จริงโดยเฉพาะข้อมูลธุรกรรม

บิ๊ก ดาต้า เป็นประเด็นที่องค์กรทุกภาคส่วนในประเทศไทยกล่าวถึงกันมาก บ้างก็บอกว่ากำลังดำเนินการ บ้างก็บอกว่าเก็บข้อมูลเป็นบิ๊ก ดาต้า และบ้างก็บอกว่าวิเคราะห์ข้อมูลโดยใช้บิ๊ก ดาต้า สำหรับผมมองว่าผู้บริหารส่วนใหญ่ยังไม่เข้าใจความหมายและไม่ได้นำมาใช้ประโยชน์อย่างแท้จริง หากแต่ใช้ข้อมูลเพียงเล็กน้อยผิวเผินเท่านั้น จึงทำให้บางครั้งต้องสูญเสียโอกาสไปอย่างมาก ก็เพียงเพราะว่าเราต้องการแค่สร้างภาพและตอบโจทย์ว่า ฉันได้ทำบิ๊ก ดาต้า แล้ว

หากพิจารณาถึงนิยามของ บิ๊ก ดาต้า ว่า มี 4 V คือ Volume, Variety, Velocity และ Veracity ประกอบกับพิจารณาการเปลี่ยนแปลงของสรรพสิ่งต่างๆ ที่จะต้องมีการเคลื่อนไหวตลอดเวลา การเคลื่อนที่ การงาน การศึกษา สุขภาพ หรือการทำธุรกรรม แลัวเราจะเห็นได้ว่า บิ๊ก ดาต้า ถ้ามีเพียงข้อมูลขนาดใหญ่ (Volume) ก็อาจจะไม่เพียงพอต่อการวิเคราะห์พฤติกรรมหรือเข้าใจในสถานการณ์ปัจจุบัน เพราะองค์ประกอบที่สำคัญสุดประการหนึ่งของ บิ๊ก ดาต้า กลับกลายเป็นเรื่องของ Velocity ที่จะต้องมีข้อมูลเข้ามาอย่างต่อเนื่อง เพื่อให้ทราบสถานะต่างๆ ตามตัวอย่างดังนี้ การใช้ชีวิตประจำวัน เช่น การเดินทาง ที่อยู่ การเข้าพักที่ต่างๆ ข้อมูลด้านสุขภาพ เช่น การออกกำลัง ผลการตรวจการสุขภาพ การรับประทานอาหาร

ความคิดเห็นของผู้คน เช่น การโพสต์ในโซเชียลมีเดีย การค้นหาข้อมูลออนไลน์ การอ่านหนังสือ ฐานะการเงิน เช่น การทำธุรกรรมธนาคาร รายรับ การจับจ่ายใช้สอย ซึ่งหากพิจารณาข้อมูลที่เข้ามาต่อเนื่องในแง่บิ๊ก ดาต้า มี 5 ประเภทหลัก คือ 1.โซเชียล มีเดีย ข้อมูลจากการโพสต์ต่างๆ การค้นหาข้อมูล หรือสื่อสารกันผ่านออนไลน์

2.โมบาย การใช้โทรศัพท์เคลื่อนที่ และมีการส่งข้อมูลมายังผู้ให้บริการอย่างต่อเนื่อง 3.อินเทอร์เน็ตออฟธิงส์ หรือไอโอที สรรพสิ่งต่างๆ เชื่อมต่ออินเทอร์เน็ต และมีการส่งข้อมูลเข้ามายังไอโอที แพลตฟอร์ม อย่างอัตโนมัติ เช่น อินดัสเทรียล ไอโอที , 4.แวร์เอเบิล ดีไวซ์ หรือ สมาร์ท ดีไวซ์ เซ็นเซอร์ และ 5.ทรานเซคชั่น ข้อมูลที่มีการทำธุรกรรมแล้วถูกบันทึกในรูปดิจิทัล เช่น ข้อมูลจาก Point of Sales (POS), ข้อมูล CRM, ข้อมูล ERP หรือข้อมูลธุรกรรมการเงินที่บันทึกอย่างต่อเนื่อง

ดังนั้นหากต้องการสร้างศักยภาพการแข่งขันด้วย บิ๊ก ดาต้า องค์กรต้องวางกลยุทธ์ให้มีข้อมูลใน 4 ประเภทดังล่าว แต่คำถามที่ท้าท้ายคือ จะหาข้อมูลเหล่านั้นมาได้อย่างไร เพื่อให้สามารถนำข้อมูลมาวิเคราะห์และพยากรณ์เรื่องต่างๆ ในที่นี้ผมขอยกตัวอย่างการใช้ บิ๊ก ดาต้า ด้านการท่องเที่ยว โดยมีโจทย์ที่น่าสนใจ ดังนี้ การใช้เพื่อการวางแผนของภาครัฐในการกำหนดนโยบาย กำหนดเส้นทางการท่องเที่ยว หรือแม้แต่การวางแผนการบริการรถสาธารณะ การเข้าใจพฤติกรรมการท่องเที่ยว การทำเพอร์ซันนัลไลซ์เซชั่น (Personalisation) ให้นักท่องเที่ยวจากโจทย์ที่ยกมา จะเห็นว่าการวิเคราะห์ต้องมีข้อมูลต่างๆ เช่น ข้อมูลจาก โซเชียล มีเดีย ที่อาจเป็นการ Tag ตำแหน่งที่อยู่ หรือรูปถ่าย จะต้องมีข้อมูลป้อนเข้ามาในแต่ละวินาทีเป็นจำนวนมาก ข้อมูลจาก เทเลคอม ที่จะเห็นข้อมูลของนักท่องเที่ยวเป็นวินาทีว่าอยู่ที่ใด เป็นต้น ข้อมูลจากไอโอที ที่ในอนาคตอาจมีข้อมูลจาก CCTV เห็นจำนวนนักท่องเที่ยวในแต่ละที่อยู่ตลอดเวลา

ข้อมูลธุรกรรม เช่น ข้อมูลจากการจองโรงแรม การเดินทางจากสายการบิน การรถไฟ หรือการท่าอากาศยาน ซึ่งข้อมูลเหล่านี้ต้องเป็นข้อมูลดิบที่ให้เห็นเป็นนาที หรือเป็นรายธุรกรรม ไม่ใช่ข้อมูลสรุปจากข้อมูลข้างต้นสามารถทำการวิเคราะห์ได้ เช่น พฤติกรรมการเดินทางของนักท่องเที่ยว เดินทางจากจุดใดไปยังจุดใด จำนวนคนเข้าเยี่ยมชมในตำแหน่งต่างๆ ในช่วงเวลาต่างๆ วิธีการเดินทางของนักเที่ยว เช่น มาจุดนี้โดยเครื่องบิน รถไฟ หรือรถยนต์ การทำ Segmentation นักท่องเที่ยวตามอายุ สัญชาติ เป็นต้น

จากที่กล่าวมาทั้งหมดจะเห็นได้ว่าเมื่อพูดถึง บิ๊ก ดาต้า ไม่ใช่ข้อมูลสรุป แต่จะต้องมีข้อมูลขนาดใหญ่ที่แท้จริงโดยเฉพาะด้านข้อมูลธุรกรรม ในปัจจุบันบางอุตสาหกรรมเริ่มมีความน่ากลัวที่ต่างชาติเข้าเก็บข้อมูลธุรกรรมเหล่านี้ โดยที่หน่วยงานในประเทศกลับไม่ให้ความสำคัญไม่ได้เก็บข้อมูลเหล่านี้ไว้ระยะยาว และไม่เข้าใจว่าข้อมูลเหล่านั้นมีความสำคัญยิ่งในการทำ บิ๊ก ดาต้า ที่แท้จริง สุดท้ายอาจจะสูญเสียศักยภาพการแข่งขันไปในที่สุด