Data Economy วันที่ข้อมูลเป็นสินทรัพย์ที่ทุกคนต้องขุด

Data Economy วันที่ข้อมูลเป็นสินทรัพย์ที่ทุกคนต้องขุด

ยุคนี้มีข้อมูลก็เปรียบเสมือนมีเหมืองทอง ใครมีข้อมูลมากกว่า ทั้งข้อมูลลูกค้า ข้อมูลตลาด

หรือแม้กระทั่งผู้บริหารรู้ข้อมูลการทำงานภายในองค์กรตัวเองได้ละเอียดมากที่สุด ย่อมมีความได้เปรียบในการแข่งขันมากกว่า วันนี้อุตสาหกรรม Technology เป็นอุตสาหกรรมที่มี Marketcap สูงที่สุดในตลาด NASDAQ และสำหรับบริษัท Technology ชั้นนำนั้น มูลค่าที่แท้จริงของบริษัทอยู่ที่การครอบครองสิ่งที่เรียกว่า “Data” มากกว่าการเป็นเจ้าของ Hardware หรือ Platform

ถ้าวันนี้คุณมีเงินและกำลังคนไม่จำกัด คุณอาจจะสร้าง Website หรือ Platform ที่เหมือน Facebook ได้เป๊ะๆ ทุกกระเบียดนิ้ว แต่คุณไม่สามารถจะได้มาซึ่ง Data ที่สะสมมาจากคนทั่วโลกเป็นเวลากว่า 10 ปี และแน่นอนว่าต่อให้วันนี้มี Website ที่เหมือน Facebook ทุกอย่าง คุณเองก็คงไม่อยากย้าย “ข้อมูล” ที่เป็นความทรงจำที่ดีของคุณทั้งหมด ไม่ว่าจะเป็นโพสต์ คอมเมนต์ รูปถ่าย วิดีโอคลิปต่างๆ รวมถึงทิ้งเพื่อนๆ ที่มีหลายร้อยคน ไปเริ่มสร้างเพื่อนตั้งแต่คนแรกใน​ Website ใหม่ได้ง่ายๆ

ถึงจะมีเงินมากเท่าไร ก็ซื้อ Data ไม่ได้!

การที่เราอยู่ในยุค Data Economy อย่างนี้จึงทำให้หลายองค์กรตื่นตัวว่า เรามีข้อมูลมากมายที่ถูกเก็บไว้นานแล้ว และวันนี้จำเป็นต้อง “ขุด” นำมาใช้อย่างมีประสิทธิภาพ แต่ไม่รู้ว่าจะเริ่มต้นอย่างไร!!

หลายองค์กรที่เมื่อพูดถึงเรื่องนี้แล้ว ก็เรียกประชุมฝ่าย IT เข้ามาเป็นเจ้าภาพ ทั้งที่จริงแล้วการออกแบบกระบวนการ เพื่อที่จะนำ Data มาใช้ให้มีประสิทธิภาพนี้ เจ้าภาพต้องเป็นฝ่าย Business ก่อน

จุดเริ่มต้นในการทำเรื่อง Data คือต้องตีโจทย์ด้าน Business ว่าอะไรคือเป้าหมายหรือปัญหาที่เราต้องการจะทราบ (1) อะไรคือสิ่งที่เราต้องการควบคุมดูแล (Monitoring) เพื่อทราบสถานการณ์และเหตุการณ์ต่างๆ ที่เกิดขึ้นในปัจจุบันและอดีต (2) อะไรคือสิ่งที่เราต้องการพยากรณ์ (Forecasting) เพื่อคาดเดาเหตุการณ์ที่จะเกิดขึ้นในอนาคต และ (3) อะไรคือสิ่งที่เราต้องการข้อแนะนำเพื่อช่วยในการตัดสินใจ (Decision Making)

จากนั้นจึงค่อยดูว่าข้อมูลที่มีเพียงพอไหม โดยก่อนที่จะลงทุนสร้างแหล่งข้อมูลใหม่ ควรเริ่มจากการค้นหาแหล่งข้อมูลที่มีอยู่แล้ว ทั้งจากภายในและภายนอกองค์กร ข้อมูลบางอย่างเราไม่ต้องเสียเวลาหรือลงทุนในการเก็บเอง ยุคนี้มีข้อมูลหลายอย่างที่ “ซื้อได้” จากผู้ให้บริการที่รวมรวมข้อมูลและนำมาวิเคราะห์ขาย ที่เรียกว่า Data Agency ที่จะช่วยทั้งประหยัดเวลาและประหยัดเงินลงทุนในการเก็บข้อมูลเองตั้งแต่ต้น แล้วจึงต้องคำนวณว่าข้อมูลที่ “ซื้อไม่ได้” จะคุ้มค่าในการเริ่มลงทุนสร้างแหล่งข้อมูลใหม่หรือไม่ จากนั้นจึงเริ่มออกแบบการรวบรวมข้อมูลโดยคำนึงถึง

1. คุณภาพของข้อมูล ว่าได้รับการเก็บอย่างมีคุณภาพ กล่าวคือมีความถูกต้องแม่นยำสูงหรือไม่ เช่นการเก็บข้อมูลจากลูกค้าควรจะเน้นการเก็บข้อมูลจากการวัดพฤติกรรมของลูกค้าโดยตรง (Customer Behavior) เช่น การดูพฤติกรรมการเยี่ยมชมเว็บไซต์ ซึ่งจะทำให้เกิดความคลาดเคลื่อนน้อยกว่าการเก็บข้อมูลจากแบบสอบถาม (Survey) ยุคนี้ข้อมูลที่คาดเคลื่อนเพียงนิดเดียว บางครั้งทำให้ประมวลออกมาเป็นการตัดสินใจที่ไม่ถูกต้อง กลายเป็นเข็มทิศทางธุรกิจที่ทำหลงทาง

2. ความรวดเร็วของข้อมูล ต้องมีการออกแบบว่าข้อมูลใดที่จะต้องเก็บและสามารถนำมาใช้งานทันที (Realtime) หรือเป็นข้อมูลที่สามารถนำมาใช้เป็นระยะก็พอ (Periodic) โดยข้อมูลที่ต้องเก็บและแสดงผลทันทีจะใช้เฉพาะข้อมูลสำคัญที่คุณค่าของข้อมูลอยู่ที่ความรวดเร็ว รวมถึงการตัดสินใจและตอบสนองต่อข้อมูลที่ได้มาสามารถทำได้เห็นผลทันที แน่นอนว่าทุกคนก็อยากได้ข้อมูลแบบ Realtime ทุกอย่าง แต่การทำแบบนั้นอาจไม่คุ้มค่ากับต้นทุน

3. ความหลากหลายของข้อมูล ประเภทของข้อมูลที่เก็บควรมีความหลากหลาย ทั้งข้อมูลแบบ Structured เช่นข้อมูลเชิงปริมาณ (คือเก็บเป็นตัวเลข) หรือข้อมูลเชิงคุณภาพ (เช่น Rating ความพึงพอใจ A-B-C-D-E) และข้อมูลแบบ Unstructured (เช่น รูปภาพ วิดีโอ เส้นการเดินทาง ข้อมูลด้าน Social) ซึ่งจะทำให้ได้ข้อมูลในแง่มุมที่ครบถ้วน รวมถึงมีการเทียบเคียงระหว่างกันเพื่อปรับให้ตรงกันและถูกต้องมากขึ้น (Data Validation and Reconcilation) ซึ่งเป็นกุญแจสำคัญที่ทำให้เข็มทิศธุรกิจของเรามีความแม่นยำ

โดยหลังจากที่ได้ออกแบบการรวบรวมข้อมูลเหล่านี้แล้ว จึงจะเข้าสู่กระบวนการของนักวิทยาศาสตร์ข้อมูล (Data Scientist) ไม่ว่าจะเป็น (1) การตรวจเช็คขนาดข้อมูลว่ามีความเพียงพอเหมาะสมหรือไม่ (2) การคัดเลือกตัวแปรที่เหมาะสม (Variable Selection) (3) การแปลงข้อมูลเพื่อลดปัจจัยรบกวน (Data Transformation) (4) การเลือกใช้ Data Model ที่มีหลากหลายรูปแบบ เพื่อตอบโจทย์ Business ที่ต้องการทราบ และสุดท้าย (5) คือการทดสอบผลของ Model ที่ได้ ว่ามีความแม่นยำเพียงพอในการใช้ปฏิบัติงานจริงหรือไม่

ยิ่งเข้าสู่ยุค Blockchain ยิ่งทำให้การลงทุนด้าน Data Science ขององค์กรที่มีความพร้อมมากกว่าไปสู่ความได้เปรียบมากขึ้นอีกหลายขั้น เพราะใน Blockchain (ที่เป็นระบบสาธารณะ) ทุกคนสามารถเข้าถึงข้อมูลได้อย่างเท่าเทียม

แต่อยู่ที่ใครจะชิง “ขุด” มันมาใช้ประโยชน์ได้เร็วกว่ากัน