เมื่อโลกทั้งใบฝากชีวิตไว้บน ‘คลาวด์’ ถอดบทเรียนจากเหตุระบบ Amazon ล่มทั่วโลก

ระบบคลาวด์ Amazon Web Services (AWS) ล่มทั่วโลก กระทบเกม สตรีมมิ่ง ฟู้ดเดลิเวอรี และการศึกษาออนไลน์ นักวิเคราะห์เตือนไม่ควรพึ่งพาผู้ให้บริการคลาวด์เพียงรายเดียว องค์กรควรพิจารณา multi-cloud และ multi-region เพื่อความมั่นคง
KEY
POINTS
- ระบบคลาวด์ Amazon Web Services (AWS) ล่มทั่วโลกเป็นเวลาหลายชั่วโมง สาเหตุเกิดจากความขัดข้องของระบบแปลงชื่อโดเมน (DNS) ภายใน ไม่ใช่การโจมตีทางไซเบอร์
- เหตุการณ์ส่งผลกระทบเป็นวงกว้างต่อบริการออนไลน์หลายประเภท ตั้งแต่โซเชียลมีเดีย เกม สตรีมมิง การเงิน ไปจนถึงแพลตฟอร์มการศึกษา ทำให้ผู้คนหลายล้านคนทั่วโลกไม่สามารถเข้าถึงบริการได้
- บทเรียนสำคัญคือ การพึ่งพาผู้ให้บริการคลาวด์รายใหญ่เพียงไม่กี่รายสร้างความเปราะบางให้กับโครงสร้างพื้นฐานดิจิทัล และกระตุ้นให้องค์กรต่างๆ ต้องพิจารณากระจายความเสี่ยง
วันจันทร์ที่ 20 ตุลาคม 2025 เกิดเหตุความขัดข้องครั้งใหญ่ของ Amazon Web Services (AWS) ระบบคลาวด์ที่หลายบริษัทและบริการออนไลน์ทั่วโลกพึ่งพา ทำให้เว็บไซต์และแอปพลิเคชันหลายประเภทใช้งานไม่ได้เป็นเวลาหลายชั่วโมง
ครอบคลุมตั้งแต่สื่อสังคมออนไลน์ เกม แอปฟู้ดเดลิเวอรี บริการสตรีมมิง ไปจนถึงแพลตฟอร์มทางการเงิน เช่น Disney+, Reddit, McDonald’s, Facebook, United Airlines, Coinbase, Perplexity และ Canva
Amazon ชี้แจงว่าสาเหตุเกิดจากระบบแปลงชื่อโดเมน (DNS) ซึ่งเป็นระบบสำคัญที่ทำหน้าที่เหมือน “สมุดโทรศัพท์ของอินเทอร์เน็ต” โดยแปลงชื่อเว็บไซต์ที่เราพิมพ์ เช่น www.example.com ให้กลายเป็นตัวเลข IP Address ที่คอมพิวเตอร์ใช้ค้นหาและเชื่อมต่อกับบริการต่างๆ บนอินเทอร์เน็ต เมื่อระบบนี้ล่ม เว็บไซต์และแอปพลิเคชันจำนวนมากจึงไม่สามารถทำงานได้
กระบวนการกู้คืนเริ่มขึ้นประมาณสามชั่วโมงหลังเกิดเหตุ และกลับสู่การให้บริการปกติราว 18.00 น. ตามเวลาท้องถิ่นสหรัฐ แต่ความหยุดชะงักที่ยาวนานเกือบทั้งวันทำให้ผู้ใช้อินเทอร์เน็ตหลายล้านคนทั่วโลกไม่สามารถเข้าถึงบริการที่ต้องพึ่งพาในชีวิตประจำวันได้
เว็บไซต์ติดตามการล่มของบริการออนไลน์ DownDetector ระบุว่ามีรายงานปัญหากว่า 11 ล้านครั้ง จากกว่า 2,500 บริษัททั่วโลก โดยภูมิภาคที่ได้รับผลกระทบมากที่สุดคือ อเมริกาเหนือและยุโรป รวมถึงบริการของรัฐบาลและสถาบันการเงินในสหราชอาณาจักร
เหตุการณ์ AWS ล่มครั้งนี้มีความคล้ายคลึงกับเหตุการณ์ CrowdStrike ที่เกิดขึ้นกับ Microsoft ในปี 2024 ที่เคยทำให้ระบบออนไลน์และธุรกิจทั่วโลกหยุดชะงัก แต่ทั้งสองเหตุการณ์มีสาเหตุที่แตกต่างกัน โดยปัญหา AWS ครั้งนี้เกิดจากความผิดพลาดของระบบภายในคลาวด์ ขณะที่กรณี CrowdStrike เกิดจากการอัปเดตซอฟต์แวร์ที่ล้มเหลว อย่างไรก็ตาม ทั้งสองกรณีไม่ใช่การโจมตีทางไซเบอร์แต่อย่างใด
ผู้เชี่ยวชาญด้านความมั่นคงไซเบอร์ ไมค์ แชปเพิล (Mike Chapple) จากมหาวิทยาลัยนอเทรอดาม เปรียบเหตุการณ์นี้เหมือน “ระบบไฟฟ้าขัดข้องครั้งใหญ่” และเตือนว่า แม้ระบบจะฟื้นตัวเร็ว แต่ยังคงมีอาการสะดุดตามมา เพราะเซิร์ฟเวอร์ต้องเคลียร์คำขอที่ค้างอยู่
ปัญหาเริ่มตั้งแต่เช้าวันจันทร์ ก่อนใช้เวลาทั้งวันกว่าจะฟื้นตัว
Amazon เริ่มตรวจพบความผิดปกติในภูมิภาค US-EAST-1 ตั้งแต่เวลาประมาณตีสาม (ตามเวลาสหรัฐ) โดยระบุในรายงานแรกเริ่มว่าระบบมีอัตราความผิดพลาดและความหน่วงในการตอบสนองเพิ่มสูงขึ้น หลังจากนั้นปัญหาได้ขยายวงกว้างไปยังบริการอื่นๆ ของ AWS มากมายภายในระยะเวลาไม่กี่ชั่วโมง
โดยบริษัทฯ ประกาศเริ่มฟื้นตัวในช่วงเช้า แต่ใช้เวลาจนถึงราว 18.00 น. ตามเวลาสหรัฐ กว่าระบบจะกลับมาทำงานปกติ โดยระหว่างนั้นมีบริการภายในของ AWS กว่า 60 รายการได้รับผลกระทบ
การหยุดชะงักกระทบตั้งแต่ธุรกิจถึงระบบการศึกษา
สำนักข่าวรอยเตอร์สรายงานผลกระทบทางเศรษฐกิจว่า แม้บริการคลาวด์จะล่ม แต่ตลาดหุ้นกลับมีปฏิกิริยาตอบสนองเพียงเล็กน้อย โดยราคาหุ้น Amazon ยังปรับตัวขึ้น 1.6% มาอยู่ที่ 216.48 ดอลลาร์
แพลตฟอร์มเกมชื่อดังอย่าง Fortnite, Clash Royale และ Clash of Clans ได้รับผลกระทบอย่างหนัก เช่นเดียวกับแอปพลิเคชันเรียกรถอย่าง Uber และ Lyft ในสหรัฐ
ส่วนแอปส่งข้อความที่ให้ความสำคัญกับความเป็นส่วนตัวอย่าง Signal ก็ยืนยันว่าถูกกระทบเช่นกัน อย่างไรก็ตาม X (อดีต Twitter) ของอีลอน มัสก์ (Elon Musk) กลับยังคงทำงานได้ตามปกติตลอดเวลา
นอกเหนือจากภาคธุรกิจและบริการออนไลน์ทั่วไปแล้ว เหตุการณ์ความขัดข้องครั้งนี้ยังส่งผลกระทบต่อระบบการศึกษา เนื่องจากแพลตฟอร์มการเรียนการสอนออนไลน์อย่าง Canvas ซึ่งอาศัยบริการของ Amazon ในการทำงาน ไม่สามารถใช้งานได้ทั้งระบบ
มหาวิทยาลัยแคลิฟอร์เนีย ริเวอร์ไซด์ ได้ออกมาแจ้งว่า นักศึกษาไม่สามารถส่งงานที่ได้รับมอบหมาย ทำแบบทดสอบออนไลน์ หรือเข้าถึงบทเรียนและเอกสารประกอบการสอนได้ ส่วนมหาวิทยาลัยรัฐโอไหโอ ซึ่งมีนักศึกษาจำนวนมหาศาล ต้องรีบส่งอีเมลแจ้งเตือนนักศึกษากว่า 70,000 คนให้ติดต่ออาจารย์ผู้สอนโดยตรง เพื่อหาวิธีการแก้ไขปัญหาและทางออกในการเรียนการสอนชั่วคราว
ความเปราะบางของโครงสร้างพื้นฐานดิจิทัลที่พึ่งพาบริษัทเพียงไม่กี่ราย
เหตุการณ์ความขัดข้องครั้งนี้ไม่ใช่ครั้งแรกของ Amazon ในอดีตที่ผ่านมา บริการคลาวด์ของบริษัทเคยประสบปัญหาล่มในปี 2023, 2021, 2020 และ 2017 โดยเฉพาะอย่างยิ่งเหตุการณ์ในปี 2021 ที่ระบบล่มเป็นเวลานานถึงกว่า 5 ชั่วโมง ส่งผลกระทบตั้งแต่สายการบินที่ต้องยกเลิกหรือเลื่อนเที่ยวบิน ไปจนถึงแอปพลิเคชันจ่ายเงินและบริการสตรีมมิ่งต่างๆ ทั่วโลกที่ไม่สามารถใช้งานได้
ดร.คอรินน์ แคธ-สเพธ (Corinne Cath-Speth) หัวหน้าฝ่ายดิจิทัลขององค์กรสิทธิมนุษยชน Article เตือนว่า การพึ่งพาผู้ให้บริการคลาวด์ขนาดใหญ่เพียงไม่กี่ราย ทำให้ระบบสื่อสารและงานสำคัญของประชาธิปไตย รวมถึงสื่ออิสระ มีความเปราะบาง การแก้ไขคือ ควรกระจายความเสี่ยงไปยังผู้ให้บริการหลายรายเพื่อเพิ่มความมั่นคงและความยืดหยุ่นของระบบ
ขณะเดียวกัน คอรี ไครเดอร์ (Cori Crider) ผู้อำนวยการบริหาร Future of Technology Institute ซึ่งสนับสนุนกรอบการพัฒนาเทคโนโลยีอิสระของยุโรป ระบุว่า สหราชอาณาจักรไม่ควรปล่อยให้โครงสร้างพื้นฐานสำคัญของประเทศขึ้นอยู่กับบริษัทเทคโนโลยีสหรัฐ เมื่อ Amazon ล่ม จะส่งผลกระทบต่อระบบเศรษฐกิจและบริการสำคัญของประเทศ ทั้งการเงิน การธนาคาร การสื่อสาร และระบบธุรกรรมอื่นๆ
คณะกรรมาธิการด้านการคลังของสภาผู้แทนราษฎรสหราชอาณาจักร ได้ส่งจดหมายไปถึงเลขานุการด้านเศรษฐกิจ ลูซี่ ริกบี้ (Lucy Rigby) เพื่อสอบถามเหตุผลว่าทำไมรัฐบาลยังไม่กำหนดให้ Amazon เป็นผู้ให้บริการสำคัญต่อระบบการเงิน ทั้งนี้ Amazon เคยระบุว่าลูกค้าฝ่ายการเงินใช้ AWS เพื่อเพิ่มความยืดหยุ่นและมีหลายชั้นของระบบป้องกัน
อย่างไรก็ตาม ขณะนี้ระบบต่างๆ กลับมาทำงานได้ตามปกติแล้ว เหตุการณ์นี้สะท้อนได้ว่า แม้เทคโนโลยีคลาวด์จะสะดวกและเชื่อถือได้ แต่โลกยุคดิจิทัลที่พึ่งพาผู้ให้บริการเพียงไม่กี่รายนั้นมีความเปราะบาง หากเกิดความผิดพลาดเพียงครั้งเดียว อาจส่งผลกระทบต่อทั้งธุรกิจและชีวิตประจำวันของผู้คนทั่วโลก
ความสะดวกสบายที่เราเคยชินในชีวิตประจำวันนั้น อาจพังทลายลงได้ภายในชั่วข้ามคืน หากระบบ “กลุ่มเมฆ” ที่รองรับอินเทอร์เน็ตโลกเกิดล่มลงอีกครั้งในอนาคต
ผู้เชี่ยวชาญและหน่วยงานต่างๆ เสนอแนะว่า องค์กรและบริษัทควรพิจารณานำกลยุทธ์สำรองมาใช้อย่างจริงจัง เช่น การใช้บริการจากหลายผู้ให้บริการคลาวด์พร้อมกัน หรือการจัดสรรและกระจายทรัพยากรในหลายภูมิภาค เพื่อสร้างความยืดหยุ่นและลดความเสี่ยงที่อาจเกิดจากจุดล้มเหลวเพียงจุดเดียว (single point of failure) ซึ่งอาจนำไปสู่วิกฤตการณ์ระดับโลกได้อีกครั้ง
อ้างอิง: The Guardian AP News CNN Emarketer และ Reuters







