Headline24jam.com – Amazon Web Services (AWS), penyedia layanan cloud computing terkemuka dari Amerika Serikat, mengakui kesalahan setelah gangguan besar yang memengaruhi lebih dari 1.000 situs dan aplikasi global pada Senin, 20 Oktober 2025. Gangguan yang dikenal sebagai “kiamat kecil internet” ini terjadi di pusat data US-East-1 dan mengakibatkan downtime signifikan untuk berbagai platform, termasuk Canva, Roblox, dan Fortnite, berdampak pada pengguna di seluruh dunia, termasuk Indonesia.
Dalam pernyataan resminya, AWS menyampaikan penyesalan mendalam atas dampak yang diterima oleh pelanggannya. “Kami mohon maaf atas dampak yang ditimbulkan oleh peristiwa ini kepada pelanggan kami,” ujar perusahaan tersebut. Mereka menekankan pentingnya layanan mereka bagi operasional bisnis pelanggan dan berkomitmen untuk melakukan perbaikan dan pembelajaran dari insiden ini.
Gangguan yang Melumpuhkan Infrastruktur Digital
Kejadian ini berlangsung mulai 19 Oktober pukul 23.48 hingga 20 Oktober pukul 02.40 pagi waktu AS. Wilayah US-East-1, yang dikenal sebagai Data Center Alley, merupakan pusat vital bagi 90 persen perusahaan Fortune 100. Gangguan di area ini menimbulkan efek domino yang mengakibatkan layanan digital global terhenti.
Penyebab Kegagalan Sistem
Analisis mendalam menunjukkan tiga masalah utama yang menyebabkan gangguan sistem. Pertama, terdapat bug pada sistem DNS (Domain Name System), yang berfungsi menerjemahkan nama domain ke alamat IP. Kedua, adanya kesalahan jaringan yang mengganggu konektivitas antar komponen. Ketiga, masalah sinkronisasi yang memperlambat pertukaran data antar server.
Masalah utama terletak pada “latent defect” dalam sistem otomatis manajemen DNS milik DynamoDB. Cacat ini menyebabkan tingkat error yang tinggi pada API DynamoDB, mengakibatkan banyak aplikasi tidak dapat terhubung ke server AWS. Hal ini sangat memengaruhi aplikasi dan situs yang bergantung pada infrastruktur AWS, tampak “down” dari perspektif pengguna.
Dampak Luas dan Tindakan Responsif AWS
Dampak gangguan ini terasa di berbagai sektor. Platform desain grafis seperti Canva dan game populer seperti Roblox serta Fortnite mengalami kesulitan akses. Layanan media sosial seperti Reddit dan Snapchat juga terdampak, sementara aplikasi pesan Signal mengalami masalah serupa. Disisi lain, layanan kesehatan digital seperti Neuro Care berpotensi menghadapi gangguan operasional.
Tim teknis AWS segera bekerja untuk mengidentifikasi dan memperbaiki masalah. Setelah tiga jam gangguan, layanan mulai pulih secara bertahap, meski efek riak masih terasa selama beberapa jam berikutnya. Insiden ini memberikan pelajaran penting mengenai pentingnya mengintegrasikan ketahanan siber dan non-siber dalam strategi bisnis digital yang lebih menyeluruh.
Pertimbangan Masa Depan bagi Pengguna Cloud
Perusahaan, seperti BNI Multifinance yang telah melakukan migrasi ke cloud dengan AWS, kini lebih menyadari risiko dari ketergantungan pada satu penyedia layanan. Insiden ini menunjukkan pentingnya memiliki arsitektur multi-cloud atau hybrid cloud untuk memitigasi risiko sistemik yang mungkin muncul.
Meskipun infrastruktur cloud terkemuka seperti AWS memiliki kapasitas besar, kejadian ini menekankan bahwa bahkan sistem paling canggih pun rentan terhadap gangguan. Hal ini menjadi pengingat bagi industri teknologi tentang pentingnya redundansi sistem dan rencana pemulihan bencana yang komprehensif. Ke depan, perusahaan pengguna layanan cloud mungkin akan lebih serius mempertimbangkan strategi mitigasi risiko yang solid untuk memastikan kelangsungan bisnis mereka.