Jaringan tulang punggung ini berupa kabel serat optik sepanjang puluhan ribu mil yang menghubungkan semua pusat data (data center) milik Facebook.
Lalu lintas data antarfasilitas komputasi ini diatur oleh router. Secara berkala, Facebook mengadakan perawatan insfrastruktur, seperti memperbaiki kebel yang rusak, dan memperbarui perangkat lunak di router.
Saat perawatan insfrastruktur kemarin, Facebook bermaksud memasukkan perintah (command) untuk memeriksa ketersediaan kapasitas tulang punggung.
Tapi, perintah tersebut justru memutus pusat data mereka. "Sistem kami dirancang untuk audit perintah seperti ini untuk mencegah kesalahan seperti ini. Namun, sebuah bug di perangkat audit mencegah sistem mematikan perintah tersebut," kata Santosh.
Perubahan konfigurasi ini menyebabkan koneksi servers dari pusat ke internet putus.
Masalah ini bertambah karena server DNS tidak bisa berkomunikasi dengan border gateway protocol (BGP), jika DNS tidak bisa berkomunikasi dengan pusat data.
"Hasil akhirnya, server DNS kami tidak terjangkau meskipun mereka masih beroperasi. Akibatnya, mustahil internet menemukan server kami," kata Santosh.
Facebook akhirnya mengirim insinyur datang langsung ke lapangan untuk menyetel ualng sistem.