Mark Zuckerberg at TechCrunch Disrupt 2012 via Wikimedia Commons

Quella volta in cui Facebook, Instagram e Whatsapp andarono down. Tutti insieme

5 Ottobre 2021

È lunedì 4 Ottobre 2021, e alla fine di una lunga pausa pranzo in smart working stavo riprendendo il lavoro. Tuta da casa, il tipico rintronamento post-siesta sconfitto a colpi di caffè, il sapore del dentifricio in bocca. Prima di rimettere mano sul codice, però, dò un’ultima occhiata al mio feed di Facebook. Non si aggiorna, mi fa vedere sempre gli stessi tre post in croce e non capisco il perché.

Faccio per scrivere un messaggio su Whatsapp, al che succede una cosa anomala. Non si invia il messaggio: rimane quell’iconcina che di solito ci infastidisce già se si manifesta per più di due secondi. ?

#FacebookDown, #InstagramDown, #WhatsappDown

Pian piano cresce la consapevolezza che tutti i prodotti legati all’impero di Mark Zuckerberg (Facebook, Instagram, Whatsapp, Oculus) non sono raggiungibili. Alcuni, come Whatsapp, danno errori di server mentre altri sembrano proprio essere inesistenti. Nel primo pomeriggio cresce altrettanto il malcontento tra gli utenti, che iniziano la transumanza verso altre piattaforme, principalmente Twitter.

C’è scontento anche perché l’interruzione di servizio corrisponde con buona parte dello spoglio elettorale in molte città italiane, oltre che per le regionali in Calabria. Se si era già saputo durante il pomeriggio dell’elezione di Enrico Letta a Siena e Andrea Casu al Quartiere Primavalle di Roma, restano ancora in sospeso gli altri esiti delle urne. Non resta che seguire tutto con la Maratona del Direttore Mentana.

Che cosa sta succedendo?

A metà pomeriggio abbiamo definitivamente decretato lo stato di morte di Facebook, Instagram e Whatsapp. Lavoratori annoiati sono tornati alle proprie mansioni, con questo dubbio amletico nelle retrovie dei propri pensieri: che diavolo sta succedendo? Tra i meme che affiorano su Twitter iniziano a brulicare anche le prime ipotesi.

All’inizio sembrava che si trattasse di un problema di DNS, acronimo che sta per Domain Name System. Il DNS, come spiegato nell’articolo di Cloudflare, riveste il ruolo delle Pagine Bianche per i numeri di telefono traslato al World Wide Web: ci permette di raggiungere siti web e servizi attraverso nomi mnemonicamente facili da ricordare, come ad esempio www.facebook.com oppure www.google.com invece che 157.240.3.35 o 74.125.195.99.

Tuttavia la cosa si è progressivamente aggravata, e si è iniziato a parlare di un fallimento del BGP, ovvero del Border Gateway Protocol.

Ancora una volta, ci viene in aiuto un altro articolo di Cloudflare: fondamentalmente il BGP è il servizio postale di Internet. La rete è fatta di molti gruppi di computer e server connessi fra loro, ed il BGP permette di trovare il tracciato migliore per far arrivare quella lettera nel modo più rapido ed efficiente possibile.

Internet è costituito da vari Sistemi Autonomi (AS), ovvero di varie isole di server connesse dentro alla loro rete e anche tra rete e rete. Un esempio di Sistema Autonomo è quello del vostro provider di rete, come TIM, WindTre, Fastweb, etc. I BGP, indicando che “salti” fare tra Sistemi Autonomi ci dicono la via per raggiungere la pagina del Bed&Breakfast che volevate prenotare o il post su Facebook su cui avevate appena cliccato.

Internet topography
Da Cloudflare.

Perché i meccanismi del BGP rendono vulnerabili la rete a questo tipo di interruzioni? Vi devo confessare che in realtà non vi ho detto tutta la verità: la logica con cui il BGP decide dove mandare le informazioni non si basa semplicemente su quale sia la strada più breve o più veloce da percorrere (un po’ come fa Google Maps quando chiedete le indicazioni), ma implementa delle regole di tipo commerciale e si fonda sul presupposto che tutti i Sistemi Autonomi abbiano delle regole giuste e sensate, ovvero su un principio di tipo fiduciario.

Come si suol dire: fidarsi è bene, non fidarsi è meglio! Vi sono stati diversi episodi di gravi interruzioni di servizio dati dalla modifica di alcune regole BGP. Ad esempio, nel 2008 un provider del Pakistan ha cercato di bloccare l’accesso a YouTube nel proprio paese usando proprio questo protocollo: il risultato fu che in tutto il mondo YouTube fu reso inaccessibile per diverse ore.

Sì, ma cosa c’entra con Facebook?!

Scusate, mi sono permesso un piccolo detour.

Come dice il CTO di Cloudflare John Graham-Cumming, tra le 15:50 e le 15:52 si è visto un anomalo incremento di richieste di modifica delle regole BGP da parte di Facebook. E tutte queste richieste erano di withdrawal, ovvero di ritiro della proprio sito da Internet. Come dice Kevin Beaumont, Facebook si è praticamente autocancellata!

Image courtesy of DougMadory (Kentik)

Questo seppuku digitale ha raggiunto livelli tali che alcuni siti di registrazione di domini hanno iniziato a segnare l’indirizzo facebook.com come disponibile all’acquisto.

La cosa ancora più tragicomica è che, poiché Facebook utilizza internamente molti dei suoi servizi per il funzionamento dell’azienda stessa, molti dipendenti non sono riusciti ad entrare con i propri badge nella struttura dell’azienda.

Come dice Ryan Mac del New York Times, poiché tutti gli strumenti di lavoro interno sono anche down in azienda nessuno è più in grado di fare alcunché. Alcuni dipendenti hanno paragonato questo giorno ad uno snowday, una giornata di neve in cui le scuole e le attività chiudono per le difficili condizioni atmosferiche.

Vorrei poter conoscere della letteratura fantascientifica solo per citare un autore che evidentemente trent’anni fa aveva già previsto tutto questo.

Quindi è stato un aTtAcCo hAcKeR?

Molto probabilmente no. Come ipotizzano l’esperto di cybersecurity Brian Krebs e Doug Madory di Kentik, è probabile che il disservizio sia dovuto all’errore umano di un dipendente che, mandando del codice errato in produzione, ha praticamente determinato la dissoluzione di tutta la galassia Facebook dall’universo Internet. Anche se nulla si può escludere ancora.

Qualche indizio in più è fornito dal post reddit di questo sedicente dipendente Facebook, che afferma che le operazioni di recupero siano rallentate dall’impossibilità di comunicare tra persone presenti in loco e tra chi saprebbe risolvere il problema.

Pian piano (sto scrivendo alle 00:07 di Martedì 5 Ottobre) i servizi sembrano riprendere dopo uno stop durato un intero pomeriggio. Si tratta comunque di una gravissima interruzione di servizio, che avviene tra l’altro in una tempesta perfetta, in concomitanza con la presunta pubblicazione di dati di oltre un miliardo e mezzo di utenti Facebook e con la pubblicazione di inchieste riguardante la loro policy sulla salute mentale delle giovani ragazze utenti di Instagram.

Un duro colpo per l’azienda, che dovrà seriamente riprendere in mano la situazione su diversi fronti per recuperare credibilità e garantire un certo livello di servizio ai miliardi di utenti in tutto il mondo. Forbes riporta da fonti interne che Mark Zuckerberg, presidente ed amministratore delegato di Facebook, avrebbe presumibilmente perso quasi sei miliardi di dollari a seguito dei disservizi, diventando il sesto uomo più ricco del mondo.

In un mercato fiorente di alternative, più libere, più open, più riguardose della privacy dei propri utenti, sarà da vedere se Facebook riuscirà a rimanere competitiva rispetto alla concorrenza di Twitter, Signal, Telegram, Discord e via dicendo.

PS: trovate una ottima analisi tecnica di Cloudflare qui. Altrimenti Robert Graham ha preparato un thread su Twitter con uno spiegone dettagliato, comprensibile anche ai meno tecnici di voi ?‍?

LASCIA UN COMMENTO

Your email address will not be published.