Da ieri, a causa del blocco informatico globale di Microsoft, in tutto il mondo si stanno affrontando gravi disservizi che hanno colpito vari settori, dalle banche alle compagnie aeree, passando per gli aeroporti e i mercati finanziari: quali sono le cause tecniche di quanto accaduto?
La situazione ha messo in evidenza la fragilità dei sistemi informatici globali e la loro interdipendenza. Le aziende e i governi stanno lavorando per ripristinare la normalità, ma resta da vedere quanto tempo ci vorrà per risolvere completamente i disservizi.
Cerchiamo però di scoprire meglio cosa ha causato questo black-out informatico e quali sono le conseguenze di questi eventi.
Le cause tecniche del blocco informatico globale di Microsoft
Il gigante tecnologico di Redmond ha dovuto informare tutti i propri clienti di potenziali problemi con i servizi cloud Azure e con la suite di applicazioni Microsoft 365. Le problematiche comprendono “guasti nelle operazioni di gestione dei servizi e connettività o disponibilità dei servizi“, causando significative interruzioni nelle attività quotidiane delle aziende.
All’origine di questi problemi ci sarebbe un malfunzionamento nei servizi online di Microsoft e nello specifico un errore probabilmente sopraggiunto durante un aggiornamento fornito da Crowdstrike, una società di sicurezza informatica.
Sarebbe stato a quanto pare un “bug” durante questo aggiornamento di sistema del software di cybersicurezza, ampiamente utilizzato da molte imprese, a causare le ripercussioni a catena su numerose aziende a livello globale.
L’aggiornamento difettoso ha influenzato la connettività ai servizi cloud di Azure, rendendo difficoltoso l’accesso alle risorse online. Le aziende hanno riscontrato interruzioni nella gestione dei servizi cloud, compromettendo l’accesso a dati e applicazioni cruciali per le loro operazioni.
Questa serie di eventi ha inoltre portato, nella maggior parte dei casi, alla famigerata “schermata blu della morte“ (Blue Screen of Death, BSOD), che impedisce ai sistemi di essere riavviati correttamente.
Le dichiarazioni Microsoft e di Cloudstrike
Microsoft ha dichiarato attraverso un post su X che “i nostri servizi continuano a registrare miglioramenti mentre continuiamo ad adottare misure di mitigazione“. Tuttavia, ha avvisato che “potrebbero esserci ancora problemi di accesso a varie app e servizi di Microsoft 365″.
Yesterday, CrowdStrike released an update that began impacting IT systems globally. We are aware of this issue and are working closely with CrowdStrike and across the industry to provide customers technical guidance and support to safely bring their systems back online.
— Satya Nadella (@satyanadella) July 19, 2024
Mentre in base a quanto sta emergendo all’errato aggiornamento del software di sicurezza informatica CrowdStrike, l’azienda ha dichiarato: “Siamo a conoscenza di segnalazioni di arresti anomali su host Windows relativi al Falcon Sensor, i nostri team tecnici stanno lavorando attivamente per risolvere questo problema.”
Quali sono le conseguenze di questi disservizi informatici?
Dopo averne analizzate le cause tecniche, dobbiamo approfondire come i disservizi tecnici legati ai servizi online di Microsoft e Crowdstrike hanno avuto un impatto significativo su molte aziende, indipendentemente dal settore. Va però aggiunto che alcuni comparti, come quello dei trasporti o quello finanziario, hanno subito particolari ripercussioni dalla vicenda.
I bug comuni per le aziende di tutti i settori
Queste criticità hanno generato un impatto multi-livello sulle aziende, evidenziando la loro dipendenza critica dalle infrastrutture cloud e la necessità di solidi piani di continuità operativa.
Con i servizi cloud di Azure e le applicazioni di Microsoft 365 compromessi, molte aziende non sono riuscite ad accedere a documenti, email, applicazioni di collaborazione e altre risorse essenziali per il lavoro quotidiano. Questo ha portato a un rallentamento o, in alcuni casi, a un arresto completo delle operazioni aziendali.
I dipendenti, senza accesso agli strumenti necessari, non sono stati in grado di completare le loro attività lavorative. La produttività è stata drasticamente ridotta, con un impatto diretto sulle scadenze dei progetti e sulle consegne ai clienti. Le aziende hanno pertanto dovuto dedicare risorse aggiuntive per risolvere i problemi, contattare i fornitori di servizi, implementare soluzioni temporanee e gestire il caos operativo. Questo ha comportato costi imprevisti e ulteriori sforzi organizzativi.
Il settore dei trasporti
Le conseguenze di questi disservizi hanno colpito poi molto duramente, per tutti i motivi che abbiamo appena citato, il settore dei trasporti, in particolare quello aereo. I sistemi di gestione dei voli e i dispositivi aeroportuali sono andati in tilt, causando oltre 1.300 cancellazioni di voli e creando enormi problemi nelle procedure di check-in e di vendita dei biglietti. In Italia, aeroporti come Bologna, Fiumicino e quelli della Puglia hanno registrato notevoli disagi.
Assoutenti ha sottolineato l’importanza del rispetto dei diritti dei passeggeri, anche in situazioni di forza maggiore come queste. Secondo il presidente Gabriele Melluso, le compagnie aeree devono garantire ai passeggeri assistenza adeguata, compresi pasti, bevande, sistemazione in hotel e trasporto verso gli alberghi, in conformità con il Regolamento (CE) n. 261/2004.
In caso di cancellazione del volo, i passeggeri hanno diritto al rimborso del prezzo del biglietto o a un volo alternativo il prima possibile. La compensazione pecuniaria è esclusa in quanto si tratta di circostanze imprevedibili.
Settore finanziario
Infine anche il settore finanziario è stato colpito da questa catena di eventi, con banche e operatori di borsa che hanno dovuto fronteggiare diverse problematiche.
Interruzioni nei Servizi Bancari
Le banche, che dipendono fortemente dai servizi cloud per gestire le loro operazioni quotidiane, hanno subito interruzioni significative a causa dei recenti problemi tecnici. Ecco come queste interruzioni hanno influenzato le loro attività:
- Transazioni Bloccate: L’accesso limitato o nullo ai sistemi cloud ha impedito l’elaborazione delle transazioni finanziarie. Questo include pagamenti, trasferimenti di fondi e operazioni di prestito, causando ritardi e difficoltà per i clienti bancari.
- Servizi Online Inaccessibili: I servizi di online banking, come il controllo dei conti, il pagamento delle bollette e le operazioni bancarie via app, sono stati gravemente colpiti. I clienti non sono riusciti a effettuare operazioni di routine, generando insoddisfazione e preoccupazione.
- Supporto Clienti Sovraccarico: Con l’aumento delle difficoltà tecniche, molti clienti hanno cercato assistenza tramite i canali di supporto clienti. Questo ha portato a un sovraccarico dei call center e dei servizi di assistenza, ulteriormente complicato dalla mancanza di accesso a sistemi cruciali per fornire supporto.
Impatto sugli Operatori di Borsa
Gli operatori di borsa e i mercati finanziari sono stati altrettanto colpiti dai disservizi. La natura rapida e complessa del trading richiede una connettività continua e affidabile, e la mancanza di accesso ai sistemi cloud ha avuto le seguenti conseguenze:
- Interruzione del Trading: Le piattaforme di trading elettronico, che gestiscono la compravendita di titoli, azioni e altri strumenti finanziari, sono state interrotte. Questo ha impedito agli operatori di borsa di eseguire ordini di compravendita, causando una perdita di opportunità di mercato e potenziali profitti.
- Dati di Mercato Inaccessibili: Gli operatori di borsa e i trader fanno affidamento su dati in tempo reale per prendere decisioni informate. L’interruzione dei servizi cloud ha limitato l’accesso a questi dati cruciali, aumentando l’incertezza e il rischio nelle operazioni di trading.
- Sistemi di Clearing e Settlement Compromessi: I sistemi di clearing e settlement, che garantiscono il completamento sicuro delle transazioni finanziarie, sono stati anch’essi colpiti. Questo ha portato a ritardi nel finalizzare le transazioni, con potenziali ripercussioni sulla liquidità e sulla stabilità del mercato.
Qual è la lezione che si dovrebbe imparare da questa vicenda?
Le recenti interruzioni hanno messo in luce quanto diversi settori, alcuni critcici, siano vulnerabili a guasti tecnici. Per prevenire simili disagi in futuro, è essenziale che le aziende adottino una serie di misure per migliorare la resilienza delle loro infrastrutture tecnologiche e garantire la continuità operativa anche in caso di guasti tecnici.
1. Strategie di Backup e Ripristino
- Backup Regolari: Implementare politiche di backup regolari e automatici per garantire che tutti i dati cruciali siano protetti e possano essere recuperati rapidamente in caso di guasto.
- Data Center Ridondanti: Utilizzare data center ridondanti situati in diverse aree geografiche per minimizzare il rischio di interruzioni dovute a problemi locali o regionali.
2. Piani di Continuità Operativa
- Business Continuity Plan (BCP): Sviluppare e mantenere aggiornati piani di continuità operativa che dettaglino le azioni da intraprendere in caso di interruzione dei servizi.
- Disaster Recovery Plan (DRP): Avere in atto piani di disaster recovery che prevedano soluzioni alternative per mantenere le operazioni in caso di guasti gravi. Qui potete consultare la nostra guida sull’argomento.
3. Soluzioni di Sicurezza e Monitoraggio
- Monitoraggio Proattivo: Implementare soluzioni di monitoraggio proattivo per identificare e risolvere potenziali problemi prima che causino interruzioni significative.
- Aggiornamenti Sicuri: Stabilire procedure rigorose per testare e implementare aggiornamenti software in modo sicuro, riducendo il rischio di introdurre bug o vulnerabilità.
4. Infrastrutture Cloud Ibride
- Cloud Ibrido: Utilizzare una combinazione di cloud pubblici e privati per aumentare la flessibilità e la resilienza delle infrastrutture tecnologiche.
- Multi-Cloud: Considerare l’adozione di strategie multi-cloud per distribuire il rischio e evitare la dipendenza da un singolo fornitore di servizi cloud.
5. Formazione e Consapevolezza
- Formazione del Personale: Formare il personale su come reagire in caso di disservizi e garantire che siano pronti a seguire i piani di continuità operativa.
- Simulazioni e Test: Eseguire regolarmente simulazioni di disastri e test dei piani di continuità operativa per assicurarsi che siano efficaci e aggiornati.