Buongiorno, grazie Giacomo mi ero perso la notizia UniSuper è questa: https://en.wikipedia.org/wiki/UniSuper https://www.theregister.com/2024/05/08/google_cloud_misconfiguration_takes_a... «Google Cloud blunder sinks Australian fund for a week» beh, solo una settimana, al comune di Roma qualche settimana fa è andata anche peggio :-/ --8<---------------cut here---------------start------------->8--- Shoveling a company's workloads and data into the cloud is not necessarily a panacea for every outage. [...] It's all a bit awkward. UniSuper shifted its workloads to Google Cloud Platform (GCP) in 2023, having previously hosted them on a combination of Azure and its own datacenters. [...] However, initial balances will be shown as they were on Monday, April 29, 2024, and will be updated as the restoration progresses. Trading and investments have continued as normal, according to UniSuper. [...] In this case, it seems that using multiple cloud providers has saved the day, even if it has taken some time for UniSuper to post Google's explanation. The incident brings into focus the need to ensure regular backups are taken, tested, and stored outside any potential blast radius and that disaster recovery plans are verified regularly. --8<---------------cut here---------------end--------------->8--- Giacomo Tesio <giacomo@tesio.it> writes:
Che succede se metti tutte le uova in un paniere (e le affidi alle volpi)?
non proprio tutte dai, pare che un backup lo avessero da un altro cloud provider: --8<---------------cut here---------------start------------->8--- Fortunately, UniSuper had backups at another cloud provider. Otherwise, a bad situation could have been oh so much worse. As it is, it has only been since today that the funds' services have shown signs of life, and members have been able to log into their accounts. The organization is also further ahead in the restoration than initially planned, meaning that balances should be up to date. --8<---------------cut here---------------end--------------->8--- (https://www.theregister.com/2024/05/09/unisuper_google_cloud_outage_caused/) "Should be up to date" fa paura, no?
<https://www.unisuper.com.au/about-us/media-centre/2024/a-joint-statement-fro...>
[...]
Google Cloud CEO, Thomas Kurian has confirmed that the disruption arose from an unprecedented sequence of events whereby an inadvertent misconfiguration during provisioning of UniSuper’s Private Cloud services ultimately resulted in the deletion of UniSuper’s Private Cloud subscription.
errore di configurazione del servizio, capita anche ai migliori
This is an isolated, ‘one-of-a-kind occurrence’ that has never before occurred with any of Google Cloud’s clients globally.
sì, sono eventi rari anche per _tutti_ gli altri fornitori di cloud *e* di hosting (topo l'incendio a OVH) rari ma non impossibili, come direbbero certi IT manager... paranoici?
This should not have happened. Google Cloud has identified the events that led to this disruption and taken measures to ensure this does not happen again.
«vuoi cancellare l'iscrizione del cliente e di conseguenza radere al suolo ogni sua istanza in ogni zona geografica del cloud? Inserisci "YES I Really Want" per confermare, prego.» [...]
Restoring UniSuper’s Private Cloud instance has called for an incredible amount of focus, effort, and partnership between our teams to enable an extensive recovery of all the core systems. The dedication and collaboration between UniSuper and Google Cloud has led to an extensive recovery of our Private Cloud which includes hundreds of virtual machines, databases and applications.
quello che a me fa veramente impressione è che per rimettere in pista una infrastruttura del genere (centinaia di macchine virtuali sono un numero /infinitesimale/ per un colosso delle dimensioni di Google Private Cluod) ci sia voluta una settimana io mi aspetterei che, con le risorse che ha, in una settimana Google sia in grado di rimettere in piedi la _sua_ intera infrastruttura di Private Cloud, mica una sola istanza ...a meno che, a meno che: nooo, non ditemi che avete cancellato anche tutte le configurazioni di ogni singolo nodo dell'infrastruttura senza avere un backup (Infrastructure as Code)?!? :-O chi gestisce IaC (infrastructure as code) sa che il _codice_ che gestisce tale infrastruttura vale almeno 2 ordini di grandezza di più dei dati che vi sono immagazzinati
UniSuper had backups in place with an additional service provider.
il backup di cosa? Da come parlano immagino del database (sarà un RDBMS), non delle virtual machines (o meglio delle loro configurazioni, deployment compreso) secondo me per qualche minuto almeno i dirigenti UniSuper sono rimasti paralizzati dal terrore all'idea che anche tutti i backup coi dati (di un fondo di investimento) fossero su Google Private Cloud, cancellati "con un click". un monumento al responsabile delle policy di backup! [...]
UniSuper and Google Cloud have been working around the clock on a resolution. The completion of the restoration swiftly, safely and securely remains Google Cloud and UniSuper’s top priority.
OK, quello era l'8 Maggio... e oggi avete completato? Non hanno ancora comunicato al pubblico se hanno completato tutto... magari lo hanno comunicato ai loro clienti. No così, visto che si tratta di una istutuzione finanziaria e non di un "Netflix" qualunque: «Reserve Bank of Australia: Box C: Building Resilience to Cyber Risks Cyber incidents can have systemic implications» https://www.rba.gov.au/publications/fsr/2022/apr/box-c-building-resilience-t... Saluti, 380° -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.