Incident du 2 Août 2016

Le mardi 2 Aout 2016 à partir de 17:30 notre infrastructure d’hébergement “PCC” à été déconnectée du réseau suite à un problème chez OVH.

Vous trouvez les détails de cet incident sur le site OVH à cette adresse:
http://travaux.ovh.net/?do=details&id=19508

Notre PCC à fait parti des derniers ayant des hosts posant problème.

Quand nous avons repris la main sur l’infra vers 21:00, il a fallut relancer de nombreuses VM, le système HA VMWare n’arrivant pas à le faire seul, un admin devant prendre des décisions que le système ne voulait (à juste titre) pas prendre lui même.

A 21:30 l’intégralité des services mails étaient rétablie. Aucune perte d’emails n’est à prévoir, “juste” du retard.
A 22:00 les dernier service web, en particulier l’API était elle aussi rétablie.

Le 3 Aout au matin on a constaté, des problèmes de synchronisation entre nos différents serveurs de base de données. Une intervention à été programmée durant la période de midi, pour impacter au minimum les utilisateurs.

A 14 heures tous les serveurs de bases de données étaient synchronisés. Il y a pu y avoir quelques conséquences sur le service pendant la matinée en particulier une non prise en charge temporaire de modifications de configuration faites .

Désolé pour pour cet incident 🙁

 

 

Partagez cet article

Leave a Reply

Your email address will not be published. Required fields are marked *