Cloud & Architecture · Grand groupe · Mission solo
De bare metal OVH à AWS multi-comptes :~5 000 utilisateurs en 30 minutes.
Le problème
Le client hébergeait l'ensemble de ses outils internes sur des serveurs bare metal OVH. L'infrastructure souffrait de plusieurs problèmes critiques :
- Pannes récurrentes — plusieurs interruptions de service en moins d'un an, impactant directement les équipes métier
- Aucune séparation d'environnements — la prod, la staging et le dev cohabitaient sur les mêmes machines
- Pas de documentation ni de reproductibilité — configurations manuelles, impossibles à auditer
- Aucune visibilité sur les coûts — pas de suivi de consommation, pas d'optimisation budgétaire
Aucun compte AWS n'existait. Mission : concevoir et déployer de zéro une architecture cloud professionnelle, migrer l'intégralité des workloads sans interruption — en totale autonomie, seul DevOps du groupe.
Benchmark et décision
Avant de choisir un provider, j'ai mené un benchmark entre plusieurs options, évaluées sur la fiabilité, l'écosystème de services managés, le coût à 3 ans et l'intégration avec l'outillage IaC retenu. AWS a été retenu pour la maturité de son écosystème.
L'architecture cible : une AWS Organization à 6 comptes strictement isolés par domaine (management, production, staging, dev, services partagés, sécurité), avec Infrastructure as Code intégrale pour garantir la reproductibilité.
La migration OVH → AWS
Contrainte principale : ~5 000 utilisateurs actifs, fenêtre d'interruption maximale de 30 minutes. Stratégie retenue :
- Reconstruction complète des workloads dans les nouveaux comptes via IaC
- Transfert des données (fichiers et bases de données)
- Tests de non-régression exhaustifs sur staging — 3 semaines
- Plan de rollback automatisé vers OVH — retour en arrière en moins de 5 minutes
- Bascule DNS coordonnée + rotation des credentials, un soir en fin de week-end
Fenêtre réelle : 30 minutes. Zéro coupure pour les utilisateurs.
Monitoring et FinOps
L'infrastructure est monitorée en continu avec alerting actif — toute anomalie est détectée avant de devenir un incident. Optimisation des coûts intégrée dès la conception : extinction automatique des services non critiques hors heures ouvrées, alerting budgétaire par compte.
Pipelines de déploiement continu en place pour l'ensemble des environnements.
Le résultat
| Métrique | Avant | Après |
|---|---|---|
| Incidents majeurs | Plusieurs par an | Quasi zéro |
| Séparation des envs | Aucune (même machine) | 6 comptes isolés |
| Documentation | Inexistante | Architecture complète, runbooks |
| Reproductibilité | Impossible | Tout réplicable via IaC |
| Visibilité coûts | Aucune | Alerting budgétaire, extinction auto |
| Sécurité | Basique | IAM, chiffrement, gestion des secrets |
Un projet similaire ?
Migration cloud, refonte d'architecture, audit FinOps — parlons-en.
Démarrer un projet →