Project Oxygen & Ideo-LabIDEO LAB Dashboard 2026
← Retour au PortFolio DevOps / Cloud / Infra • DevOps / SRE

Migration Kubernetes multi-cluster

Aurora Vision Labs — France
Difficulté : Ultra complexe

Refonte Cloud Native – Migration Kubernetes multi-cluster (AWS EKS + Terraform)

Aurora Vision Labs — France — DevOps / Cloud / Infra

Période : 10/01/2023 → 10/12/2023 Rôle : DevOps Architect / Cloud Platform Engineer — responsable de : - Architecture Kubernetes multi-cluster (prod, staging, edge) - Déploiement EKS + optimisation réseau (IRSA, NLB, CNI) - Terraform (modularisation complète + pipelines GitOps) - Mise en place de ArgoCD, Prometheus/Grafana, Loki - Sécurisation workloads (PodSecurity, OPA Gatekeeper, secrets management) - Création des playbooks d’exploitation & documentation - Coaching des équipes internes pour prise en main de l’écosystème K8s Métier : DevOps / SRE Type : Migration / Replatforming Confidentialité : Semi-public (détails partiels)
Contexte du projet

Mission / objectif : Transformer l’infrastructure legacy de FusionLabs en une plateforme cloud-native multi-cluster, résiliente et totalement automatisée via Kubernetes (EKS) et Terraform.

FusionLabs disposait historiquement d’une infrastructure hybride : VM bare-metal, serveurs OpenStack, services cloud non standardisés. Les équipes DevOps faisaient face à un grand nombre de problèmes : déploiements lents, absence d’environnement stable, fragmentation des outils, problèmes de sécurité et incidents fréquents.

La direction IT a acté une migration complète vers Kubernetes (EKS), avec un impératif : zéro interruption de service pour les clients SaaS internationaux. L’ensemble du CI/CD, des environnements de staging/production et des services internes devait être modernisé et automatisé.

Méthodologie & organisation :

- Sprints Scrum 2 semaines
- Kanban pour les flux d’incidents
- Revue d’architecture hebdomadaire
- Tests d’infra automatisés via Terratest
- CI/CD GitHub Actions (matrix builds + runners auto-scalés)
- Stratégie GitOps complète via ArgoCD

Livrables principaux :

- 3 clusters EKS (staging / production / edge)
- Terraform modules (réseau, namespaces, ingress, autoscaling)
- Observabilité complète : Prometheus, Grafana, Loki, Tempo
- Pipeline CI/CD GitOps (GitHub Actions → ArgoCD)
- Helm charts custom pour 17 microservices
- Nginx ingress + cert-manager + autoscaling HPA/VPA
- Documentation opérationnelle + formation des SRE

Difficultés & enjeux

- Migration sans downtime sur 12 microservices critiques
- Multi-cluster avec réplication des configs GitOps
- Sécurité : conformité ISO27001 + segmentation réseau stricte
- Montée en charge : 30k req/min → objectif 120k req/min
- Optimisation cost control AWS (EC2 / EKS / LB / EBS)
- Gestion des secrets et rotation automatique
- Déploiement edge (Europe + Amérique du Nord)

Solutions & architecture

- Architecture Cloud Native basée sur EKS (managed node groups + spot instances)
- Terraform modulaire + workspaces multi-region
- Stratégie GitOps : ArgoCD + auto-sync + policy enforcement
- Service Mesh Linkerd pour MTLS et observabilité avancée
- OPA Gatekeeper pour la conformité & sécurité proactive
- Logging unifié : Loki + FluentBit + Promtail
- Caching global Redis + optimisation des conteneurs
- Déploiements canary + progressive delivery
- Cluster autoscaling (Karpenter) pour optimisation coûts/performance

Résultats & impact

- Disponibilité mesurée sur 6 mois : **99,985%**
- Coûts AWS réduits de **31%** après optimisation spot/Karpenter
- Latence moyenne divisée par 2 sur les services critiques
- Temps de déploiement : 14 minutes → **2 minutes** (GitOps)
- Taux d’incident P1 divisé par 4 en 3 mois
- Équipe DevOps passée de 7 à 11 personnes formées à K8s & GitOps
- Plateforme devenue la base de tous les nouveaux projets FusionLabs

Stack technique & outillage
Stack principale

Outillage, CI/CD, monitoring

Infos complémentaires

Type de projet : Migration / Replatforming

Tags techniques :
ArgoCD AWS EKS DevOps Docker GitOps Grafana Helm Karpenter Kubernetes Prometheus Service Mesh Terraform

Sécurité & durcissement :

- Séparation complète dev/staging/prod via namespaces / network policies
- MTLS via Linkerd
- OPA Gatekeeper (conformité ISO27001)
- Rotation secrets AWS automatiques
- Pods non-root + sécurité kernel renforcée
- Alerting CloudWatch + Grafana On-Call

Notes d’architecture :

- Multi-cluster Kubernetes EKS
- GitOps pour toute la configuration
- Service mesh Linkerd
- Observabilité full-stack (logs + metrics + traces)
- Architecture microservices scalable multi-region

Publication : Visible sur le site public IDEO-Lab