Project Oxygen & Ideo-LabIDEO LAB Dashboard 2026
← Retour au PortFolio Big Data • DATA_ENGINEER

Plateforme Big Data Kafka + Flink + Lakehouse

AeroSecure Alliance (anonymisé) — France
Difficulté : Ultra complexe

Plateforme Big Data temps réel – Kafka, Flink, Lakehouse Delta, Analytics 24/7

AeroSecure Alliance (anonymisé) — France — Big Data

Période : 15/01/2023 → 20/12/2023 Rôle : Architecte Big Data & Lead Data Engineer — responsable de : - Architecture complète Kafka + Flink + Lakehouse + API Data - Setup clusters Kafka multi-AZ + optimisation partitions - Pipelines Flink (stateful streaming) haute disponibilité - Data Lakehouse Delta (bronze/silver/gold) - Ingestion IoT via MQTT → Kafka → Flink - Gouvernance données (Apache Atlas / Glue) - Optimisation coûts cloud (S3, compute, compaction) - Mise en place d’un moteur SQL interactif (Trino / Spark) - CI/CD data (dbt, GitHub Actions) - Formation équipes Data/Analytics (~30 personnes) - Documentations + MLOps intégration Métier : DATA_ENGINEER Type : ARCHITECTURE Confidentialité : Semi-public (détails partiels)
Contexte du projet

Mission / objectif : Concevoir et mettre en production une plateforme Big Data temps réel basée sur Kafka, Flink, Delta Lake et un Data Lakehouse moderne permettant ingestion massive, traitement temps réel, stockage optimisé et analytics avancés pour plusieurs équipes data & produit.

NorthWind devait moderniser sa chaîne analytics utilisée pour :
- la détection d’anomalies en temps réel
- le suivi d’évènements IoT industriels (1,5M messages/min)
- l’analytics produit 24/7
- la visualisation temps réel KPI (latence, usage client, scoring qualité)
- l’alimentation d’un Data Lakehouse pour Data Science et BI.

L’architecture précédente : ETL batch lent, stockage hétérogène, absence de streaming fiable.
Objectif : un système industriel, scalable, temps réel, robuste, avec gouvernance & qualité des données intégrées.

Méthodologie & organisation :

- Architecture micro-batch + streaming (Kappa-like)
- Sprints 2 semaines avec démonstrations aux équipes produit
- CI/CD data (tests qualité, tests contractuels, linters SQL)
- Infrastructure définie en IaC (Terraform + Ansible)
- Tests de charge Kafka/Flink (k6 + simulateur IoT)
- Observabilité totale (Grafana + Prometheus + OpenTelemetry)
- Backpressure Flink surveillé en continu
- Stratégie sécurité & chiffrement (data-at-rest & in-transit)

Livrables principaux :

- Plateforme Kafka complète : topics, partitions, ACL, monitoring
- Pipelines Flink stateful (windowing, CEP, joins, enrichissements)
- Data Lakehouse Delta en 3 couches (Bronze / Silver / Gold)
- Connecteurs ingestion IoT (MQTT, OPC-UA, REST events)
- Pipelines batch dbt + jobs orchestration Airflow
- API interne analytics (FastAPI + caching Redis)
- Dashboard monitoring Big Data (latence Kafka/Flink, throughput, CPU, erreurs)
- Catalogue de données (Atlas/Glue), lineage et quality checks
- Scripts d’optimisation Delta : compaction, Z-Ordering, VACUUM
- Tests end-to-end + simulateurs trafic IoT haute charge
- Documentation architecture + runbooks incidents
- Formation Data Science & Data Analytics à l’usage du Lakehouse

Difficultés & enjeux

- Débit ultra élevé (1,5M msg/min IoT industriels)
- Garanties exactly-once (transactions Flink + Kafka)
- Gouvernance data multi-business units (finance, IoT, produit)
- Qualité des données hétérogènes (formats, schémas, périodes)
- Scalabilité du Lakehouse (S3 + Delta + queries lourdes)
- Backpressure streaming à gérer en continu
- Optimisation coûts cloud (stockage + compute)
- RTO faible pour incidents (plateforme mission-critique)
- Besoin d’une visualisation en temps réel (<3 sec) pour plusieurs KPIs

Solutions & architecture

- Kafka multi-AZ (3 brokers + replication factor 3)
- Compression Snappy + partitions adaptées (hot topics split)
- Flink stateful avec checkpoints réguliers, savepoints, HA
- Data Lakehouse Delta : bronzing → cleaning → gold KPIs
- Orchestration Airflow + dbt pour modèles SQL
- Trino pour requêtes interactives à grande vitesse
- S3 + Glue Catalog + ACID Delta transactions
- Kubernetes (EKS) pour Flink + Trino + Airflow
- Monitoring avancé (Grafana, Prometheus, Flink UI)
- OpenTelemetry pour traces cross-services
- Sécurité zéro-trust Data : IAM, PrivateLink, encryption KMS
- CI/CD data (unit tests, tests volcaniques, data contracts)
- Moteur d’alertes anomalies contenu (Flink CEP + modèles ML light)

Résultats & impact

- Capacité ingestion : **1,5M msg/min** → élasticité confirmée (auto-scaling)
- Latence end-to-end (IoT → Lakehouse) : **2,3 secondes**
- Coût stockage réduit de **28%** via compaction Delta & Z-Ordering
- Temps moyen requêtes BI (-40%) grâce à indices Delta + Trino
- 100% des transformations versionnées et testées via dbt
- Visibilité complète grâce à traces OTel + dashboards Big Data
- SLA analytics amélioré (99,95%) et incidents divisés par 4
- Adoption des équipes Data : +300 modèles dbt créés en 6 mois
- Pipeline ML upstream alimenté en quasi temps réel
- Requêtes Data Science 10x plus rapides (Trino + Delta Gold)

Stack technique & outillage
Stack principale

Outillage, CI/CD, monitoring

Infos complémentaires

Type de projet : ARCHITECTURE

Tags techniques :
Airflow Big Data Data Lakehouse dbt Delta Lake EKS Flink IoT Kafka MQTT S3 Streaming Terraform Trino

Sécurité & durcissement :

- IAM strict + accès principled least privilege
- Encryption S3 + Kafka + transport TLS
- VPC endpoints + PrivateLink
- ACL Kafka (producers/consumers isolés)
- Secrets gérés via KMS & Secrets Manager
- Contrôles gouvernance : lineage, policies par dataset
- Zero-trust Data : aucune ressource exposée publiquement
- Tests DLP & masquage données sensibles

Notes d’architecture :

- Architecture streaming-first (near Kappa)
- Pipelines Flink pour transformation temps réel
- Lakehouse Delta (ACID) multi-environnements
- Trino haute performance pour exploration SQL
- Ingestion IoT massive via Kafka multi-partitions
- OTel pour traces cross-clusters
- Infrastructure Kubernetes + MSK + S3
- Séparation Bronze/Silver/Gold pour gouvernance et optimisation

Publication : Visible sur le site public IDEO-Lab