Project Oxygen & Ideo-LabIDEO LAB Dashboard 2026

🟧 Storage Systems — Chapitre 19 : AWS Storage

Très gros chapitre dédié au stockage AWS : Amazon EBS pour le bloc, Amazon S3 pour l’objet et les archives, Amazon EFS pour le NFS managé, Amazon FSx pour les filesystems spécialisés, AWS Backup pour la protection centralisée, Storage Gateway pour l’hybride, puis les architectures data lake, backup, HPC, AI, EKS, bases de données, sécurité, FinOps, observabilité, anti-patterns, runbooks et checklist production.

Amazon EBSAmazon S3Amazon EFSAmazon FSxAWS BackupStorage GatewayEKS / Data Lake / DR
19.1

Amazon EBS

gp3, io2, st1, sc1, snapshots : stockage bloc attaché EC2, performance provisionnée, zonal, DB et boot volumes.

EBSgp3/io2Snapshots
19.2

Amazon S3

Standard, Intelligent-Tiering, IA, Glacier, Deep Archive : buckets, classes, lifecycle, Object Lock, events et data lake.

S3GlacierLifecycle
19.3

Amazon EFS

NFS managé élastique pour Linux, multi-AZ, EKS RWX, access points, throughput modes et lifecycle.

EFSNFSRWX
19.4

Amazon FSx

Windows File Server, Lustre, NetApp ONTAP, OpenZFS : filesystems managés pour Windows, HPC, enterprise et ZFS.

FSxONTAPLustre
19.5

AWS Backup

Centralisation backup : plans, vaults, Vault Lock, cross-account/cross-region, restore testing et conformité.

BackupVault LockDR
19.6

Storage Gateway

Hybrid cloud : File Gateway, Volume Gateway, Tape Gateway, cache local, cloud-backed storage et migration.

GatewayHybridCache
19.7

Cas d’usage

Web apps, data lake, backup, HPC, AI, VMware migration, Kubernetes, databases, media, logs et archives.

Use casesAIHPC
19.8

Design EBS production

Choisir type EBS, IOPS, throughput, encryption, snapshots, multi-volume consistency, Fast Snapshot Restore et monitoring.

DesignIOPSFSR
19.9

Sécurité S3

Block Public Access, bucket policies, IAM Access Points, KMS, Object Lock, versioning, Macie, CloudTrail data events.

IAMKMSObject Lock
19.10

FinOps S3

Egress, requests, lifecycle, small objects, multipart incomplete, Storage Lens, Inventory, Intelligent-Tiering et tagging.

FinOpsEgressStorage Lens
19.11

EFS design

Performance mode, throughput mode, mount targets, security groups, access points, lifecycle IA et EKS patterns.

Mount targetsPerformanceEKS
19.12

FSx en profondeur

Quand choisir FSx Windows, Lustre, ONTAP ou OpenZFS : protocoles, performance, snapshots, replication et migration.

WindowsLustreOpenZFS
19.13

Archive AWS

S3 Glacier Instant/Flexible/Deep Archive, restore tiers, Vault Lock legacy, lifecycle, compliance et retrieval costs.

ArchiveRetrievalCompliance
19.14

DR et réplication AWS

EBS snapshots cross-region, S3 CRR/SRR, EFS replication, FSx backups, AWS Backup copy et Route 53 failover.

DRCRRRTO/RPO
19.15

AWS Storage pour EKS

EBS CSI, EFS CSI, FSx CSI, S3 CSI/mountpoint patterns, topology, snapshots, RWX et operators DB.

EKSCSIPVC
19.16

Bases de données sur AWS storage

EC2 DB avec EBS io2/gp3, RDS/Aurora storage, logs, PITR, snapshots, Multi-AZ et performance insights.

DBRDSAurora
19.17

HPC / AI / Analytics

FSx for Lustre, S3 data lake, EFA, SageMaker, EMR, Athena, Redshift Spectrum et pipeline ML.

HPCAIAnalytics
19.18

Migration & hybridation

DataSync, Snow Family, Transfer Family, Storage Gateway, Direct Connect, migration NAS/SAN/S3 et cutover.

DataSyncSnowMigration
19.19

Accès privé & réseau

S3 Gateway Endpoint, Interface Endpoints, PrivateLink, EFS mount targets, FSx subnets, security groups et DNS.

VPC EndpointPrivateLinkDNS
19.20

Observabilité AWS Storage

CloudWatch, CloudTrail, S3 Storage Lens, EBS metrics, EFS metrics, FSx metrics, AWS Config et Cost Explorer.

CloudWatchCloudTrailConfig
19.21

Modèle de coûts AWS Storage

EBS GB/IOPS/throughput/snapshots, S3 storage/requests/egress/retrieval, EFS throughput, FSx capacity et backup.

CostPricingBudgets
19.22

Anti-patterns AWS Storage

Buckets publics, EBS mal dimensionné, snapshots éternels, EFS pour DB, S3 sans lifecycle, KMS key cassée.

Anti-patternsRiskGovernance
19.23

Runbooks incidents

EBS full/latency, S3 access denied, bucket public, EFS mount failed, FSx degraded, backup failed, restore urgent.

RunbookIncidentRestore
19.24

Checklist production AWS Storage

Préprod : IAM, KMS, VPC endpoints, backups, lifecycle, monitoring, budget, DR, tagging et tests restore.

Prod-readyAuditChecklist
19.1 Amazon EBS : gp3, io2, st1, sc1, snapshots
Définition

Amazon Elastic Block Store fournit des volumes bloc persistants attachés aux instances EC2. L’OS les voit comme des disques : on peut y créer partitions, filesystems, LVM, bases de données, logs, boot volumes ou datastores.

Point clé : EBS est principalement zonal : le volume doit être dans la même Availability Zone que l’instance EC2 qui l’attache.
Flux logique
EC2/dev/nvme...Filesystem / DBEBS VolumeSnapshot S3-backed
TypeFamilleUsageAttention
gp3General Purpose SSDChoix par défaut moderne, VM, apps, DB modérées.IOPS/throughput configurables séparément.
io2Provisioned IOPS SSDDB critiques, faible latence, forte I/O.Coût plus élevé, design DB requis.
st1Throughput Optimized HDDDébit séquentiel, logs, big data.Pas adapté aux petites I/O aléatoires.
sc1Cold HDDDonnées froides, coût bas.Performance faible, accès rare.

Les snapshots EBS sont incrémentaux et servent à backup, clone, migration cross-region, AMI et restauration après incident. Ils doivent être gouvernés par tags, lifecycle et tests restore.

  • Snapshot crash-consistent si volume pris seul sans quiesce.
  • Multi-volume snapshots pour cohérence entre data/logs.
  • Copie cross-region/cross-account pour DR.
  • Fast Snapshot Restore possible pour réduire latence de premier accès selon besoin.
aws ec2 describe-volumes --filters Name=tag:App,Values=prod
aws ec2 create-snapshot --volume-id vol-123 --description "before-maintenance"
aws ec2 describe-snapshots --owner-ids self
aws ec2 modify-volume --volume-id vol-123 --volume-type gp3 --iops 12000 --throughput 500
lsblk
sudo growpart /dev/nvme0n1 1
sudo xfs_growfs /
Un volume EBS plein, mal dimensionné en IOPS, attaché à la mauvaise AZ ou sans snapshot récent devient un point de panne applicatif majeur.
19.2 Amazon S3 : Standard, Intelligent-Tiering, IA, Glacier, Deep Archive

Amazon S3 est le service objet AWS : buckets, objets, clés, metadata, classes de stockage, versioning, lifecycle, replication, event notifications, Object Lock et intégration data lake. Il est conçu pour stocker des objets via API, pas pour remplacer un disque POSIX.

App / SDKS3 APIBucketObject keyLifecycle / Replication
ClasseUsageAttention
S3 StandardAccès fréquent.Coût stockage plus élevé.
S3 Intelligent-TieringAccès imprévisible.Monitoring/tiering automatique selon règles.
S3 Standard-IA / One Zone-IAAccès rare.Frais retrieval, One Zone = moindre résilience zone.
S3 Glacier Instant/Flexible RetrievalArchive avec besoins restore variables.Retrieval fees et délais selon tier.
S3 Glacier Deep ArchiveArchivage long terme très froid.RTO long, minimum duration.
Pattern lifecycle:
- logs/raw/*: Standard 30d → Standard-IA 90d → Glacier 180d → Deep Archive 365d
- tmp/*: expire after 14d
- multipart incomplete uploads: abort after 7d
- non-current versions: expire after 180d
  • Data lake : S3 + Glue Catalog + Athena/EMR/Redshift Spectrum.
  • Static assets : S3 + CloudFront.
  • Backups immuables : S3 Versioning + Object Lock.
  • Event-driven : S3 events vers Lambda/SQS/EventBridge.
  • Cross-region replication pour DR.
Les coûts S3 viennent aussi des requêtes, du retrieval, de l’egress, des versions, des multipart uploads oubliés et de la réplication. S3 sans lifecycle devient vite une décharge chère.
19.3 Amazon EFS : NFS managé

Amazon Elastic File System expose un filesystem NFS managé, élastique, utilisable par plusieurs instances EC2 et pods EKS. C’est un service RWX naturel pour Linux, mais pas un remplacement universel d’EBS ou S3.

EC2 / EKS PodsNFS mountEFS mount targetsRegional file system
ÉlémentRôle
File systemNamespace NFS global.
Mount targetEndpoint réseau dans un subnet/AZ.
Access pointEntrée applicative avec path/UID/GID.
LifecycleDéplacement vers IA selon accès.
Throughput modeÉlasticité ou débit provisionné selon workload.
  • Uploads partagés entre pods.
  • CMS Linux multi-instance.
  • Home directories techniques.
  • Partage de fichiers applicatifs.
  • Workloads EKS nécessitant RWX.
# Concepts EFS CSI
StorageClass: efs-sc
Access mode: ReadWriteMany
Mount via access point
Security groups allow NFS 2049 from worker nodes
Use fsGroup / access point UID/GID to solve permissions
EFS n’est pas idéal pour bases transactionnelles exigeantes en latence. Les petits fichiers, metadata intensives et locks peuvent devenir coûteux en performance.
19.4 Amazon FSx : Windows File Server, Lustre, ONTAP, OpenZFS

Amazon FSx fournit des systèmes de fichiers managés spécialisés. AWS propose notamment FSx for Windows File Server, FSx for Lustre, FSx for NetApp ONTAP et FSx for OpenZFS. Le choix dépend du protocole, du workload, de l’écosystème et du besoin de fonctionnalités enterprise.

FSxProtocoles / cibleCas d’usageForces
Windows File ServerSMB, Active DirectoryShares Windows, lift-and-shift.ACL Windows, intégration AD.
LustreFilesystem HPCHPC, ML, analytics, scratch rapide.Très haut débit, intégration S3.
NetApp ONTAPNFS, SMB, iSCSIEnterprise file, migration NetApp.Snapshots, SnapMirror, multi-protocol.
OpenZFSNFSWorkloads ZFS, snapshots/clones.ZFS semantics, clones rapides.
  • Windows shares + AD : FSx Windows.
  • HPC/IA avec throughput massif : FSx Lustre.
  • NetApp existant ou multi-protocol enterprise : FSx ONTAP.
  • ZFS workloads, clones, NFS : FSx OpenZFS.
ApplicationsProtocol SMB/NFS/Lustre/iSCSIFSx managed filesystemBackups / Snapshots / Replication
FSx est puissant mais chaque variante a ses limites, son pricing, ses options de déploiement multi-AZ, ses performances et sa logique backup. Ne pas choisir FSx “générique” sans matcher le filesystem au workload.
19.5 AWS Backup : centralisation backup

AWS Backup centralise et automatise la protection des données sur plusieurs services AWS et workloads hybrides. Il fournit plans, règles de rétention, vaults, copies cross-region/cross-account, restore testing et mécanismes de conformité.

ResourcesBackup PlanBackup VaultCopy / Retention / Restore
ConceptRôle
Backup planSchedule, lifecycle, retention.
Backup vaultConteneur de recovery points.
Vault LockProtection WORM/compliance selon mode.
Cross-account copyIsolation contre compte compromis.
Restore testingValidation automatisée de restaurabilité.
  • Plans par criticité : gold/silver/bronze.
  • Rétention courte + longue selon conformité.
  • Copies cross-region pour DR.
  • Copies cross-account pour ransomware/admin compromis.
  • Tags pour inclure automatiquement les ressources.
Gold: every 1h, retain 7d, daily 35d, monthly 1y, copy to DR account
Silver: daily, retain 35d
Bronze: weekly, retain 30d
Critical: Vault Lock + restore testing quarterly
Avoir des backups visibles dans la console ne prouve pas que l’application est restaurable. Il faut tester la restauration complète : IAM, KMS, réseau, DNS, données et application.
19.6 AWS Storage Gateway : hybrid cloud

AWS Storage Gateway connecte des environnements on-premises au stockage AWS via des appliances virtuelles ou EC2. Il sert aux migrations, caches locaux, sauvegardes vers cloud, intégrations NFS/SMB vers S3, volumes cloud-backed et remplacement progressif de bande.

GatewayInterfaceBackendUsage
S3 File GatewayNFS/SMBS3Fichiers on-prem vers objets.
FSx File GatewaySMBFSx WindowsAccès cache vers shares Windows AWS.
Volume GatewayiSCSIEBS snapshots/cloud-backed volumesApplications bloc hybrides.
Tape GatewayVTLS3/GlacierRemplacement bande backup.
On-prem appGateway applianceLocal cacheAWS StorageBackup / Archive
  • Dimensionner cache local.
  • Prévoir bande passante WAN.
  • Définir comportement en perte lien.
  • Chiffrer et contrôler IAM.
  • Surveiller upload buffer, cache hit, queue cloud.
Une gateway hybride dépend du réseau. Il faut des runbooks de perte WAN, saturation, cache full et resynchronisation.
19.7 Cas d’usage AWS Storage : web apps, data lake, backup, HPC, AI
UsageService AWSPattern
Web assetsS3 + CloudFrontStatic content, images, JS/CSS.
VM disksEBSBoot, app, DB volumes.
Linux shared filesEFSRWX, EKS, CMS.
Windows sharesFSx WindowsSMB + AD.
HPC/AI scratchFSx Lustre + S3Training, simulation, analytics.
Backup centraliséAWS Backup + S3/Object LockRansomware protection.
Data lakeS3 + Glue/Athena/EMRParquet, Iceberg, analytics.
IngestS3 rawGlue catalogEMR/AthenaCurated / BI / ML
EC2/RDS/EFS/FSxAWS Backup PlanVault LockCross-account copyRestore Drill
Le bon service AWS Storage dépend du protocole attendu : bloc pour OS/DB, fichier pour POSIX/SMB partagé, objet pour API/data lake/archive, backup pour gouvernance et restauration.
19.8 Design EBS production
WorkloadType EBS typiqueÀ surveiller
VM généralistegp3IOPS, throughput, burst/latency.
DB critiqueio2 / io2 Block Express selon besoinp99 latency, queue, fsync.
Logs séquentielsst1 ou gp3 throughputDébit soutenu.
Données froidessc1 ou S3 selon accèsLatence et pattern réel.

Pour bases exigeantes, séparer data, logs, temp et backup staging. Les snapshots multi-volume aident à capturer un point cohérent entre volumes attachés à la même instance.

lsblk
nvme list
iostat -x 1
sudo growpart /dev/nvme1n1 1
sudo resize2fs /dev/nvme1n1p1
sudo xfs_growfs /data
aws ec2 modify-volume --volume-id vol-xxx --size 2048
  • Encryption par défaut.
  • Tags App/Owner/Env/Backup.
  • Snapshots et rétention.
  • Alarmes BurstBalance/Queue/Latency si pertinentes.
  • Test restore depuis snapshot.
19.9 Sécurité S3 : Block Public Access, IAM, KMS, Object Lock
  • S3 Block Public Access activé sauf exception documentée.
  • Bucket policies minimales.
  • IAM roles, pas de clés longues dans code.
  • SSE-S3 ou SSE-KMS selon criticité.
  • Versioning + Object Lock pour backup.
  • CloudTrail data events pour buckets sensibles.
  • Macie pour détection de données sensibles si besoin.
{
  "Version": "2012-10-17",
  "Statement": [{
    "Effect": "Deny",
    "Principal": "*",
    "Action": "s3:*",
    "Resource": ["arn:aws:s3:::bucket", "arn:aws:s3:::bucket/*"],
    "Condition": {"Bool": {"aws:SecureTransport": "false"}}
  }]
}
Object Lock doit être pensé à la création/activation du bucket et testé. Il protège contre suppressions et modifications pendant une durée, mais peut aussi bloquer des purges légitimes.
CloudTrail data eventsTraçabilité objet fine.
S3 Access Logs / server accessAnalyse accès.
AWS ConfigDétection bucket public / encryption absent.
Security HubCentralisation findings.
19.10 FinOps S3 : egress, requests, lifecycle, small objects
PosteDéclencheurPiège
StorageGo/mois par classeVersions anciennes non expirées.
RequestsGET/PUT/LISTMillions de petits objets.
RetrievalIA/Glacier readsRestore massif.
EgressSortie région/InternetData lake lu hors région.
ReplicationCRR/SRRDouble stockage + transfert.
  • S3 Storage Lens.
  • S3 Inventory.
  • Cost Explorer par tags.
  • Budgets et anomaly detection.
  • Lifecycle reports.
  • CloudWatch metrics par bucket si activées.
Actions FinOps:
- Abort incomplete multipart uploads after 7 days
- Expire non-current versions
- Compact small files into Parquet
- Move cold prefixes to IA/Glacier
- Enable Intelligent-Tiering for unpredictable access
- Tag buckets and prefixes by owner/cost center
19.11 EFS design : performance, mount targets, access points, EKS
AZ-a EC2/EKSMount target aAZ-b EC2/EKSMount target bEFS File System
  • Créer mount targets dans les AZ utilisées.
  • Limiter SG NFS 2049 aux clients nécessaires.
  • Utiliser access points pour EKS et permissions.
  • Choisir performance/throughput mode selon workload.
  • Activer lifecycle vers EFS IA si données froides.
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: efs-rwx
provisioner: efs.csi.aws.com
parameters:
  provisioningMode: efs-ap
  fileSystemId: fs-xxxx
  directoryPerms: "750"
Éviter EFS comme disque de base transactionnelle lorsque la latence p99 est critique. Tester avec fio et workload réel.
19.12 FSx en profondeur : Windows, Lustre, ONTAP, OpenZFS
BesoinFSxPourquoi
Partages Windows ADFSx WindowsSMB, ACL, AD.
HPC/ML throughputFSx LustreDébit massif, lien S3.
NetApp migrationFSx ONTAPNFS/SMB/iSCSI, snapshots, SnapMirror.
ZFS NFS workloadsFSx OpenZFSSnapshots/clones, NFS, ZFS semantics.
S3 DatasetFSx LustreHPC / Training Jobs
  • Multi-protocol file/block.
  • Snapshots/clones.
  • SnapMirror pour migration/DR.
  • Familiarité NetApp pour équipes existantes.
19.13 Archive AWS : S3 Glacier classes, retrieval, compliance
ClasseUsageRTO typique à valider
Glacier Instant RetrievalArchive avec besoin accès immédiat rare.Immédiat.
Glacier Flexible RetrievalArchive classique.Minutes/heures selon option.
Glacier Deep ArchiveConservation très longue et très froide.Heures.
  1. Identifier objet/version.
  2. Lancer restore avec tier adapté.
  3. Attendre disponibilité temporaire.
  4. Copier vers Standard si exploitation durable.
  5. Mesurer délai réel.
  • Object Lock retention.
  • Legal hold.
  • Vault Lock pour anciens usages Glacier vaults.
  • Audit CloudTrail.
  • Tags classification.
19.14 DR et réplication AWS : snapshots, CRR, copies
ServiceDR pattern
EBSSnapshots cross-region, AMI copy, recreate EC2.
S3CRR/SRR, versioning, Object Lock.
EFSEFS replication selon régions supportées.
FSxBackups, replication selon famille FSx.
AWS BackupCross-account/cross-region backup copies.
Backup-only = RTO long, coût bas
Warm standby = RTO moyen, coût moyen
Active-active = RTO faible, coût/complexité élevés
  1. Restaurer dans région DR.
  2. Recréer IAM/KMS/réseau.
  3. Monter volumes/filesystems.
  4. Basculer DNS Route 53.
  5. Valider applicatif.
  6. Documenter temps réel.
19.15 AWS Storage pour EKS : EBS/EFS/FSx CSI
BesoinDriverMode
Bloc RWOEBS CSIVolumes zonaux, DB, pods stateful.
RWX NFSEFS CSIUploads, shared files.
HPC/Windows/ONTAP/ZFSFSx CSI selon backendWorkloads spécialisés.
ObjetS3 SDK / Mountpoint patternsData lake, assets, pas POSIX complet.

Avec EBS CSI, utiliser WaitForFirstConsumer pour créer le volume dans la zone du pod. Les EBS volumes ne se déplacent pas librement entre AZ.

apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: ebs-gp3
provisioner: ebs.csi.aws.com
parameters:
  type: gp3
  encrypted: "true"
volumeBindingMode: WaitForFirstConsumer
allowVolumeExpansion: true
19.16 Bases de données sur AWS storage : EBS, RDS, Aurora
  • gp3 pour généraliste, io2 pour critique.
  • Séparer data/log/temp si nécessaire.
  • Snapshots multi-volume ou backup natif DB.
  • Surveiller fsync latency, queue, throughput.
RDSStockage managé, snapshots, PITR, Multi-AZ.
AuroraStockage distribué managé, replicas, PITR.
DynamoDBNoSQL service, PITR/backup, pas EBS visible.
RedshiftAnalytics, RA3 managed storage selon architecture.
Pour DB critiques, le snapshot disque seul peut être insuffisant. Utiliser backup DB natif/PITR et tester restauration transactionnelle.
19.17 HPC / AI / Analytics : FSx Lustre, S3, EMR, SageMaker
S3 datasetsFSx LustreEC2 GPU/HPCResults to S3
S3Data lake durable.
FSx LustreScratch haut débit.
EMR/Athena/GlueAnalytics S3.
SageMakerTraining/feature/model artifacts.
EBS io2/gp3Volumes rapides pour notebooks/DB.
  • Parquet/Iceberg pour analytics.
  • Éviter petits fichiers.
  • Localité régionale entre compute et S3.
  • Lifecycle des datasets intermédiaires.
19.18 Migration & hybridation : DataSync, Snow, Transfer, Gateway
OutilUsage
AWS DataSyncMigration/sync NFS/SMB/object vers AWS.
Snow FamilyTransfert massif offline/edge.
Transfer FamilySFTP/FTPS/FTP vers S3/EFS.
Storage GatewayHybrid cache, file/volume/tape.
Direct ConnectLien privé prévisible.
  1. Inventaire données et owners.
  2. Classification hot/cold/sensible.
  3. Choix cible : S3/EFS/FSx/EBS.
  4. Transfert initial.
  5. Delta sync.
  6. Cutover applicatif.
  7. Validation checksum/ACL/performance.
  8. Rollback temporaire.
Migrer des fichiers vers S3 change la sémantique. Les applications POSIX doivent être adaptées ou utiliser EFS/FSx/Gateway.
19.19 Accès privé & réseau : VPC endpoints, PrivateLink, SG, DNS
ServiceAccès privé typique
S3Gateway endpoint ou interface endpoint selon besoin.
EFSMount targets dans subnets + SG NFS.
FSxSubnets, security groups, AD/DNS selon FSx.
EBSAttach EC2 dans AZ, APIs via endpoint si privé.
  • Private hosted zones pour endpoints internes.
  • Résolution AD pour FSx Windows/ONTAP selon cas.
  • Éviter hardcoding d'IP.
  • Tester depuis chaque subnet/AZ.
aws ec2 describe-vpc-endpoints
nslookup bucket-endpoint
telnet fs-xxx.efs.region.amazonaws.com 2049
mount -t nfs4 ...
check route tables, SG, NACL, DNS, IAM
19.20 Observabilité AWS Storage : CloudWatch, CloudTrail, Storage Lens
ServiceMétriques clés
EBSRead/Write ops, throughput, queue length, burst balance.
S3Requests, 4xx/5xx, bytes, Storage Lens, Inventory.
EFSBurst credits, throughput, percent IO limit, client connections.
FSxThroughput, IOPS, capacity, network, filesystem health.
AWS BackupJob success/failure, restore tests.
  • CloudTrail management events.
  • S3 data events pour buckets sensibles.
  • S3 access logs si besoin forensic.
  • AWS Config rules pour drift sécurité.
  • Cost Explorer/Budgets pour anomalies.
  • EBS volume queue/latency élevée.
  • S3 public access change.
  • Backup job failed.
  • EFS burst credits faibles.
  • KMS key disabled.
  • Cost anomaly egress.
19.21 Modèle de coûts AWS Storage
ServiceCoûts principaux
EBSGB-month, IOPS provisionnées, throughput provisionné, snapshots.
S3Storage class, requests, retrieval, lifecycle transitions, egress, replication.
EFSGB stored, IA/retrieval, throughput provisionné si choisi.
FSxCapacity, throughput, backups, deployment mode.
AWS BackupBackup storage, restores, cross-region copies.
Coût réel = capacité + performance + opérations + transfert + protection + rétention + oubli
  • Tags obligatoires : App, Owner, Env, CostCenter, DataClass.
  • Budgets par compte/projet.
  • Revue snapshots sans owner.
  • Lifecycle S3 par bucket.
  • Rapport volumes unattached.
19.22 Anti-patterns AWS Storage
Anti-patternImpactCorrection
Bucket public non vouluFuite données.Block Public Access + Config.
EBS gp3 non tunéLatence DB.IOPS/throughput adaptés.
Snapshots éternelsCoût invisible.Lifecycle/rétention.
EFS pour DB sensiblep99 élevée.EBS/RDS adapté.
KMS key désactivéeDonnées illisibles.Change control KMS.
S3 sans lifecycleCoût croissant.Lifecycle + Storage Lens.
  • Volumes unattached depuis 30 jours.
  • Snapshots sans tag.
  • Buckets sans owner.
  • Pas de restore testé.
  • CloudTrail data events absents sur données critiques.
19.23 Runbooks incidents AWS Storage
  1. Identifier principal IAM et action.
  2. Vérifier bucket policy, IAM policy, SCP.
  3. Vérifier KMS key policy si SSE-KMS.
  4. Vérifier Block Public Access/VPC endpoint policy.
  5. Analyser CloudTrail.
  1. Confirmer filesystem full ou latency OS.
  2. Vérifier CloudWatch EBS metrics.
  3. Modifier volume size/IOPS/throughput si nécessaire.
  4. Étendre partition/filesystem.
  5. Post-mortem capacity/perf.
  1. Vérifier mount target dans AZ.
  2. Vérifier SG NFS 2049.
  3. Vérifier DNS.
  4. Vérifier IAM/access point si utilisé.
  5. Tester mount manuel.
  1. Identifier point de restauration.
  2. Restaurer isolé.
  3. Valider données/application.
  4. Basculer trafic.
  5. Documenter RTO/RPO réel.
19.24 Checklist production AWS Storage
ContrôleOK ?Note
Service adapté au protocoleEBS/EFS/S3/FSx.
Région/AZ documentéeDR, latency, sovereignty.
IAM moindre privilègeRoles, no shared keys.
Encryption/KMS validéKey policy, rotation, recovery.
Backup/restore testéAWS Backup/snapshots/app backup.
Lifecycle/retentionS3, snapshots, backups.
  • CloudWatch alarms.
  • CloudTrail enabled.
  • AWS Config storage rules.
  • Budgets/anomaly detection.
  • Runbooks incidents.
  • Tags obligatoires.
  • S3 Block Public Access.
  • Object Lock/Vault Lock pour backups critiques.
  • Private endpoints si données internes.
  • KMS policies surveillées.
  • Cross-account backup copy.
NO-GO si : bucket public non justifié, KMS non maîtrisé, aucun restore testé, snapshots sans expiration, pas de budget alert, données critiques single-AZ sans DR, IAM trop large.