Project Oxygen & Ideo-LabIDEO LAB Dashboard 2026

🟦 Storage Systems — Chapitre 21 : Google Cloud Storage

Très grosse page dédiée au stockage Google Cloud : Persistent Disk, Hyperdisk, Google Cloud Storage, Filestore, Backup and DR, puis les cas d’usage Data Analytics, BigQuery, AI/ML, data lake, GKE, bases de données, HPC/media, migration hybride, sécurité IAM/CMEK/VPC Service Controls, FinOps, observabilité, anti-patterns, runbooks et checklist production.

Persistent DiskHyperdiskGoogle Cloud StorageFilestoreBackup and DRBigQuery / Vertex AI / GKE
21.1

Persistent Disk

Standard, SSD, Balanced, Extreme : disques bloc zonaux/régionaux pour Compute Engine et GKE, snapshots et images.

Persistent DiskSSDBalanced
21.2

Hyperdisk

Performance avancée : IOPS/throughput provisionnables, Extreme, Balanced, Throughput, ML/DB/SAP workloads.

HyperdiskIOPSThroughput
21.3

Google Cloud Storage

Standard, Nearline, Coldline, Archive : buckets, objets, lifecycle, retention, versioning, events et data lake.

GCSNearlineArchive
21.4

Filestore

NFS managé : Basic, Enterprise, High Scale, GKE RWX, workloads fichiers, home dirs, apps lift-and-shift.

FilestoreNFSRWX
21.5

Backup and DR

Protection workloads : Backup and DR Service, snapshots, VM/app-aware, VMware, databases, retention et restore.

BackupDRRestore
21.6

Cas d’usage

Data analytics, BigQuery, AI/ML, data lake, GKE, HPC, media, archives, backups et applications cloud-native.

BigQueryAI/MLData lake
21.7

Design Persistent Disk

Choisir zonal/régional, pd-balanced/pd-ssd/pd-standard, snapshots, images, resize, encryption et monitoring.

DesignRegional PDSnapshots
21.8

Design Hyperdisk

Dimensionner IOPS/throughput indépendamment, choisir profil, latency SLO, tuning DB et comparaison avec PD.

SizingSLODatabase
21.9

Sécurité GCS

IAM, Uniform Bucket-Level Access, Public Access Prevention, CMEK, retention policy, object holds, audit logs.

IAMCMEKRetention
21.10

FinOps GCS

Classes, operations, retrieval, early deletion, lifecycle, small objects, requester pays, storage insights et budgets.

FinOpsLifecycleBudgets
21.11

Filestore design

Tiers, capacity/performance, NFS exports, VPC, firewall, backups, snapshots, GKE CSI et HA enterprise.

NFSGKE CSIHA
21.12

Archive GCP

Nearline, Coldline, Archive : minimum storage duration, retrieval costs, lifecycle, compliance et restore planning.

ArchiveColdlineRetention
21.13

DR et réplication GCP

Regional disks, snapshots cross-region, GCS dual/multi-region, Turbo Replication, Backup DR et failover patterns.

DRReplicationRPO/RTO
21.14

Google Storage pour GKE

PD CSI, Filestore CSI, GCS FUSE/CSI patterns, StatefulSets, topology, snapshots et operators DB.

GKECSIPVC
21.15

Bases de données et stockage GCP

Compute Engine DB, Cloud SQL, AlloyDB, Spanner, Bigtable, PD/Hyperdisk, PITR, replicas et backups.

Cloud SQLAlloyDBSpanner
21.16

Analytics / IA / Data Lake

Cloud Storage + BigQuery, Dataproc, Dataflow, Vertex AI, Parquet, BigLake, Iceberg et governance.

BigQueryVertex AIBigLake
21.17

HPC / Media / ML pipelines

Filestore High Scale, Parallelstore, Cloud Storage staging, GPUs/TPUs, render farms, genomics et simulation.

HPCGPU/TPUMedia
21.18

Migration & hybridation

Storage Transfer Service, Transfer Appliance, Migrate to Virtual Machines, Cloud VPN/Interconnect, NetApp Volumes.

MigrationTransferHybrid
21.19

Accès privé & réseau

Private Google Access, Private Service Connect, VPC Service Controls, firewall, DNS, Filestore IPs et egress.

Private AccessVPC SCDNS
21.20

Observabilité GCP Storage

Cloud Monitoring, Cloud Logging, audit logs, metrics PD/GCS/Filestore, budgets, asset inventory et alerting.

MonitoringLoggingAlerts
21.21

Modèle de coûts GCP Storage

PD/Hyperdisk capacity/perf, GCS storage/operations/retrieval/egress, Filestore provisioned capacity, backups.

CostPricingBudgets
21.22

Anti-patterns GCP Storage

Buckets publics, lifecycle absent, Archive mal choisie, PD zonal pour critique, snapshots éternels, VPC SC oublié.

Anti-patternsRiskGovernance
21.23

Runbooks incidents

PD full/latency, GCS permission denied, bucket public, Filestore mount failed, backup failed, restore urgent.

RunbookIncidentRestore
21.24

Checklist production GCP Storage

Préprod : IAM, CMEK, private access, lifecycle, backup, DR, monitoring, budgets, labels et restore drills.

Prod-readyAuditChecklist
21.1 Persistent Disk : Standard, SSD, Balanced
Définition

Persistent Disk est le stockage bloc principal de Compute Engine et GKE. Il expose des disques durables attachables aux VMs : boot disks, data disks, volumes applicatifs, bases de données, disques de pods via CSI, images et snapshots.

Point clé : un Persistent Disk peut être zonal ou régional selon le besoin. Le disque régional réplique les données dans deux zones d’une même région pour améliorer la disponibilité locale.
Flux logique
Compute Engine / GKEBlock devicePersistent DiskSnapshot / ImageRestore / DR
TypePositionnementUsagesAttention
pd-standardHDD économique.Archives, workloads froids, dev/test.Latence/IOPS faibles.
pd-balancedSSD équilibré coût/performance.VMs générales, apps, boot/data.Choix par défaut courant, à benchmarker.
pd-ssdSSD performant.DB, workloads I/O.Coût supérieur.
pd-extremePerf provisionnée historique.Workloads spécialisés.Souvent à comparer avec Hyperdisk.
Regional PDRéplication dans deux zones.HA régionale.Coût/latence/choix zones.

Les snapshots PD sont incrémentaux et peuvent servir à backup, clone, migration, images, restauration et DR. Les images servent à standardiser les boot disks ou templates de VMs.

  • Planifier snapshot schedule.
  • Copier ou utiliser snapshots dans autre région selon DR.
  • Éviter snapshots éternels sans labels ni owner.
  • Tester restore VM et application.
gcloud compute disks list
gcloud compute disks describe disk-prod-01 --zone=europe-west1-b
gcloud compute disks snapshot disk-prod-01 --zone=europe-west1-b --snapshot-names=snap-prod-01
gcloud compute disks resize disk-prod-01 --zone=europe-west1-b --size=2048GB
lsblk
sudo growpart /dev/sdb 1
sudo resize2fs /dev/sdb1
Un PD zonal pour une application critique exige un plan de restauration ou de réplication. Un snapshot disque ne garantit pas la cohérence applicative d’une base sans quiesce ou backup natif.
21.2 Hyperdisk : performance avancée

Hyperdisk est la génération avancée de stockage bloc Google Cloud, pensée pour configurer performance, capacité, IOPS et throughput plus finement que les Persistent Disks classiques. Il cible les bases de données exigeantes, SAP, analytics, workloads transactionnels, ML et charges avec SLO stricts.

VM workloadHyperdiskProvisioned IOPSProvisioned ThroughputMonitoring SLO
FamillePositionnementUsage
Hyperdisk BalancedÉquilibre coût/performance configurable.Applications et bases générales.
Hyperdisk ExtremeIOPS très élevées.SAP HANA, bases critiques, latence stricte.
Hyperdisk ThroughputDébit séquentiel élevé.Analytics, scans, streaming, data processing.
Hyperdisk MLOptimisé pour workloads ML selon disponibilité.Training/inference data paths.
CapacityGiB/TiB

Taille provisionnée.

IOPSp95/p99

Random I/O.

ThroughputMB/s

Flux séquentiel.

LatencySLO

Expérience DB/app.

  1. Mesurer workload actuel : IOPS, MB/s, latency p95/p99.
  2. Séparer lecture/écriture, random/séquentiel.
  3. Choisir famille Hyperdisk.
  4. Provisionner capacité + IOPS + throughput.
  5. Tester fio/benchmark applicatif.
  6. Surveiller coût/performance après mise en prod.
Hyperdisk permet de provisionner fort, donc de facturer fort. L’utiliser sans SLO mesuré, sans benchmark et sans alerte FinOps peut surdimensionner la plateforme.
21.3 Google Cloud Storage : Standard, Nearline, Coldline, Archive

Google Cloud Storage est le stockage objet de GCP : buckets, objets, metadata, classes de stockage, lifecycle, versioning, retention policies, events, data lake et intégration forte avec BigQuery, Dataproc, Dataflow, Vertex AI et Cloud CDN.

App / SDKGCS APIBucketObject + metadataLifecycle / Analytics / AI
ClasseUsageAttention
StandardAccès fréquent, workloads actifs.Stockage plus cher, accès plus direct.
NearlineAccès environ mensuel ou rare.Retrieval et minimum duration.
ColdlineAccès très rare.Frais de retrieval plus importants.
ArchiveConservation longue, accès exceptionnel.Minimum duration, retrieval, RTO métier.
  • Lifecycle rules par age, prefix, class, versions.
  • Object Versioning pour historique.
  • Retention policy et holds pour conservation.
  • Pub/Sub notifications et Eventarc patterns.
  • Bucket Lock pour rendre une policy de retention non réductible.
  • Uniform Bucket-Level Access pour simplifier IAM.
gcloud storage buckets list
gcloud storage ls gs://bucket-prod
gcloud storage cp file.parquet gs://bucket-prod/raw/
gcloud storage rsync ./data gs://bucket-prod/data --recursive
gcloud storage buckets update gs://bucket-prod --uniform-bucket-level-access
gcloud storage objects update gs://bucket-prod/path/file --storage-class=COLDLINE
GCS est excellent pour objet/data lake, mais pas pour remplacer un filesystem POSIX. Pour NFS managé, utiliser Filestore ; pour disque VM, utiliser Persistent Disk ou Hyperdisk.
21.4 Filestore : NFS managé

Filestore fournit un service NFS managé pour Compute Engine, GKE et applications nécessitant un filesystem partagé. Il est adapté aux partages Linux, applications lift-and-shift, home directories, workloads RWX Kubernetes et certains pipelines nécessitant POSIX/NFS.

VMs / GKE PodsNFS mountFilestore instanceBackups / Snapshots
TierPositionnementUsage
Basic HDD/SSDWorkloads simples.Dev/test, partages modestes.
ZonalPerformance zonale.Applications dans une zone.
Regional / EnterpriseHA régionale selon offre.Production, disponibilité renforcée.
High ScaleTrès grands volumes/performance.HPC, analytics, media, ML.
  • GKE ReadWriteMany via Filestore CSI.
  • Applications POSIX/NFS lift-and-shift.
  • Partages de médias, rendus, modèles ML.
  • Home directories Linux.
  • Workloads HPC nécessitant débit fichier.
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: filestore-rwx
provisioner: filestore.csi.storage.gke.io
parameters:
  tier: enterprise
  network: default
allowVolumeExpansion: true
NFS partagé ne rend pas automatiquement une application concurrente sûre. Locks, permissions, metadata, petits fichiers et latence doivent être testés avec le workload réel.
21.5 Backup and DR : protection workloads

Google Cloud Backup and DR aide à protéger VMs, bases, workloads applicatifs et environnements hybrides avec des policies, appliances/services de gestion, snapshots, copies et restaurations. Il complète les snapshots natifs, les backups managés des bases et les stratégies de DR.

WorkloadsBackup policyBackup vault / applianceRecovery pointRestore drill
NiveauExemplesPoint clé
InfrastructureVM disks, snapshots.Rapide mais cohérence app à valider.
ApplicationDatabase backup, logs, PITR.Restauration transactionnelle.
ObjectGCS versioning/retention.Protection suppression logique.
DRRegional restore/failover.RTO/RPO et runbooks.
  • Policies par criticité.
  • Copies cross-region/cross-project si nécessaire.
  • Rétention alignée métier et conformité.
  • Restore tests trimestriels.
  • Labels pour owner, app, env, compliance.
Snapshot configured ne veut pas dire restore validé. Tester un restore complet dans un projet/réseau isolé avec l’application, les secrets, les permissions et les données.
21.6 Cas d’usage : analytics, BigQuery, AI/ML, data lake
UsageService GCPPattern
VM disksPersistent Disk / HyperdiskBoot, data, DB volumes.
Objet/data lakeCloud StorageRaw/curated, Parquet, BigLake.
Fichiers NFSFilestoreRWX, shared Linux files.
AnalyticsBigQuery + GCSExternal tables, load jobs, lakehouse.
AI/MLVertex AI + GCSDatasets, models, artifacts.
Backup/DRBackup and DR + snapshotsRecovery points, restore drills.
IngestGCS rawDataflow/DataprocBigQuery/BigLakeLooker / Vertex AI
  • GCS pour datasets et artifacts.
  • Vertex AI pour training, pipelines, model registry.
  • BigQuery pour features analytiques.
  • Filestore/Parallelstore pour workloads fichier haute performance.
  • TPU/GPU workloads avec staging local et GCS durable.
GCP brille fortement sur le couple Cloud Storage + BigQuery/Vertex AI : objet durable, analytics serverless, pipelines data et IA intégrée.
21.7 Design Persistent Disk : zonal/régional, snapshots, resize
BesoinOptionAttention
VM généralepd-balancedBon compromis.
DB/moderate IOpd-ssdSurveiller p99.
Coût baspd-standardPas pour I/O critique.
HA zonale renforcéeregional PDCoût et failover design.
gcloud compute disks resize DATA_DISK --zone=ZONE --size=SIZE_GB
gcloud compute snapshots list
gcloud compute resource-policies create snapshot-schedule daily-policy --region=REGION
gcloud compute disks add-resource-policies DATA_DISK --zone=ZONE --resource-policies=daily-policy
  • Disk read/write ops.
  • Throughput.
  • Latency côté guest.
  • Filesystem usage.
  • Snapshot age et labels.
21.8 Design Hyperdisk : SLO, IOPS, throughput
EntréeQuestion
IOPSPic réel, random read/write ?
ThroughputScan séquentiel, backup, analytics ?
Latencyp95/p99 acceptable ?
CapacityCroissance 24 mois ?
CostPerformance provisionnée utile ou gaspillée ?
  • Séparer data/log/temp si pertinent.
  • Mesurer fsync/write latency.
  • Tester sous charge réelle.
  • Aligner machine type, vCPU, mémoire et disque.
Provisionner des IOPS ne garantit pas une application rapide si la VM, le filesystem, le moteur DB ou le réseau deviennent le bottleneck.
21.9 Sécurité GCS : IAM, UBLA, CMEK, retention
  • Uniform Bucket-Level Access pour simplifier IAM.
  • Public Access Prevention sur buckets internes.
  • IAM least privilege par service account.
  • CMEK via Cloud KMS pour exigences fortes.
  • Retention policies et holds pour conformité.
  • Audit logs pour accès sensibles.
  • VPC Service Controls pour périmètre anti-exfiltration.
Storage Object ViewerLecture objets.
Storage Object CreatorÉcriture sans suppression.
Storage Object AdminPuissant, à limiter.
Storage AdminAdministration buckets, très sensible.
Une policy de retention verrouillée peut empêcher la suppression même par admin. C’est utile pour conformité, dangereux si mal configuré.
21.10 FinOps GCS : classes, operations, retrieval, lifecycle
PosteDéclencheurPiège
StorageGo/mois par classe.Versions anciennes.
OperationsClass A/B operations.Petits objets, listings fréquents.
RetrievalNearline/Coldline/Archive reads.Restore massif.
Early deletionSuppression avant minimum duration.Lifecycle mal réglé.
EgressSortie région/Internet.Analytics hors région.
  • Lifecycle par prefix.
  • Expiration old versions.
  • Labels owner/cost center.
  • Budgets et alerting.
  • Compactage petits fichiers.
  • Requester Pays pour datasets partagés.
Standard 30d → Nearline 90d → Coldline 180d → Archive 365d → Delete selon politique
21.11 Filestore design : tiers, capacity/performance, GKE CSI
AspectDécision
TierBasic, zonal, regional/enterprise, high scale.
CapacityProvisionnée, impact performance selon tier.
NetworkVPC, IP range, firewall NFS.
BackupBackups/snapshots selon tier.
KubernetesFilestore CSI, RWX, permissions.
sudo apt-get install nfs-common
sudo mkdir -p /mnt/filestore
sudo mount -o rw,intr 10.x.x.x:/vol1 /mnt/filestore
df -h /mnt/filestore
  • Firewall NFS mal ouvert.
  • Performance metadata sous-estimée.
  • Quota/capacité provisionnée trop faible.
  • Pas de backup de partages critiques.
21.12 Archive GCP : Nearline, Coldline, Archive
ClasseUsageAttention
NearlineAccès rare mensuel.Retrieval + minimum duration.
ColdlineAccès très rare.Coût retrieval supérieur.
ArchiveConservation long terme.Accès exceptionnel, early deletion.
  • Aligner classe avec RTO/RPO.
  • Utiliser lifecycle automatique.
  • Tester restore et coûts.
  • Conserver metadata riche pour retrouver les objets.
  • Éviter transitions trop rapides qui déclenchent minimum duration.

Associer retention policies, object holds, audit logs et labels de classification pour les archives réglementaires.

21.13 DR et réplication GCP : regional disks, snapshots, GCS multi-region
ServiceDR pattern
Persistent DiskRegional PD, snapshots, images.
HyperdiskSelon disponibilité et snapshots.
GCSDual-region, multi-region, replication features.
FilestoreBackups, regional tiers selon besoin.
DatabasesReplicas, PITR, cross-region selon service.
Backup-only = coût bas, RTO long
Regional active = coût moyen/élevé, RTO plus court
Active-active = complexité forte
  1. Restaurer compute dans région cible.
  2. Restaurer disques/données.
  3. Valider IAM/KMS/VPC/DNS.
  4. Tester application.
  5. Mesurer RTO/RPO.
21.14 Google Storage pour GKE : PD CSI, Filestore CSI, GCS patterns
BesoinOptionMode
Bloc RWOCompute Engine PD CSIStatefulSet, DB, zonal/regional.
RWX NFSFilestore CSIShared files.
ObjetSDK GCS / Cloud Storage FUSE CSI selon casData lake/assets, pas POSIX complet.
DB opéréeOperators + PD/HyperdiskBackups et failover applicatifs.
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: pd-balanced
provisioner: pd.csi.storage.gke.io
parameters:
  type: pd-balanced
volumeBindingMode: WaitForFirstConsumer
allowVolumeExpansion: true
  • Volume zonal créé dans mauvaise zone.
  • RWX attendu sur PD alors que RWO.
  • Snapshots PVC sans cohérence DB.
  • GCS FUSE utilisé comme filesystem transactionnel.
21.15 Bases de données et stockage GCP : Cloud SQL, AlloyDB, Spanner
ServiceStockageUsage
Compute Engine DBPD/HyperdiskContrôle OS/DB complet.
Cloud SQLManaged storage + PITRPostgreSQL/MySQL/SQL Server managé.
AlloyDBArchitecture managée PostgreSQL-compatiblePostgreSQL haute performance.
SpannerDistribué managéGlobal consistency/scale.
BigtableNoSQL wide-columnTrès gros volumes/latence basse.
  • Utiliser PITR pour bases managées.
  • Tester restore transactionnel.
  • Surveiller storage growth et I/O.
  • Choisir Hyperdisk pour DB VM très exigeantes.
  • Documenter RPO/RTO par base.
Les snapshots disques ne remplacent pas les mécanismes DB natifs : WAL/binlog, PITR, replicas, backups logiques et tests restore.
21.16 Analytics / IA / Data Lake : GCS, BigQuery, Vertex AI
IngestGCS RawDataflow/DataprocBigQuery / BigLakeVertex AI / Looker
  • Parquet/Avro/ORC pour analytics.
  • Iceberg/BigLake selon stratégie table.
  • Partitionnement par date/tenant/domaine.
  • Compression adaptée.
  • Éviter petits fichiers.
DataplexGouvernance data lake.
Data CatalogMetadata et découverte.
IAM/VPC SCSécurité et périmètre.
LabelsFinOps et ownership.
21.17 HPC / Media / ML pipelines
WorkloadStorageNotes
Training MLGCS + local SSD/Filestore/ParallelstoreStaging + throughput.
Render farmFilestore/Parallelstore + GCSShared assets.
GenomicsGCS + batch/HPCLarge datasets.
SimulationHigh performance fileIO parallel.
GCS durable datasetHigh perf file/cacheGPU/TPU/HPC jobsResults to GCS

Les jobs ML/HPC ont souvent besoin d’un stockage durable objet pour le dataset et d’un niveau performant temporaire pour l’entraînement ou le calcul.

21.18 Migration & hybridation : Transfer Service, Appliance, Interconnect
OutilUsage
Storage Transfer ServiceTransfert vers GCS depuis cloud/on-prem/HTTP.
Transfer ApplianceMigration offline de gros volumes.
Migrate to Virtual MachinesMigration VM vers Compute Engine.
Cloud VPN / InterconnectConnectivité hybride.
NetApp VolumesEnterprise file/migration NetApp.
  1. Inventaire données, propriétaires, ACL.
  2. Classer block/file/object.
  3. Choisir cible GCS/Filestore/NetApp/PD.
  4. Transfert initial.
  5. Sync delta.
  6. Cutover.
  7. Validation checksum/permissions/perf.
Migrer un partage NFS vers GCS change les semantics. Si l’app exige POSIX, choisir Filestore/NetApp Volumes ou adapter l’application à l’objet.
21.19 Accès privé & réseau : Private Google Access, PSC, VPC SC
MécanismeUsage
Private Google AccessAccès privé aux APIs Google depuis subnet sans IP publique.
Private Service ConnectAccès privé à services managés.
VPC Service ControlsPérimètres anti-exfiltration pour services compatibles.
FirewallContrôle NFS/Filestore/VM access.
Cloud DNSRésolution privée/hybride.
  • IP privée dans VPC.
  • Firewall NFS ouvert uniquement aux clients.
  • Connexion depuis GKE/VMs dans réseau autorisé.
  • Tester latence et throughput par zone.
gcloud compute networks subnets describe SUBNET --region=REGION
gcloud compute firewall-rules list
nslookup storage.googleapis.com
gcloud access-context-manager perimeters list
mount -t nfs FILESTORE_IP:/share /mnt/test
21.20 Observabilité GCP Storage : Monitoring, Logging, audit
ServiceMétriques
Persistent Disk/HyperdiskOps, bytes, latency côté VM, capacity.
GCSRequests, bytes, object count, 4xx/5xx, storage class.
FilestoreCapacity, throughput, latency, operations.
Backup DRJob status, restore status, policy health.
  • Cloud Audit Logs.
  • Data Access logs pour buckets sensibles.
  • Cloud Logging sinks vers BigQuery/GCS.
  • Asset Inventory pour ressources orphelines.
  • Budget alerts et cost anomaly.
  • Disk latency élevée.
  • GCS bucket public ou IAM change.
  • Filestore capacity high.
  • Backup failed.
  • KMS key disabled.
  • Egress spike.
21.21 Modèle de coûts GCP Storage
ServiceCoûts principaux
Persistent DiskCapacity, type, snapshots.
HyperdiskCapacity, provisioned IOPS, provisioned throughput.
GCSStorage class, operations, retrieval, egress, early deletion.
FilestoreProvisioned capacity/tier, backups.
Backup DRProtected workloads, backup storage, operations.
Coût = capacité + performance + opérations + retrieval + egress + backup + rétention + ressources oubliées
  • Labels obligatoires.
  • Budgets par projet.
  • Lifecycle GCS.
  • Snapshots expirés automatiquement.
  • Revue disques non attachés.
  • Forecast mensuel.
21.22 Anti-patterns GCP Storage
Anti-patternImpactCorrection
Bucket public involontaireFuite données.Public Access Prevention + audit IAM.
Lifecycle absentCoût croissant.Rules par prefix.
Archive pour restore urgentRTO incompatible.Nearline/Coldline/Standard.
PD zonal critique sans DRPanne zone = outage.Regional PD/snapshots/replicas.
Snapshots éternelsCoût invisible.Retention policy.
VPC SC oublié pour données sensiblesExfiltration plus facile.Périmètre + IAM.
  • Buckets sans owner label.
  • Service accounts trop larges.
  • Filestore sans backup.
  • Disques unattached.
  • Pas de restore drill.
21.23 Runbooks incidents GCP Storage
  1. Identifier identité : user/service account.
  2. Vérifier IAM bucket/projet.
  3. Vérifier UBLA/ACL legacy.
  4. Vérifier VPC Service Controls.
  5. Vérifier CMEK/KMS permissions.
  6. Lire Audit Logs.
  1. Confirmer filesystem full ou latency dans OS.
  2. Vérifier metrics disque.
  3. Resize disk ou migrer vers type plus performant.
  4. Grow partition/filesystem.
  5. Post-mortem capacity/performance.
  1. Tester IP/DNS.
  2. Vérifier firewall NFS.
  3. Vérifier VPC/subnet/routing.
  4. Tester mount depuis VM de debug.
  5. Vérifier quota/capacité/état instance.
  1. Identifier recovery point.
  2. Restaurer dans projet/réseau isolé.
  3. Valider données et app.
  4. Basculer DNS/traffic.
  5. Documenter RTO/RPO.
21.24 Checklist production GCP Storage
ContrôleOK ?Note
Service adapté au protocolePD/Hyperdisk/GCS/Filestore.
Zonal/régional documentéDR, failover, latency.
IAM least privilegeService accounts, UBLA.
CMEK/KMS validéKeys, rotation, permissions.
Lifecycle GCSStandard/Nearline/Coldline/Archive.
Backup/restore testéApplication complète.
  • Cloud Monitoring alerts.
  • Audit logs activés pour données critiques.
  • Budgets et labels.
  • Snapshots avec retention.
  • Runbooks incidents.
  • Asset Inventory review.
  • Public Access Prevention.
  • Uniform Bucket-Level Access.
  • VPC Service Controls pour données sensibles.
  • Private access pour workloads internes.
  • Retention/holds pour archives critiques.
NO-GO si : bucket public non justifié, pas de restore testé, snapshots sans expiration, données critiques sur disque zonal sans DR, lifecycle absent, IAM trop large, KMS non maîtrisé.