🇫🇷 Storage Systems — Chapitre 23 : Scaleway Storage
Chapitre dense sur le stockage Scaleway : Block Storage pour les volumes d’instances, Object Storage S3-compatible, Glacier/C14 pour l’archivage froid, File Storage/managed storage selon disponibilité, positionnement cloud français, souveraineté, Kubernetes, IA/GPU, migration, backup, PRA, FinOps, observabilité et runbooks. Le chapitre traite aussi le signal politique majeur du transfert du Health Data Hub depuis Microsoft Azure vers Scaleway en 2026.
Block Storage
Volumes blocs pour Instances : stockage persistant, haute IOPS, snapshots, resize, boot/data volumes et bases de données.
BlockInstancesSnapshotsObject Storage
S3-compatible : buckets, objets, lifecycle, backups, logs, data lake, SDK, rclone, Terraform et gouvernance.
S3BucketsLifecycleGlacier / C14 / archive
Archivage et stockage froid : Glacier comme classe Object Storage, C14 legacy, data bunker français, lifecycle et restore.
GlacierC14ArchiveFile storage / managed storage
File Storage managé selon disponibilité : fichiers partagés, NFS-like patterns, beta/public preview, Kubernetes RWX et limites.
FileManagedRWXPositionnement
Cloud français, souveraineté, développeurs, IA, Kubernetes, GPU, prix lisibles, simplicité et alternative européenne.
FranceSovereigntyDevelopersScaleway et souveraineté française
Health Data Hub, données sensibles, transfert depuis Azure, critères techniques, cloud souverain et signal politique.
Health Data HubSovereigntySensitive dataPublic Cloud Scaleway
Instances, Elastic Metal, Block, Object, Kubernetes Kapsule, registry, databases, networking et régions européennes.
Public CloudKapsuleElastic MetalPerformance & sizing
Dimensionner IOPS, throughput, latence, object operations, archive restore, cache, benchmark et choix disque/instance.
IOPSLatencySizingSécurité storage
IAM, access keys S3, bucket policies, encryption applicative, réseaux privés, secrets, backups isolés et anti-ransomware.
IAMSecretsEncryptionBackup & snapshots
Snapshots volumes, backups S3, Glacier, stratégie 3-2-1, immutabilité logique, restore drills et rétention.
Backup3-2-1RestoreDR et réplication
Multi-région européenne, copie objet, snapshots, archive distante, PRA applicatif, RPO/RTO et tests de reprise.
DRReplicationPRAKubernetes Scaleway
Kapsule/Kosmos, CSI Block, Object Storage pour Velero, registry, databases, RWX patterns et stateful workloads.
KubernetesCSIVeleroBases de données
DB sur instances, Block Storage, Database products, PostgreSQL/MySQL, backups, PITR selon offre et latence.
DBPostgreSQLMySQLIA, GPU et datasets
Object Storage pour datasets, GPU instances, training pipelines, modèles, notebooks, logs, lakehouse et souveraineté IA.
AIGPUDatasetsHybridation & migration
VPN, interconnexion, migration depuis AWS/Azure/GCP/OVH, rclone, Terraform, backup cloud et cutover.
HybridMigrationTerraformExpérience développeur
Console, CLI, API, Terraform, S3 tooling, Kubernetes, registry, workflows CI/CD et simplicité opérationnelle.
CLIAPITerraformSouveraineté & conformité
Cloud français, RGPD, données sensibles, localisation, clauses contractuelles, réversibilité et SecNumCloud selon périmètre.
RGPDFranceComplianceFinOps Scaleway
Coûts volumes, snapshots, object storage, operations, Glacier restore, instances GPU, budgets, tags et nettoyage.
FinOpsCostsBudgetsObservabilité
Monitoring instances, volumes, buckets, logs, backup jobs, archive restores, alerting capacité, coûts et incidents.
MonitoringLogsAlertsPatterns d’architecture
Web app française, backup souverain, data lake S3, Kubernetes stateful, IA dataset, archive légale et PRA.
PatternsArchitectureExamplesComparatif OVH/AWS/Azure/GCP
Scaleway face aux acteurs cloud : souveraineté, coût, catalogue, développeurs, IA, Kubernetes et limites enterprise.
ComparisonCloudTradeoffsAnti-patterns
Object utilisé comme FS, Glacier pour données chaudes, snapshots sans restore, clés S3 partagées, pas de lifecycle.
Anti-patternsRiskGovernanceRunbooks incidents
Volume full, latence, S3 AccessDenied, bucket public, archive restore, K8s PVC pending et backup failed.
RunbookIncidentRestoreChecklist production
Préprod : région, IAM, lifecycle, backup, restore, PRA, monitoring, budget, tags, souveraineté et documentation.
Prod-readyAuditChecklistDéfinition
Scaleway Block Storage fournit des volumes blocs persistants attachables aux Instances. C’est le bon choix pour les disques data, bases de données, logs, volumes applicatifs et workloads nécessitant un périphérique bloc plutôt qu’un objet S3.
Flux logique
| Usage | Pourquoi Block Storage | Attention |
|---|---|---|
| Disque data | Persistant, attaché à une instance. | Surveiller filesystem et backups. |
| Base PostgreSQL/MySQL | Latence bloc, filesystem local. | Backup applicatif obligatoire. |
| Logs | Volume dédié extensible. | Rotation + export vers objet. |
| Kubernetes PVC | CSI/volume bloc pour pods stateful. | RWO, scheduling, snapshots. |
lsblk sudo mkfs.xfs /dev/sdb sudo mkdir -p /data sudo mount /dev/sdb /data df -h /data iostat -x 1 # After resize sudo growpart /dev/sdb 1 sudo xfs_growfs /data
- Séparer OS, data, logs et backups.
- Nommer volumes : app-env-role-index.
- Tags owner, env, data_class, backup_policy.
- Snapshots avant opérations risquées.
- Restore drill avant production.
Scaleway Object Storage permet de stocker et d’accéder aux données via la console et des clients compatibles Amazon S3. Il convient aux backups, médias, logs, datasets, artefacts CI/CD, data lakes, exports, archives chaudes et applications cloud-native.
| Concept | Rôle | Attention |
|---|---|---|
| Bucket | Conteneur scalable d’objets. | Nommage, région, droits. |
| Object key | Chemin logique de l’objet. | Préfixes pour lifecycle et analytics. |
| S3 clients | awscli, rclone, MinIO client, SDKs. | Endpoint Scaleway à configurer. |
| Lifecycle | Transition vers Glacier/expiration. | RTO et coûts restore. |
- Backup souverain : restic/borg/rclone/Veeam vers S3.
- Assets web : images, documents, vidéos.
- Data lake : raw/curated Parquet/JSON.
- Logs : compression quotidienne + lifecycle.
- Artefacts CI/CD : builds, releases, ML models.
aws --endpoint-url https://s3.fr-par.scw.cloud s3 ls aws --endpoint-url https://s3.fr-par.scw.cloud s3 cp backup.tar.gz s3://my-bucket/backups/ rclone sync ./data scaleway:my-bucket/data --progress mc alias set scw https://s3.fr-par.scw.cloud ACCESS_KEY SECRET_KEY mc ls scw/my-bucket
Scaleway Glacier est une classe de stockage froid intégrée à Object Storage pour l’archivage profond. Scaleway met en avant un stockage en data-bunker souterrain en France pour des archives longues, documents légaux, backups froids et datasets rarement restaurés.
C14 Cold Storage est l’ancienne identité produit autour du stockage froid Scaleway. Les documents Scaleway expliquent que Glacier est désormais une classe de stockage d’Object Storage, intégrée au lifecycle management et accessible via API S3-compatible.
| Usage | Pourquoi Glacier | Attention |
|---|---|---|
| Archives légales | Conservation longue, coût bas. | Inventaire, rétention, conformité. |
| Backups mensuels/annuels | Peu consultés. | Restore test obligatoire. |
| Logs froids | Longue conservation. | Index minimal nécessaire. |
| Datasets historiques | Rarement relus. | Manifest + checksums. |
- Classer les données par température et obligation.
- Compresser et chiffrer si nécessaire.
- Créer manifest, checksums, owner, date, rétention.
- Appliquer lifecycle vers Glacier.
- Tester restauration sur échantillon.
- Documenter délai et procédure.
Scaleway File Storage vise les fichiers partagés fiables pour Instances. La documentation Scaleway indique que le service File Storage est actuellement en Public Beta ; il faut donc vérifier disponibilité régionale, limites et SLA avant production critique.
| Usage | Fit | Attention |
|---|---|---|
| Uploads partagés | Bon candidat. | Permissions et quotas. |
| Web assets internes | Possible. | CDN/cache si public. |
| Kubernetes RWX | Selon CSI/intégration. | Beta/limites à valider. |
| Base transactionnelle | À éviter sans benchmark. | Latence/locks/consistency. |
- Block Storage si un seul serveur/pod écrit.
- Object Storage si l’application accepte API objet.
- NFS autogéré si besoin très spécifique.
- Kubernetes storage open-source si cluster dédié.
- Valider statut du service et SLA.
- Tester metadata performance.
- Définir UID/GID/permissions.
- Prévoir backup hors file storage.
- Surveiller capacité et latence.
Scaleway se positionne comme un cloud français et européen orienté développeurs, souveraineté, simplicité, Kubernetes, GPU/IA et rapport lisibilité/prix. Son identité est différente des hyperscalers : catalogue plus ciblé, approche plus accessible, forte communication autour du cloud souverain et de l’infrastructure européenne.
| Axe | Intérêt |
|---|---|
| Cloud français | Localisation, souveraineté, image politique. |
| Développeurs | API, CLI, Terraform, S3-compatible, Kubernetes. |
| IA/GPU | Positionnement sur workloads IA européens. |
| Object + Glacier | Backups, archives, data lake. |
| Prix | Lisibilité et compétitivité selon workload. |
- Catalogue moins vaste que AWS/Azure/GCP.
- Services enterprise parfois moins profonds.
- Disponibilité des features selon région.
- Besoin de valider SLA/support pour production critique.
- Écosystème partenaires plus restreint que les hyperscalers.
En avril 2026, la France a décidé de transférer le Health Data Hub depuis Microsoft Azure vers Scaleway, fournisseur cloud français détenu par Iliad. Cette décision s’inscrit dans une logique de souveraineté cloud, de protection de données sensibles et de réduction de dépendance à des fournisseurs soumis à des législations extra-européennes.
| Enjeu | Impact |
|---|---|
| Données de santé | Données hautement sensibles, gouvernance stricte. |
| Souveraineté | Réduction dépendance à des clouds non européens. |
| Conformité | Contraintes RGPD, hébergement, sécurité, audit. |
| Crédibilité | Validation d’un acteur français sur un dossier national. |
| Réversibilité | Capacité à migrer hors d’un hyperscaler. |
- Chiffrement fort et gouvernance des clés.
- Segmentation réseau et bastions.
- Logs d’accès exhaustifs.
- Backups immuables et DR testés.
- Conformité contractuelle et audit régulier.
- Observabilité sécurité et exploitation 24/7.
| Instances | Compute IaaS. |
| Elastic Metal | Bare metal as a service. |
| Block Storage | Volumes pour instances. |
| Object Storage | S3-compatible. |
| Kapsule/Kosmos | Kubernetes managé. |
| Managed Databases | DB managées selon offre. |
- Choisir région par souveraineté/latence.
- Réseaux privés pour flux internes.
- Object Storage pour backups hors instance.
- Terraform pour reproductibilité.
Random DB/VM.
PUT/GET/list.
Restore delay.
Latency app.
fio --name=scw-block --filename=/data/testfile --size=20G --rw=randrw --rwmixread=70 --bs=4k --iodepth=32 --numjobs=4 --direct=1 --runtime=120 --time_based --group_reporting rclone copy ./bench scaleway:bucket/bench --progress iostat -x 1
- Tester dans la région cible.
- Tester workload réel, pas uniquement fio.
- Mesurer p95/p99 latence.
- Valider coût/perf avec instance choisie.
- IAM et droits minimum.
- Access keys S3 par application, jamais partagées.
- Rotation des clés.
- Bucket non public par défaut.
- Chiffrement applicatif pour données sensibles.
- Backups isolés et rétention.
- Réseaux privés pour bases et services internes.
Do not store: - S3 access key in Git - database password in Docker image - backup key on the same server - admin credentials in CI logs Use: - environment secrets - vault/secrets manager - short-lived credentials where possible - separate backup credentials
| Source | Protection |
|---|---|
| Instance | Snapshot + backup applicatif. |
| Block volume | Snapshot + copie logique. |
| Database | Dump/WAL/binlog vers Object Storage. |
| Object bucket | Versioning/lifecycle/copie région. |
| Archive | Glacier pour rétention longue. |
- Choisir une application.
- Restaurer VM/volume/DB dans environnement isolé.
- Vérifier cohérence métier.
- Mesurer RTO/RPO.
- Corriger runbook.
| Backup-only | Coût bas, RTO long. |
| Object copy | Données objet copiées région/site secondaire. |
| Snapshots + rebuild | Reconstruction infra. |
| Active/passive | Environnement dormant. |
| Multi-cloud DR | Réversibilité mais complexité. |
- Définir par application, pas globalement.
- Tester restore base + fichiers + secrets.
- Prévoir DNS et réseau.
- Documenter ordre de redémarrage.
| Besoin | Option |
|---|---|
| RWO bloc | CSI Block Storage. |
| Backups cluster | Velero vers Object Storage S3. |
| Images | Container Registry. |
| RWX | File Storage/NFS/autre selon disponibilité. |
| DB | Operator + PVC + backup applicatif. |
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: data-postgres
spec:
accessModes: ["ReadWriteOnce"]
storageClassName: scw-bssd
resources:
requests:
storage: 100Gi- PVC sans restore testé.
- Volume bloc utilisé comme RWX.
- Snapshots non cohérents DB.
- Bucket S3 utilisé comme filesystem transactionnel.
| DB sur Instance | Contrôle complet, Block Storage. |
| Managed Database | Exploitation simplifiée selon offre. |
| Kubernetes DB | Operator + PVC. |
| Backup objet | Dumps/WAL/binlog vers S3-compatible. |
- WAL/binlog archiving.
- Backups natifs DB.
- Snapshots seulement en complément.
- Monitoring fsync/latency.
- PITR testé.
- Datasets en Object Storage.
- Cache local rapide pour training.
- Versionner modèles et datasets.
- Lifecycle pour vieux checkpoints.
- Chiffrement pour données sensibles.
Le positionnement français/européen est stratégique pour des datasets sensibles, santé, recherche, secteur public ou industrie.
| rclone | Migration object/object ou file/object. |
| Terraform | Infra reproductible. |
| VPN | Connexion privée. |
| Backup/restore | Migration simple de workloads. |
| V2V | Migration VM selon cible. |
- Inventaire données et dépendances.
- Choix cible : block/file/object/archive.
- Transfert initial.
- Sync delta.
- Cutover.
- Validation checksum/performance.
- Rollback temporaire.
| CLI | Automatisation et scripts. |
| API | Intégration applicative. |
| Terraform | IaC. |
| S3-compatible tools | awscli/rclone/mc/SDK. |
| Kubernetes | Déploiement cloud-native. |
Standardiser endpoints, variables, secrets et modules Terraform pour éviter une infra manuelle impossible à auditer.
| Axe | Question |
|---|---|
| Localisation | Région française/européenne ? |
| Données sensibles | Santé, public, recherche, industrie ? |
| Contrat | DPA, RGPD, support, sous-traitance ? |
| Certification | SecNumCloud ou exigences équivalentes selon offre ? |
| Réversibilité | Export des données et IaC ? |
- Minimisation.
- Chiffrement.
- Journalisation.
- Rétention.
- Droits d’accès.
- Suppression vérifiable.
| Poste | Risque |
|---|---|
| Volumes bloc | Volumes oubliés ou trop grands. |
| Snapshots | Rétention infinie. |
| Object | Capacité, opérations, egress. |
| Glacier | Restore et mauvaise classe. |
| GPU | Instances coûteuses laissées allumées. |
- Tags owner/app/env.
- Budgets par projet.
- Lifecycle object.
- Expiration snapshots.
- Stop GPU hors jobs.
- Revue ressources orphelines.
| Block | fs usage, iostat, latency. |
| Object | capacity, object count, errors. |
| Archive | restore status, volume archivé. |
| K8s | PVC, CSI, backup jobs. |
| Cost | budget, drift, orphan resources. |
- Volume > 80/90/95%.
- Backup failed.
- Bucket public.
- Snapshot trop ancien.
- GPU running idle.
- Coût anormal.
Combiner monitoring Scaleway, Prometheus, logs applicatifs, checks backup, scripts FinOps et alertes externes.
| Pattern | Stockage |
|---|---|
| Web app française | Instances + Block DB + Object media. |
| Backup souverain | S3-compatible + Glacier. |
| Kubernetes stateful | Kapsule + CSI Block + Velero S3. |
| IA training | Object datasets + GPU + Block cache. |
| Archive légale | Glacier + manifest + retention. |
| Axe | Scaleway | OVHcloud | AWS/Azure/GCP |
|---|---|---|---|
| Souveraineté FR | Très fort positionnement. | Fort positionnement européen. | Selon offres/régions. |
| Catalogue | Ciblé dev/IA/K8s. | Infra/private cloud fort. | Très large. |
| IA/GPU | Positionnement visible. | Selon offres. | Très profond. |
| Coût | Lisible selon workload. | Compétitif selon workload. | Puissant mais coûts complexes. |
| Enterprise | À valider selon besoin. | Private cloud fort. | Écosystème vaste. |
- Scaleway : souveraineté française, dev, Kubernetes, IA.
- OVHcloud : private cloud, hébergement, bare metal, souveraineté EU.
- Hyperscalers : catalogue PaaS/data/IA massif.
| Anti-pattern | Impact | Correction |
|---|---|---|
| Object comme filesystem | Bugs/cohérence/latence. | Adapter app ou file/block. |
| Glacier pour données chaudes | RTO incompatible. | Standard/Object chaud. |
| Snapshots sans restore | Fausse sécurité. | Drills. |
| Clés S3 partagées | Pas d’audit. | Clés par app + rotation. |
| Pas de lifecycle | Coût croissant. | Rules et nettoyage. |
- Buckets sans owner.
- Volumes unattached.
- GPU idle.
- Backups sur même serveur.
- Restauration jamais testée.
- df -h et inodes.
- Identifier croissance.
- Snapshot si possible.
- Étendre volume.
- Grow filesystem.
- Ajouter alerte.
- Vérifier endpoint/région.
- Vérifier access key/secret.
- Vérifier bucket policy.
- Tester awscli/rclone/mc.
- Rotation si fuite suspectée.
- Identifier objet/version.
- Lancer restore depuis Glacier.
- Attendre disponibilité.
- Copier vers Standard si besoin.
- Vérifier checksum.
- kubectl describe pvc.
- Vérifier StorageClass.
- Vérifier quota/projet.
- Vérifier CSI logs.
- Tester volume manuel.
| Contrôle | OK ? | Note |
|---|---|---|
| Service adapté au protocole | ☐ | Block/Object/File/Glacier. |
| Région/souveraineté validée | ☐ | France/Europe, contrat. |
| IAM et clés | ☐ | Least privilege, rotation. |
| Backup + restore testé | ☐ | Application complète. |
| Lifecycle Object/Glacier | ☐ | Coût et RTO. |
| Monitoring capacité | ☐ | Volumes, buckets, K8s. |
- Buckets non publics par défaut.
- Secrets hors Git.
- Backup isolé.
- Chiffrement applicatif si données sensibles.
- Logs accès et alertes.
