Project Oxygen & Ideo-LabIDEO LAB Dashboard 2026

đŸ’Ÿ Storage Systems / Le stockage — Chapitre 1

Introduction générale : définitions, usages, grandes familles, critÚres fondamentaux et cycles chaud / tiÚde / froid / archive.

DASNASSANObject StorageCloud StorageSDS
DurabilitĂ© objet cloud11×9

Objectif courant pour S3, Azure Blob LRS et classes Glacier : 99,999999999% de durabilité annuelle.

Latence typique”s → ms

NVMe local en microsecondes, NAS/SAN en sous-millisecondes Ă  millisecondes, archive en minutes/heures.

Support disque réel344k+

Backblaze a publié un parc 2025 de plus de 344 000 disques analysés pour ses statistiques de fiabilité.

Question centraleTrade-off

Capacité, coût, latence, IOPS, débit, sécurité, disponibilité, scalabilité : aucun stockage n'optimise tout.

1.1

Définition du stockage informatique

Stockage primaire, secondaire, cache, sauvegarde, archive, mémoire persistante. Clarification entre mémoire, disque, objet et conservation long terme.

PrimarySecondaryArchive
1.2

Grands usages du stockage

OS, bases de données, fichiers utilisateurs, applications web, logs, sauvegardes, IA, data lakes, vidéo, objets, containers.

DBAIContainers
1.3

Grandes familles

DAS, NAS, SAN, Object Storage, Cloud Storage, Distributed Storage, Software-Defined Storage : quand les utiliser, quand les éviter.

NASSANS3
1.4

CritĂšres fondamentaux

Capacité, latence, débit, IOPS, endurance, disponibilité, durabilité, sécurité, coût, scalabilité. La grille de décision d'architecte.

IOPSRPO/RTOTCO
1.5

Hot, Warm, Cold, Archive

Classes d'accÚs et cycle de vie : données actives, semi-actives, historiques, réglementaires. Optimiser coût, performance et restauration.

HotColdLifecycle
✓

Checklist de conception

Questions à poser avant de choisir un stockage : charge, SLA, volumétrie, croissance, sécurité, backup, gouvernance, migration, réversibilité.

DesignRunbookRisques
Carte mentale du chapitre 1
Vision globale

Le stockage informatique n'est pas seulement un disque ou un bucket cloud. C'est un systÚme complet qui absorbe les écritures, restitue les lectures, protÚge la donnée, l'organise, la chiffre, la réplique, la sauvegarde, l'archive et la rend exploitable dans le temps.

Application
→
Filesystem / Driver
→
Bloc / Fichier / Objet
→
Média
→
Protection
→
Restitution
Les trois questions qui pilotent tout
  • AccĂšs : la donnĂ©e doit-elle ĂȘtre lue en microsecondes, millisecondes, secondes, minutes ou heures ?
  • Protection : combien de perte acceptable ? RPO zĂ©ro, quelques secondes, quelques heures, ou restauration manuelle ?
  • Économie : quel coĂ»t total par To utile, incluant rĂ©seau, sauvegarde, rĂ©plication, licences, Ă©nergie et exploitation ?
Diagramme d'orientation rapide
BesoinFamille naturelleExemple
Ultra-faible latenceDAS / NVMe localBase transactionnelle, cache, WAL DB
Partage fichiersNASHome directories, documents, média interne
Bloc partagé entrepriseSANVMware, Oracle, SQL Server, clusters
Échelle massiveObject storageImages, vidĂ©os, backups, data lake
Cloud natifManaged cloud storageS3, Azure Blob, GCS, OVH Object Storage
Plateforme distribuéeSDS / DistributedCeph, vSAN, Nutanix, MinIO
RÚgle de base : on ne choisit jamais un stockage uniquement sur le prix au To. Il faut toujours ramener le choix au couple profil d'accÚs + risque métier.
1.1 Définition du stockage informatique
Définition opérationnelle

Le stockage informatique est l'ensemble des technologies qui permettent de conserver une information numérique, de la retrouver, de la modifier, de la protéger, de la déplacer et de prouver son intégrité. Il couvre le média physique, le protocole d'accÚs, la couche logique, la redondance, le chiffrement, la supervision et les procédures de restauration.

Bits
→
Blocs
→
Fichiers
→
Objets
→
Datasets
→
Valeur métier
Un stockage doit répondre à quatre fonctions
  • Écrire : absorber la donnĂ©e sans la perdre, mĂȘme pendant les pics, les coupures ou les incidents.
  • Lire : restituer rapidement et correctement la donnĂ©e demandĂ©e.
  • PrĂ©server : rĂ©sister aux pannes, corruptions, erreurs humaines, cyberattaques et vieillissement.
  • Administrer : suivre capacitĂ©, performance, coĂ»ts, droits, cycles de vie et conformitĂ©.
Table de vocabulaire
TermeSensExemples
Stockage primaireDonnée directement utilisée par les applications en production.Volume NVMe, LUN SAN, disque VM, tablespace DB
Stockage secondaireDonnée moins active, souvent mutualisée ou répliquée.NAS fichiers, partage documentaire, volume de logs
SauvegardeCopie restaurable, conçue pour revenir en arriÚre.Veeam, snapshots exportés, backup S3 immutable
ArchiveConservation longue durée, accÚs rare, objectif légal ou historique.Glacier, bande LTO, archive froide cloud
CacheCopie temporaire pour accélérer les accÚs.Redis, SSD cache, CDN edge cache
MĂ©moire persistanteMĂ©dia proche de la mĂ©moire mais conservant les donnĂ©es aprĂšs arrĂȘt.NVDIMM, persistent memory, journaux DB optimisĂ©s
Le stockage est une pile, pas un composant isolé
Média

HDD, SSD SATA, SSD SAS, NVMe, bande, mémoire persistante. C'est la couche physique avec endurance, latence et taux de panne propres.

ContrĂŽleur

RAID, HBA, firmware SSD, contrÎleur SAN, carte réseau RDMA. Il gÚre l'ordonnancement et la protection locale.

Protocole

SATA, SAS, NVMe, NVMe-oF, iSCSI, Fibre Channel, NFS, SMB, S3 API.

Abstraction

Bloc, fichier, objet. L'abstraction détermine comment l'application adresse la donnée.

Services

Snapshots, réplication, chiffrement, compression, déduplication, tiering, immutabilité.

Gouvernance

Droits, audit, rétention, conformité, classification, lifecycle, coûts.

Point clĂ© : deux systĂšmes ayant la mĂȘme capacitĂ© brute peuvent ĂȘtre radicalement diffĂ©rents en performance, rĂ©silience, coĂ»t utile et effort d'exploitation.
Volatil, persistant, durable
CatĂ©gorieConservation aprĂšs arrĂȘtUsage
RAMNonCalcul, buffers, cache applicatif
Cache disqueVariableAccélération, write-back risqué sans batterie
SSD/HDDOuiStockage persistant primaire
Objet répliquéOui + redondanceDurabilité cloud, data lake, backup
Archive immuableOui + rétentionConformité, cyber-résilience, conservation longue
Persistance ≠ sauvegarde

Un disque persistant peut trÚs bien conserver une erreur, une suppression accidentelle, un chiffrement ransomware ou une corruption logique. La sauvegarde apporte une capacité de retour à un état antérieur, idéalement isolée, testée et immuable.

Production
→
Snapshot
→
Backup
→
Copie hors site
→
Archive immuable
Confusions fréquentes à éliminer dÚs le début
ErreurPourquoi c'est fauxBonne formulation
RAID = backupRAID protÚge surtout contre la panne d'un disque, pas contre suppression, malware, corruption logique ou incendie.RAID = disponibilité locale ; backup = restauration temporelle.
Object storage = filesystemUn objet n'est pas modifié en place comme un fichier ; il est adressé par clé, metadata et API.Objet = excellent pour masse, web, archive, data lake ; moins adapté au POSIX strict.
Cloud = automatiquement moins cherLe coĂ»t dĂ©pend des classes, requĂȘtes, egress, snapshots, rĂ©plication, API, restauration et gouvernance.Cloud = Ă©lasticitĂ© et services managĂ©s ; TCO Ă  modĂ©liser.
SSD = toujours rapideEndurance, contrÎleur, QoS, write amplification et saturation du cache SLC changent fortement le comportement.SSD = faible latence, mais profil d'écriture et endurance à vérifier.
DurabilitĂ© = disponibilitĂ©La donnĂ©e peut ĂȘtre durablement conservĂ©e mais indisponible temporairement.DurabilitĂ© protĂšge l'intĂ©gritĂ© longue durĂ©e ; disponibilitĂ© protĂšge l'accĂšs immĂ©diat.
1.2 Les grands usages du stockage
Un mĂȘme datacenter utilise plusieurs stockages simultanĂ©ment
UsageProfil I/OStockage naturelPoint de vigilance
SystÚme d'exploitationPetites lectures/écritures aléatoiresSSD local, volume bloc cloudSnapshots, patch rollback, chiffrement
Base OLTPIOPS fortes, latence faible, fsyncNVMe, SAN performant, volume bloc provisionnéWAL/redo logs, write latency, endurance
Fichiers utilisateursMix séquentiel + metadataNAS SMB/NFSDroits, verrouillage, quota, antivirus
Application webAssets, uploads, sessions, cacheObject storage + CDN + bloc pour runtimeEgress, invalidation CDN, lifecycle
LogsÉcriture sĂ©quentielle massiveDisque local, object storage, plateforme logRotation, compression, recherche, rĂ©tention
IA / data lakeLecture parallĂšle, gros fichiers, metadataObject storage, distributed FSThroughput, coĂ»t requĂȘtes, petits fichiers
Vidéo / médiaTrÚs gros objets, streamingObject storage + CDNDébit, transcodage, coût sortie
ContainersImages immuables + volumes persistantsRegistry objet, CSI bloc/fichierStatefulSets, snapshots, restauration
Bases de données : le stockage le plus exigeant

Une base transactionnelle est sensible Ă  la latence d'Ă©criture, au flush disque, Ă  la cohĂ©rence et aux pics d'IOPS. Les journaux transactionnels doivent ĂȘtre traitĂ©s comme une voie critique.

Client SQL
→
Buffer pool
→
WAL / Redo
→
Data files
→
Backup + PITR
Bonnes pratiques
  • SĂ©parer si possible donnĂ©es, journaux et backups pour Ă©viter les contentions.
  • Mesurer p95/p99 de latence, pas seulement la moyenne.
  • Tester les restaurations PITR, pas seulement la crĂ©ation des backups.
  • Surveiller queue depth, fsync latency, write amplification et saturation cache.
Exemples de charges
Type DBProfil stockageArchitecture fréquente
OLTP MySQL/PostgreSQLAléatoire, faible latenceNVMe / bloc cloud performant + réplication
Oracle / SQL Server entrepriseIOPS + débit + snapshotsSAN, ASM, volumes dédiés, backup enterprise
Data warehouseScan séquentiel massifObject storage + compute séparé
NoSQLPartitionné, horizontal, write-heavyDisques locaux rapides + réplication logicielle
CritÚre caché : la latence stable sous charge vaut souvent plus qu'un pic d'IOPS théorique.
Applications web modernes

Une application web typique découple le runtime, les uploads et les assets statiques. Le stockage objet est souvent préféré pour les images, piÚces jointes, exports, médias et sauvegardes, car il s'intÚgre facilement avec CDN, lifecycle et permissions.

ComposantStockageExemple
CodeImage container / disque VMDocker image, AMI
UploadsObject storageS3, GCS, Blob, MinIO
CacheMémoire / SSD localRedis, memcached
SessionsRedis / DB / cookie signéSession store
AssetsObject storage + CDNCSS, JS, images optimisées
IA, data lakes et vidéos

Les workloads IA et data lake utilisent souvent de gros volumes d'objets et des lectures parallĂšles. Les problĂšmes ne sont pas seulement la capacitĂ© : le nombre de petits fichiers, la latence metadata, le coĂ»t des requĂȘtes et la bande passante deviennent critiques.

Vidéo
Débit
IA training
Parallel
Web assets
CDN
DB OLTP
Latence
Logs, sauvegardes et archives : le stockage défensif
UsageObjectifArchitecture recommandéeErreur dangereuse
Logs applicatifsDebug, audit, sécuritéRotation locale + centralisation + rétentionGarder les logs seulement sur le serveur compromis
BackupsRestauration aprÚs erreur ou panne3-2-1, immutabilité, tests réguliersNe jamais tester la restauration
ArchiveConformité, historique, preuveClasse froide, WORM, catalogueArchiver sans index ni procédure de restitution
SnapshotsRollback rapideSnapshots courts + export vers backupConfondre snapshot local et sauvegarde indépendante
RÚgle d'exploitation : un backup non restauré en test est une hypothÚse, pas une protection.
1.3 Les grandes familles de stockage
Matrice de comparaison des familles
FamilleUnité adresséeProtocolesForcesLimites
DASBloc localSATA, SAS, NVMeLatence basse, simplicité, coût directPartage limité, HA à construire au-dessus
NASFichierNFS, SMBPartage, droits, fichiers utilisateursMetadata, verrouillage, performance selon réseau
SANBloc distantFC, iSCSI, NVMe-oFPerformance entreprise, clusters, virtualisationComplexité, coût, zoning/multipath
Object StorageObjet + metadataS3 API, Swift, BlobÉchelle, durabilitĂ©, lifecycle, webPas POSIX natif, latence metadata, petits fichiers
Cloud StorageBloc / fichier / objet managĂ©EBS, S3, EFS, Blob, GCS...ÉlasticitĂ©, services, multi-zoneEgress, dĂ©pendance fournisseur, coĂ»ts variables
Distributed StorageBloc/fichier/objet distribuéCeph, Gluster, MinIO, HDFSScale-out, résilience logicielleOpérations complexes, réseau critique
SDSAbstraction logicielleDépend solutionDécouple matériel et servicesDesign et support à maßtriser
DAS

Direct Attached Storage : disques connectés directement au serveur. TrÚs efficace pour DB locale, cache, VM single host, workloads à faible latence.

NAS

Network Attached Storage : serveur de fichiers partagé. Idéal pour utilisateurs, exports, documents, répertoires communs, NFS applicatif.

SAN

Storage Area Network : volumes bloc distants vus comme des disques par les serveurs. Fréquent en virtualisation et bases entreprise.

Serveur
→ DAS →
NVMe local
Clients
→ NAS →
Share SMB/NFS
Cluster
→ SAN →
LUN bloc
PiĂšges d'architecture
  • DAS performant mais non partagĂ© : il faut penser rĂ©plication applicative ou cluster.
  • NAS pratique mais parfois mauvais pour bases de donnĂ©es transactionnelles si latence et locking sont mal gĂ©rĂ©s.
  • SAN puissant mais demande multipathing, zoning, queue depth, firmware et procĂ©dures strictes.
Object Storage

Le stockage objet adresse une donnée par une clé, dans un bucket/conteneur, avec metadata. Il est trÚs adapté aux grands volumes non structurés : images, vidéos, backups, exports, logs, datasets, archives.

AspectObjetFichier classique
AdresseBucket + cléChemin hiérarchique
ModificationSouvent réécriture objetÉcriture dans fichier
MetadataNative et richeDépend FS
ÉchelleTrĂšs Ă©levĂ©eLimitĂ©e par FS/NAS
Cloud Storage managé

Les clouds fournissent plusieurs modÚles : bloc pour VM/DB, fichier partagé managé, objet durable, archive froide, snapshots, réplication régionale et lifecycle. Amazon indique que S3 est conçu pour dépasser 99,999999999% de durabilité et stocke par défaut les données de façon redondante sur au moins trois zones de disponibilité.

Attention : les classes froides réduisent le coût de stockage mais augmentent souvent le coût ou le délai de restauration.
Distributed Storage & Software-Defined Storage

Le stockage distribuĂ© agrĂšge plusieurs nƓuds et disques pour produire un service logique rĂ©silient. La redondance est assurĂ©e par rĂ©plication ou erasure coding. Le SDS ajoute une couche logicielle qui dĂ©couple le service de stockage du matĂ©riel sous-jacent.

Node A
Node B
Node C
→
Cluster storage
→
Bloc
Fichier
Objet
TechnologieTypeUsagePoint critique
CephBloc / objet / fichierCloud privé, OpenStack, KubernetesRéseau, OSD, placement groups
MinIOObjet S3-compatibleData lake privé, backup, AI datasetsErasure coding, disques homogÚnes
VMware vSANSDS hyperconvergéVirtualisation entrepriseDesign cluster, cache, fault domains
NutanixHCI / SDSPlateforme VM/applicationsLicences, intégration, montée en charge
1.4 Les critĂšres fondamentaux
Les quatre métriques de performance
MétriqueDéfinitionQuand c'est critique
LatenceTemps de réponse d'une opération I/O.DB OLTP, journal, cache, VM interactives
IOPSNombre d'opérations par seconde.Petites lectures/écritures aléatoires
DébitVolume transféré par seconde.Backup, vidéo, analytics, migration
Queue depthNombre d'I/O en attente ou parallÚles.Saturation contrÎleur/disque/réseau
Comparaison indicative
NVMe local
Latence
SAN FC
IOPS
NAS
Partage
Object
Échelle
Archive
AccĂšs

Ce graphique est volontairement qualitatif : il sert à visualiser les compromis, pas à remplacer un benchmark réel.

Disponibilité, durabilité, RPO, RTO
CritÚreQuestionExemple de mécanisme
DisponibilitéLe service de stockage répond-il maintenant ?Cluster HA, multipath, multi-AZ, failover
DurabilitéLa donnée restera-t-elle intacte dans le temps ?Réplication, checksum, erasure coding, scrubbing
RPOCombien de données peut-on perdre ?Réplication synchrone, log shipping, backups fréquents
RTOCombien de temps pour restaurer ?Standby, snapshots, automation restore
ImmutabilitĂ©Peut-on empĂȘcher modification/suppression ?Object Lock, WORM, retention policy
Exemple cloud : AWS S3, Azure Blob LRS et les classes d'archivage S3 Glacier communiquent des objectifs de durabilité à 11 neuf. Google distingue explicitement disponibilité immédiate et durabilité long terme dans sa documentation Cloud Storage.
Sécurité du stockage
  • Chiffrement au repos : clĂ©s managĂ©es fournisseur ou KMS/HSM client.
  • Chiffrement en transit : TLS, IPsec, FC zoning, rĂ©seau privĂ©.
  • IAM et ACL : moindre privilĂšge, sĂ©paration admin/data, audit.
  • ImmutabilitĂ© : protection ransomware et conformitĂ©.
  • Classification : PII, secrets, donnĂ©es rĂ©glementĂ©es, logs d'audit.
Coût réel : TCO
PosteSouvent oublié
Capacité utileRAID, réplication 3x, erasure coding, snapshots
PerformanceProvisioned IOPS, SSD premium, cache, contrĂŽleurs
TransfertEgress cloud, inter-région, migration initiale
OpérationsMonitoring, patching, remplacement disques, support
RestaurationFrais de retrieval, temps humain, tests DR
Scorecard de décision rapide
CritĂšreQuestion de designScore 1-5Preuve attendue
CapacitéVolumétrie actuelle + croissance 36 mois ?Courbe, seuils, marge
Latencep95/p99 maximal accepté ?Benchmark fio/applicatif
IOPSLecture/écriture, random/séquentiel ?Mesure réelle ou sizing
RPO/RTOPerte et indisponibilité acceptables ?Runbook de restauration
SécuritéChiffrement, IAM, audit, immutabilité ?Politique validée
CoûtTCO incluant egress/retrieval/support ?Simulation 12/36 mois
ScalabilitéComment ajouter 10x capacité ?Architecture scale-up/scale-out
1.5 Stockage chaud, tiĂšde, froid et archive
Température = fréquence d'accÚs + urgence de restauration
ClasseAccĂšsLatence attendueExemplesObjectif
HotTrÚs fréquentImmédiatDB active, fichiers récents, VM, cachePerformance
WarmRĂ©gulier mais modĂ©rĂ©ImmĂ©diat ou quasi immĂ©diatDocuments rĂ©cents, logs 30-90 joursÉquilibre coĂ»t/perf
ColdRareSecondes à minutes selon solutionBackups anciens, exports, datasets historiquesRéduction coût
Deep archiveExceptionnelMinutes à heuresConformité, archives légales, patrimoineCoût minimal et rétention
Jour 0-30 Hot
→
30-180 Warm
→
180-365 Cold
→
+365 Archive
→
Destruction contrÎlée
Exemples de classes cloud
ProviderHotWarm/ColdArchive
AWSS3 StandardStandard-IA, One Zone-IAGlacier Instant/Flexible/Deep Archive
Google CloudStandardNearline, ColdlineArchive
AzureHotCool, ColdArchive
OVH / ScalewayObject Storage standardCold archive selon offreArchive cloud / Glacier-like selon service
Lecture économique

Plus la donnée devient froide, plus le coût de conservation baisse, mais plus le coût d'accÚs, le délai de restauration, les contraintes de durée minimale ou les frais d'opération peuvent augmenter.

Hot coût/mois
ÉlevĂ©
Warm coût/mois
Moyen
Cold coût/mois
Bas
Archive coût/mois
Min
Policy lifecycle : automatiser le déplacement

Le lifecycle Ă©vite de garder Ă©ternellement des donnĂ©es froides dans un stockage chaud. Il doit ĂȘtre alignĂ© sur la valeur mĂ©tier, les obligations lĂ©gales, les temps de restauration et les coĂ»ts de retrieval.

Example policy logic:
IF object_age > 30 days AND access_count = 0 THEN move_to_warm
IF object_age > 180 days THEN move_to_cold
IF object_age > 365 days AND legal_hold = false THEN archive_or_delete
IF ransomware_protection = true THEN enable_immutability
ÉtapeContrîle
ClasserIdentifier données actives, sensibles, réglementées.
MesurerObserver accÚs, taille, croissance, coût.
SimulerCalculer économie et coût de restauration.
AutomatiserRĂšgles lifecycle, tags, expiration.
AuditerContrÎle périodique, exceptions, legal hold.
Risques classiques du tiering
RisqueImpactPrévention
Restaurer trop lentementRTO non tenuTester retrieval et documenter délais réels
Archiver sans indexDonnée introuvableCatalogue, metadata, tags, moteur de recherche
Coût de sortie surpriseFacture élevéeSimulation egress/retrieval avant migration
Lifecycle trop agressifPerformance dégradéeAnalyse des accÚs, exceptions par application
Suppression non conformeRisque légalRétention, legal hold, validation métier
Checklist de conception storage
Questions Ă  poser avant de choisir
DomaineQuestionsLivrable
VolumétrieCapacité actuelle, croissance mensuelle, taille moyenne objet/fichier, nombre d'objets ?Courbe 36 mois
PerformanceIOPS, dĂ©bit, latence p95/p99, pics, fenĂȘtre batch ?Benchmark + SLA
DisponibilitéMaintenance possible ? HA locale ? multi-site ? multi-zone ?Architecture failover
ProtectionRPO/RTO, immutabilité, backup hors site, tests de restauration ?Plan DR
SécuritéDroits, chiffrement, logs, audit, données sensibles ?ModÚle IAM
CoûtCapacité utile, réplication, egress, retrieval, licences, support ?TCO 12/36 mois
ExploitationMonitoring, alerting, patch, remplacement, runbooks ?Runbook N1/N2/N3
RéversibilitéComment sortir les données et à quel coût ?Plan de migration
Glossaire rapide du chapitre 1
TermeDéfinition courte
BlocUnité bas niveau lue/écrite par un systÚme de fichiers ou une base.
FichierDonnée nommée dans une hiérarchie, avec droits et metadata filesystem.
ObjetDonnée adressée par une clé dans un bucket, souvent avec metadata riche et API HTTP.
IOPSInput/Output Operations Per Second.
ThroughputDébit transféré par seconde, souvent en MB/s ou GB/s.
Latency p99Temps de rĂ©ponse sous lequel 99% des requĂȘtes se terminent.
RPOQuantité maximale de données que l'on accepte de perdre.
RTODélai maximal pour restaurer un service.
Erasure codingTechnique qui découpe et encode les données pour tolérer des pertes avec moins de surcoût qu'une réplication complÚte.
ImmutabilityCapacitĂ© Ă  empĂȘcher modification ou suppression pendant une durĂ©e dĂ©finie.