Project Oxygen & Ideo-LabIDEO LAB Dashboard 2026

🚀 10) Runbook tuning en prod

Un bon tuning en production n’est pas qu’une question de SQL/paramètres : c’est une procédure d’exploitation qui protège le SLA, maîtrise le risque, trace les décisions, et garantit un rollback propre.

Safety first Checklist Baseline Change control Rollback Sécurité
But #1 : SLA
Toujours optimiser sans dégrader p95/p99 ni créer de risque sécurité.
prod
But #2 : preuve
Chaque action a une hypothèse, une mesure, une validation.
evidence
But #3 : rollback
Tout changement doit être réversible (et testé en conditions réalistes).
safety
10.1

Cadre & responsabilités (RACI)

Qui décide, qui exécute, qui valide, qui est on-call : éviter le chaos en prod.

RACIOn-callOwnership
10.2

Pré-checks (avant tout)

Fenêtre, risque, backups, capacité, locks, charge : checklists “no surprises”.

PreflightCapacityRisk
10.3

Baseline (mesures “avant”)

Ce qu’on capture systématiquement : AWR/ASH, métriques app, OS, storage, top SQL.

AWRASHSLA
10.4

Change plan (hypothèse → action)

Un plan court, exécutable, et testable : 1 changement à la fois + critères d’arrêt.

PlanOne changeStop rules
10.5

Changements contrôlés

SQL/profile/baseline, stats, paramètres, index, partitions : comment changer sans casse.

ControlledLow riskTrace
10.6

Validation en live (go/no-go)

Durant le change : métriques “must not break”, checks rapides, seuils d’alerte.

Go/No-goGuardsSLA
10.7

Rollback (Plan B prêt)

Ce qu’on prépare avant : points de restauration, revert SQL, paramètres, index, stats.

RollbackFastProven
10.8

Post-mortem & capitalisation

Après : mesure finale, delta, coût, incidents, apprentissages, runbooks améliorés.

PMLessonsKnowledge
10.9

Sécurité & conformité

Least privilege, audit, secrets, traçabilité, durcissement : le tuning ne doit pas affaiblir la sécu.

SecurityAuditCompliance
A

Templates (Ticket, Change plan, PM)

Copier-coller : gabarits prêts à l’emploi (prod-ready).

TemplatesCopy
B

Commandes & vues (runbook)

“Minimal set” à exécuter avant/pendant/après pour objectiver le change.

AWR/ASHV$Ops