Project Oxygen & Ideo-LabIDEO LAB Dashboard 2026

🐘 Signaux d'Alertes & Paramètres Critiques

Objectif : détecter tôt les signaux faibles (cache, I/O, verrous, autovacuum, WAL, mémoire, connexions, requêtes lentes) qui font passer une architecture PostgreSQL mal réglée d’un état « ça tient » à « prod en flammes ».

2.1

Cache & I/O : hit ratio & « tables hot »

Suivre le hit ratio global & par table/index, repérer les scans massifs qui font exploser l’I/O quand le cache passe sous 98–99 % en OLTP.

pg_stat_database pg_statio_*
2.2

Temp files & sorts/hash qui dérapent

Identifier les requêtes qui débordent en fichiers temporaires, mal dimensionnent work_mem et saturent le disque /tmp.

temp_files work_mem
2.3

Verrous, deadlocks & idle in transaction

Suivre les sessions en attente de lock, les deadlocks récurrents et les transactions oubliées qui bloquent tout le monde.

pg_stat_activity pg_locks
2.4

Autovacuum, bloat & wraparound

Vérifier que l’autovacuum suit le rythme, éviter le bloat monstrueux et le risque de transaction ID wraparound qui peut forcer le cluster en read-only.

pg_stat_all_tables age(datfrozenxid)
A

Mémoire, connexions & pools

Dimensionner shared_buffers, effective_cache_size, work_mem et max_connections, et imposer un pool de connexions.

shared_buffers PgBouncer
B

Runbook « OLTP à l’agonie »

Réflexes quand la latence explose, que les verrous s’accumulent et que la prod est déjà impactée : quoi couper, où regarder, dans quel ordre.

throttling priorisation
C

Scripts de diag performance & signaux faibles

Pack de requêtes pour suivre hit ratio, temp files, locks, autovacuum, checkpoints, connexions, requêtes lentes & pg_stat_statements.

pg_stat_* logs SQL