Gemini 2.5 Pro — Principes majeurs

6 principes, avec bonnes pratiques dev, anti-patterns, checklists, snippets et focus multimodal.

Multimodal natif Guardrails Vertex AI SDK Python/JS

À retenir

Gemini 2.5 Pro prédit la suite (texte, code, image, audio) par probabilités.
Pas d’intentions ni croyances → corrélations statistiques.
Multimodal natif : pas besoin de “bridges” texte↔image↔audio.

Anti-patterns

Questions d’intention (« pourquoi tu penses… ») → préférer preuves/process.
Implicites (rôle/format) → toujours préciser.
Confondre contexte vs mémoire applicative (vector store, DB).

Prompt minimal (multimodal)

{
 "role":"system","content":"Assistant front-end senior. Donne un diagnostic précis et actionnable."
}
{
 "user":{
  "goal":"Analyser l’accessibilité d’une page",
  "inputs":{"text":"Analyse titres & contraste","image_url":"https://.../screenshot.png"},
  "constraints":{"format":"markdown","sections":["problèmes","preuves","correctifs"],"limit_lines":50}
 }}

Contrat de sortie (JSON)

{
 "title":"Audit a11y",
 "problemes":["H1 manquant","Contraste faible boutons"],
 "preuves":["capture header","WCAG AA"],
 "correctifs":["Ajouter H1","Contraste > 4.5:1"]
}

Pipeline

Collecte/filtrage texte, code, images, audio.
Tokenisation (texte) + patch/features (image/audio) → embeddings.
Pré-entraînement (next token/patch) → descente de gradient.
Éval + fine-tuning (supervisé & RLHF).

Impacts produit

Le modèle reflète styles & biais du corpus.
Fraîcheur limitée → connecter des sources (RAG/BigQuery/Search).
Few-shot réalistes ↑ qualité perçue.

Bonnes pratiques prompt

Exemples proches du rendu attendu (1–3).
Critères d’acceptation (DoD) + format strict.
Contre-exemples si risque d’ambiguïté.

Tip : journalise prompts/réponses, score (coverage, groundedness, coût, latence) et itère.

# Few-shot (extrait)
IN → "Convertir ce schéma DB en modèles Django"
EX1_IN → "users(id,email,team_id) teams(id,name)"
EX1_OUT → {"models":[{"name":"Team","fields":[...]},{"name":"User","fields":[...]}]}

Vue flash

Entrée (texte/image/audio) → Embeddings
→ [Self/Cross-Attention + MLP + Norm] × N
→ (MoE: route vers experts spécialisés)
→ Logits → Softmax

Multi-head : différentes dépendances.
MoE : efficacité (n’active qu’une partie du réseau).
Cross-modal : texte ↔ image ↔ audio.

Implications pratiques

Documents longs → chunking (500–1500 tokens) + overlap 10–20%.
RAG pour injecter passages pertinents (retrieval→contexte).
Balises claires entre sections (###, ---) pour guider l’attention.

{"doc":"Guide SSO","chunks":[{"id":"c1","title":"Intro","text":"..."},{"id":"c2","title":"OIDC vs SAML","text":"..."}]}

Cas	Temp.	Top-p	Notes
Code/SQL	0.0–0.3	0.8–1.0	Précision > créativité
Doc technique	0.2–0.5	0.9	Style naturel
Créatif	0.6–0.9	0.9–1.0	Diversité d’idées

Exiger un format strict

{"role":"system","content":"Réponds STRICTEMENT en JSON valide. Champs: title, steps[], risks[]"}
{"role":"user","content":"Génère un plan de migration DBA→DevOps"}

Séquences d’arrêt

# Pseudo-SDK
client.responses.generate(
  stop=["\nEND_JSON"],
  temperature=0.2, top_p=0.9
)

Validation : parser le JSON, schéma (Pydantic/Django), renvoyer une erreur exploitable.

Composants

Supervision humaine (exemples notés) + RLHF.
Filtres de contenu sensibles (violence, vie privée, etc.).
Guardrails Vertex AI (politiques, classif/deny, journaux).

Guardrails applicatifs

Allow-list d’outils (web, DB) + scopes/quotas.
Modération avant/après génération selon le risque.
Journalisation prompts/réponses/outils + audit.

Exemple de politique (extrait)

{
 "safe_tools":["search","db.read_only"],
 "deny":["shell.exec","secrets.write"],
 "refusal_policy":{"dangerous_request":"Explique clairement le refus et propose une alternative sûre."}
}

Tests

Jeux de prompts “rouges” (red-teaming) récurrents.
Métriques : refus justifiés, faux positifs/négatifs, groundedness.

Principe : plus d’outils ⇒ plus de surface de risque → limiter, tracer, isoler.

Hallucinations

Exiger sources / citations.
RAG + validation serveur (regex, schémas, tests).
Demander incertitudes explicitement.

Biais & équité

Relecture humaine pour décisions sensibles.
Masquage des attributs non pertinents.
Rapports réguliers d’audit.

Contexte borné

Orchestration multi-étapes / agents.
Rolling summary + state packs.
ADR : consigner les décisions.

RAG minimal

# 1) indexation
chunks = split(doc, size=1000, overlap=150)
index.add([embed(c.text) for c in chunks])
# 2) retrieval
ctx = index.search(embed(user_query), top_k=5)
# 3) génération
prompt = render(tpl, {"query":user_query,"passages":ctx})

Contrats de sortie

class Plan(BaseModel):
  title: str
  steps: list[str]
  risks: list[str]
obj = Plan.model_validate_json(response_text)

Prod : monitoring latence/coûts/erreurs, quotas, retries, timeouts, circuit-breakers.

Gemini 2.5 Pro — Principes majeurs

1. Pas de conscience

2. Apprentissage supervisé

3. Architecture multimodale

4. Génération

5. Alignement & sécurité

6. Limites & implications