Gemini 2.5 Pro â Principes majeurs
6 principes, avec bonnes pratiques dev, anti-patterns, checklists, snippets et focus multimodal.
Multimodal natif Guardrails Vertex AI SDK Python/JS
Glossaire express (Gemini)
- Token : sous-unité de texte.
- Embedding : vecteur représentant un texte/image/audio.
- MoE : Mixture-of-Experts, active une sous-partie du réseau.
- Self/Cross-attention : pondÚre relations entre tokens / modalités.
- Top-p / Température : contrÎle diversité vs précision.
- RAG : Retrieval-Augmented Generation (recherche + génération).
- Guardrails : filtres/contraintes dâIA responsable (Vertex AI).
- Context window : taille max du contexte consommé.
- Groundedness : réponses appuyées sur des sources.
- Hallucination : sortie plausible mais fausse.
1) Pas de « conscience » â modĂšle probabiliste multimodal
Ă retenir
- Gemini 2.5 Pro prédit la suite (texte, code, image, audio) par probabilités.
- Pas dâintentions ni croyances â corrĂ©lations statistiques.
- Multimodal natif : pas besoin de âbridgesâ texteâimageâaudio.
Anti-patterns
- Questions dâintention (« pourquoi tu penses⊠») â prĂ©fĂ©rer preuves/process.
- Implicites (rĂŽle/format) â toujours prĂ©ciser.
- Confondre contexte vs mémoire applicative (vector store, DB).
Prompt minimal (multimodal)
{
"role":"system","content":"Assistant front-end senior. Donne un diagnostic précis et actionnable."
}
{
"user":{
"goal":"Analyser lâaccessibilitĂ© dâune page",
"inputs":{"text":"Analyse titres & contraste","image_url":"https://.../screenshot.png"},
"constraints":{"format":"markdown","sections":["problĂšmes","preuves","correctifs"],"limit_lines":50}
}}Contrat de sortie (JSON)
{
"title":"Audit a11y",
"problemes":["H1 manquant","Contraste faible boutons"],
"preuves":["capture header","WCAG AA"],
"correctifs":["Ajouter H1","Contraste > 4.5:1"]
}2) Apprentissage supervisé massif (multimodal)
Pipeline
- Collecte/filtrage texte, code, images, audio.
- Tokenisation (texte) + patch/features (image/audio) â embeddings.
- PrĂ©-entraĂźnement (next token/patch) â descente de gradient.
- Ăval + fine-tuning (supervisĂ© & RLHF).
Impacts produit
- Le modĂšle reflĂšte styles & biais du corpus.
- FraĂźcheur limitĂ©e â connecter des sources (RAG/BigQuery/Search).
- Few-shot rĂ©alistes â qualitĂ© perçue.
Bonnes pratiques prompt
- Exemples proches du rendu attendu (1â3).
- CritĂšres dâacceptation (DoD) + format strict.
- Contre-exemples si risque dâambiguĂŻtĂ©.
Tip : journalise prompts/réponses, score (coverage, groundedness, coût, latence) et itÚre.
# Few-shot (extrait)
IN â "Convertir ce schĂ©ma DB en modĂšles Django"
EX1_IN â "users(id,email,team_id) teams(id,name)"
EX1_OUT â {"models":[{"name":"Team","fields":[...]},{"name":"User","fields":[...]}]}3) Architecture multimodale : Transformer + Mixture-of-Experts
Vue flash
EntrĂ©e (texte/image/audio) â Embeddings
â [Self/Cross-Attention + MLP + Norm] Ă N
â (MoE: route vers experts spĂ©cialisĂ©s)
â Logits â Softmax- Multi-head : diffĂ©rentes dĂ©pendances.
- MoE : efficacitĂ© (nâactive quâune partie du rĂ©seau).
- Cross-modal : texte â image â audio.
Implications pratiques
- Documents longs â chunking (500â1500 tokens) + overlap 10â20%.
- RAG pour injecter passages pertinents (retrievalâcontexte).
- Balises claires entre sections (###, ---) pour guider lâattention.
{"doc":"Guide SSO","chunks":[{"id":"c1","title":"Intro","text":"..."},{"id":"c2","title":"OIDC vs SAML","text":"..."}]}4) GĂ©nĂ©ration probabiliste â tempĂ©rature, top-p, stop
| Cas | Temp. | Top-p | Notes |
|---|---|---|---|
| Code/SQL | 0.0â0.3 | 0.8â1.0 | PrĂ©cision > crĂ©ativitĂ© |
| Doc technique | 0.2â0.5 | 0.9 | Style naturel |
| CrĂ©atif | 0.6â0.9 | 0.9â1.0 | DiversitĂ© dâidĂ©es |
Exiger un format strict
{"role":"system","content":"Réponds STRICTEMENT en JSON valide. Champs: title, steps[], risks[]"}
{"role":"user","content":"GĂ©nĂšre un plan de migration DBAâDevOps"}SĂ©quences dâarrĂȘt
# Pseudo-SDK
client.responses.generate(
stop=["\nEND_JSON"],
temperature=0.2, top_p=0.9
)Validation : parser le JSON, schéma (Pydantic/Django), renvoyer une erreur exploitable.
5) Alignement & sĂ©curitĂ© â RLHF, politiques, guardrails
Composants
- Supervision humaine (exemples notés) + RLHF.
- Filtres de contenu sensibles (violence, vie privée, etc.).
- Guardrails Vertex AI (politiques, classif/deny, journaux).
Guardrails applicatifs
- Allow-list dâoutils (web, DB) + scopes/quotas.
- Modération avant/aprÚs génération selon le risque.
- Journalisation prompts/réponses/outils + audit.
Exemple de politique (extrait)
{
"safe_tools":["search","db.read_only"],
"deny":["shell.exec","secrets.write"],
"refusal_policy":{"dangerous_request":"Explique clairement le refus et propose une alternative sûre."}
}Tests
- Jeux de prompts ârougesâ (red-teaming) rĂ©currents.
- Métriques : refus justifiés, faux positifs/négatifs, groundedness.
Principe : plus dâoutils â plus de surface de risque â limiter, tracer, isoler.
6) Limites structurelles & plans de contournement
Hallucinations
- Exiger sources / citations.
- RAG + validation serveur (regex, schémas, tests).
- Demander incertitudes explicitement.
Biais & équité
- Relecture humaine pour décisions sensibles.
- Masquage des attributs non pertinents.
- Rapports rĂ©guliers dâaudit.
Contexte borné
- Orchestration multi-étapes / agents.
- Rolling summary + state packs.
- ADR : consigner les décisions.
RAG minimal
# 1) indexation
chunks = split(doc, size=1000, overlap=150)
index.add([embed(c.text) for c in chunks])
# 2) retrieval
ctx = index.search(embed(user_query), top_k=5)
# 3) génération
prompt = render(tpl, {"query":user_query,"passages":ctx})Contrats de sortie
class Plan(BaseModel):
title: str
steps: list[str]
risks: list[str]
obj = Plan.model_validate_json(response_text)Prod : monitoring latence/coûts/erreurs, quotas, retries, timeouts, circuit-breakers.
