Gemini 2.5 – Introduction (dev web)

Survole et clique une rubrique pour ouvrir le guide détaillé.

Gemini 2.5 est un LLM multimodal natif opéré via Vertex AI (texte, image, audio, parfois vidéo). Modèle probabiliste de type Transformer : il prédit des tokens (pas de “compréhension” humaine).

Ce que ça change pour un dev

Familles : gemini-2.5-pro (qualité), …-flash (latence/coût), variantes multi-régions.
Multimodal en E/S ; tools (function calling), RAG/Grounding natifs Vertex.
Sortie typée : response_mime_type=application/json + response_schema.
Contrôles : generation_config (température, top-p, max tokens, stop), safety_settings.
Gouvernance : IAM, régions, journaux, Secret Manager, moindre privilège.

SDK Python (init + JSON structuré)

import os, vertexai
from vertexai.generative_models import GenerativeModel, GenerationConfig, ResponseSchema
vertexai.init(project=os.getenv("GCP_PROJECT"), location=os.getenv("GCP_REGION","us-central1"))
model = GenerativeModel(os.getenv("GEMINI_MODEL","gemini-2.5-pro"))

schema = ResponseSchema(type="object", properties={
  "bullets":{"type":"array","items":{"type":"string"}},
  "risks":{"type":"array","items":{"type":"string"}}
}, required=["bullets"])

cfg = GenerationConfig(temperature=0.2, top_p=0.9, max_output_tokens=800,
                       response_mime_type="application/json", response_schema=schema)

res = model.generate_content("Donne 3 atouts + 3 risques pour un projet web.", generation_config=cfg)
print(res.text)

SDK JS (Node minimal)

import { GoogleGenerativeAI } from "@google/generative-ai";
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: process.env.GEMINI_MODEL || "gemini-2.5-pro" });
const { response } = await model.generateContent([{text:"3 cas d'usage dev web avec valeur business"}]);
console.log(response.text());

Astuce : logge prompt, paramètres et sortie pour audit/coût.

Mémo : la mémoire “long terme” se reconstruit côté app (DB + vector store + RAG).

10 tâches à fort ROI pour un dev web

Scaffold Django/React (modèles, vues, routes, tests, CI).
CRUD + formulaires + validations réutilisables.
Écriture de tests (unitaires/feature) à partir de specs.
Migration SQL → ORM (modèles, migrations, fixtures).
Refactor sécurisé (diff unifié + plan de tests).
Parsing/Transformation (CSV/JSON/HTML) + schémas.
Doc technique / ADR automatisés.
Génération d’API clients (Python/TS) depuis OpenAPI.
Rédaction de jobs (cron/scheduler) et scripts d’ops.
Exploration d’erreurs : stack traces + patch minimal.

Patron “Scaffold Django”

RÔLE: Architecte Vertex AI
OBJECTIF: App "blog" (Model Article + Admin + ListView + CreateView + URLs + Templates)
CONTRAINTES:
- Chemins & noms exacts
- TOUTE modif existante = diff unifié
- ≤ 120 lignes par bloc (sinon STOP + "CONTINUER ?")
SORTIE: étapes + code + commandes manage.py + tests

Sortie structurée (le back applique)

from vertexai.generative_models import GenerationConfig, ResponseSchema
schema = ResponseSchema(type="object", properties={
  "files":{"type":"array","items":{"type":"object","properties":{
    "path":{"type":"string"}, "action":{"type":"string","enum":["create","patch"]},
    "content":{"type":"string"}}}}, "commands":{"type":"array","items":{"type":"string"}}
}, required=["files"])
cfg = GenerationConfig(response_mime_type="application/json", response_schema=schema)

Le backend parse et applique (sécurisé + traçable + idempotent).

Patrons prêts à l’emploi

A) ONE-FILE PATCH (diff)
RÔLE: Ingénieur Python senior
OBJECTIF: Corriger la fonction X
CONTRAINTES: Donne un DIFF UNIFIÉ + tests unitaires
SORTIE: diff, nouveaux tests, commande pytest

B) MIGRATION SQL → ORM
RÔLE: DBA Django
ENTRÉE: DDL SQL + contraintes
SORTIE: models.py, migration, tests, commandes manage.py

C) BUG → REPRO + FIX
RÔLE: Dév Full-stack
ENTRÉE: trace + snippet
SORTIE: étapes de repro, cause racine, patch (diff), test

Paramètres & garde-fous

temperature 0–0.3 (code) ; 0.7 (idéation).
system_instruction = charte (format, ton, refus si incertain).
Limiter à 120 lignes/bloc ; pause + validation au-delà.
Imposer chemins de fichiers + “si modif → diff unifié”.

Sortie fortement typée (schema)

from vertexai.generative_models import GenerationConfig, ResponseSchema
schema = ResponseSchema(type="object", properties={
  "summary":{"type":"string"},
  "todos":{"type":"array","items":{"type":"string"}},
  "patch":{"type":"string","description":"Diff unifié si modif"}}, required=["todos"])
cfg = GenerationConfig(response_mime_type="application/json", response_schema=schema)

Streaming (Python)

from vertexai.generative_models import GenerativeModel
model = GenerativeModel("gemini-2.5-pro")
for chunk in model.generate_content("Explique le pattern Repository en Django.", stream=True):
    print(chunk.text or "", end="")

Function Calling (tools)

from vertexai.generative_models import GenerativeModel, Tool, FunctionDeclaration
tool = Tool(function_declarations=[FunctionDeclaration(
  name="lookup_doc",
  description="Recherche interne",
  parameters={"type":"object","properties":{"query":{"type":"string"}},"required":["query"]}
)])
model = GenerativeModel("gemini-2.5-pro")
resp = model.generate_content("Trouve la politique RGPD résumée.", tools=[tool])
# Parcours des tool_calls → exécuter lookup_doc côté back → renvoyer la réponse au modèle si nécessaire

JavaScript (génération simple)

const model = genAI.getGenerativeModel({ model: "gemini-2.5-pro" });
const { response } = await model.generateContent([{text:"Donne un exemple de route Express."}]);
console.log(response.text());

Robustesse

Timeouts → retry + backoff exponentiel.
Journaliser prompt, params, latence, tokens, coût.
Limiter output (stop_sequences) pour éviter les dérives.

Référence d’architecture

Client (Web/CLI)
  → Backend (FastAPI/Django) : orchestrateur, validation, IAM
    → Gemini 2.5 (Vertex AI) : prompts + tools
    → Tools managés : code-interpreter, web, retrieval
    → RAG : Vertex AI Search & Grounding (BigQuery, GCS, sites)
    → Stores : Cloud SQL / Firestore / GCS / Matching Engine (vecteurs)
    → Observabilité : Cloud Logging, Error Reporting, Metrics

Ops

Cloud Run/Functions, CI Cloud Build, jobs Scheduler.
Service Accounts dédiés, rôles IAM minimaux.
Secrets via GCP Secret Manager (clés API/DSN DB).

RAG & Grounding

Indexer docs/code → Data Store (Search).
Rechercher top-k + citations.
Injecter contexte au prompt + demander sources.

Qualité & métriques

Latence p95, tokens, coût, % réponses “incertaines”.
Jeux d’évaluation (coverage/groundedness/consistency).
Alertes : 5xx, over-quota, dérive de coût.

Pages dédiées : SDK Python/JS, Agents & Tools, RAG & Search/Grounding, Ops (Run/Build/Functions).
Basculer cette page en contenu DB (même modèle que ChatGPT) + import JSON (cron).
Matrice d’évaluation (groundedness/coverage/latence/coûts) pilotée par tests.
Starter Cloud Run : FastAPI + Vertex AI + RAG + CI Cloud Build.

Mémo GCP

gcloud config set project <ID_PROJET>
gcloud auth application-default login
gcloud run deploy gemini-app --source . --region=us-central1 --allow-unauthenticated

Gemini 2.5 – Introduction (dev web)

1. Qu’est-ce que Gemini 2.5 ?

2. Pourquoi dans le dev web ?

3. Limites & contournements

4. Prompting (patrons)

5. Exemples concrets

6. Architecture d’assistant

7. Check-list projets longs

8. Prochaines briques