Context Engineering — Section 9 : Orchestration & Agents

Donner au LLM la capacité de raisonner, planifier et agir pour atteindre des objectifs complexes.

Orchestration & Agents

Assembler toutes les briques (RAG, mémoire, outils) pour construire des systèmes autonomes qui accomplissent des tâches. Cliquez pour explorer.

Panorama : Des Chaînes aux Agents

Jusqu'ici, nous avons surtout vu des "chaînes" (chains) : des séquences d'opérations prédéfinies (Retrieve -> Augment -> Generate). Un **agent** est une évolution majeure : c'est un système où le LLM lui-même **décide de la prochaine étape**. L'orchestration est l'art de construire et de gérer ces flux de travail dynamiques.

Définition d'un Agent

Un système autonome qui utilise un LLM comme moteur de raisonnement pour atteindre un objectif en interagissant avec son environnement via des outils.

Pourquoi c'est important ?

- Flexibilité : L'agent peut s'adapter à des situations imprévues, contrairement à une chaîne rigide.
- Capacités étendues : En utilisant des outils, l'agent peut interagir avec le monde réel (API, bases de données, internet).
- Résolution de problèmes complexes : Il peut décomposer un objectif complexe en sous-tâches et les exécuter.

La Boucle Agentique : Le Framework ReAct

Le framework **ReAct (Reason + Act)** est le patron de conception fondamental de la plupart des agents modernes. L'agent opère dans une boucle où il alterne entre la pensée et l'action.

(Goal) -> [🤖 LLM Brain] -> (Thought 1) -> (Action 1: Use Tool A) | ^-------------------- (Observation 1: Result of Tool A) <----[🛠️ Tools] | [🤖 LLM Brain] -> (Thought 2: "Result is not enough, I need Tool B") -> (Action 2: Use Tool B) ... Loop until the goal is reached ... [🤖 LLM Brain] -> (Final Answer)

Étape	Description	Exemple
Thought (Pensée)	Le LLM formule un raisonnement interne pour décider de la prochaine étape. C'est son "monologue intérieur".	"L'utilisateur veut les infos sur le vol AF123. Je dois utiliser l'outil `flight_tracker`."
Action	Le LLM décide d'une action, typiquement appeler un outil avec des paramètres spécifiques.	`flight_tracker(flight_number='AF123')`
Observation	Le système exécute l'action et retourne le résultat (ou une erreur) au LLM.	`{"status": "On Time", "departure_gate": "C32"}`
Raisonnement final	Après avoir collecté assez d'informations, le LLM utilise une pensée finale pour formuler la réponse.	"J'ai toutes les infos. Je peux maintenant répondre à l'utilisateur."

La Gestion des Outils (Tools)

Les outils sont les "mains" de l'agent. Leur qualité et leur description sont critiques pour le succès du système.

La description de l'outil est plus importante que le code de l'outil lui-même. Le LLM ne voit que la description pour décider s'il doit l'utiliser. Elle doit être claire, précise et inclure des exemples si nécessaire.

Anatomie d'un Outil

- Nom : Un nom unique et programmatique (`get_stock_price`).
- Description : Une phrase en langage naturel expliquant ce que fait l'outil et quand l'utiliser. (ex: "Use this to get the current stock price for a given ticker symbol.").
- Schéma d'Entrée : Un schéma JSON (ou Pydantic) strict définissant les arguments, leurs types et s'ils sont obligatoires.

Gestion des Erreurs

Si un outil échoue, il ne doit pas crasher le système. Il doit retourner une observation claire, par exemple : `Observation: Error - Ticker symbol 'XYZ' not found.`. Un bon agent pourra alors raisonner sur cette erreur et potentiellement corriger sa trajectoire.

Planification & Décomposition de Tâches

Pour un objectif complexe comme "Organise mon voyage d'affaires à Londres la semaine prochaine", une simple boucle ReAct ne suffit pas. L'agent doit d'abord **planifier**.

Planification Simple (Single-Plan) : Le LLM génère une liste d'étapes au début, puis l'orchestrateur les exécute une par une. Rigide, mais simple.
Planification & Exécution (Plan-and-Execute) : L'agent génère un plan, puis une boucle d'exécution distincte tente de suivre ce plan, en utilisant un agent ReAct pour chaque étape. Plus robuste.
Planification Hiérarchique : L'agent décompose un objectif en sous-objectifs, qui peuvent eux-mêmes être décomposés. Cela permet de gérer une très grande complexité, souvent en déléguant les sous-tâches à d'autres agents spécialisés.

Systèmes Multi-Agents

Au lieu d'un seul agent omniscient, on peut créer une "équipe" d'agents spécialisés qui collaborent. C'est une approche puissante pour la résolution de problèmes complexes.

Analogie : Une équipe de développement logiciel. Il y a un Chef de Projet (agent planificateur), un Développeur (agent codeur), un Testeur (agent de validation), et un Rédacteur Technique (agent de documentation). Chacun a un rôle et des outils spécifiques.

Architecture	Principe	Frameworks
Hiérarchique	Un agent "manager" distribue les tâches à des agents "travailleurs" et synthétise leurs résultats.	CrewAI
Collaborative (Débat)	Plusieurs agents travaillent sur le même problème, critiquent le travail des autres et itèrent jusqu'à atteindre un consensus ou une solution de haute qualité.	Microsoft AutoGen
Routage	Un agent "routeur" initial analyse la requête de l'utilisateur et la dirige vers l'agent spécialisé le plus approprié.	LangChain Agent Router

Gestion du Contexte dans les Pipelines Agentiques

Le contexte est le carburant de l'agent. Il est accumulé, passé entre les étapes et doit être géré avec soin.

Le "Scratchpad"

C'est la mémoire à court terme de l'agent. Après chaque cycle (Thought, Action, Observation), le résultat est ajouté à un "scratchpad". L'intégralité de ce scratchpad est réinjectée dans le prompt au tour suivant, permettant à l'agent de se souvenir de ce qu'il a déjà fait.

Gestion de l'État (State)

Pour les agents complexes, un simple scratchpad ne suffit pas. On utilise un objet "State" (un dictionnaire ou un objet Pydantic) qui est passé et modifié à chaque étape. Cela permet des workflows non-linéaires (boucles, branches). C'est le principe de **LangGraph**.

Contexte Externe

L'agent peut et doit utiliser les autres formes de contexte que nous avons vues :
- Avant de démarrer, il peut charger des informations pertinentes depuis la **Mémoire Utilisateur**.
- Il peut avoir un outil `knowledge_graph_search` pour interroger un **Knowledge Graph** lorsqu'il a besoin de faits structurés.

Frameworks d'Orchestration Populaires

Framework	Philosophie	Idéal pour...
LangChain (LangGraph)	Fournit des briques de construction pour tout l'écosystème. LangGraph est sa solution pour les agents complexes et cycliques.	Construire des agents stateful avec des workflows complexes (cycles, branches, intervention humaine).
LlamaIndex	Très orienté données. Leurs agents sont conçus pour interroger intelligemment des sources de données complexes.	Créer des agents RAG avancés qui peuvent raisonner sur des documents et des données structurées.
Microsoft AutoGen	Centré sur la conversation et la collaboration entre plusieurs agents.	Simuler des équipes d'experts qui débattent et résolvent des problèmes ensemble.
CrewAI	Une surcouche à LangChain qui facilite la création d'équipes d'agents hiérarchiques avec des rôles et des objectifs clairs.	Définir des processus métier clairs avec des agents spécialisés (ex: "équipe de prospection marketing").

Pièges & Challenges

Le Risque de Sécurité des Outils

Donner à un agent un outil `execute_python_code` ou `send_email` est extrêmement dangereux. L'agent pourrait être manipulé par un prompt malveillant pour exécuter du code arbitraire ou spammer des gens. Tout outil ayant un impact sur le monde réel doit être placé dans un **bac à sable (sandbox)** et/ou nécessiter une **confirmation humaine** avant exécution.

Boucles infinies : L'agent peut se retrouver coincé, tentant la même action qui échoue en permanence. Un compteur de maximum d'itérations est une sécurité indispensable.
Coûts imprévisibles : Un agent qui décide de faire 10 recherches web et 5 appels à GPT-4 pour répondre à une question simple peut rapidement devenir très cher. Mettez en place un monitoring et des budgets stricts.
"Prompt Brittleness" : La performance de l'agent est hypersensible à la formulation du prompt système et des descriptions des outils. Un petit changement peut radicalement altérer son comportement.

Snippet 1 : Définir un Outil (Tool) avec LangChain


from langchain_core.tools import tool
from pydantic import BaseModel, Field

# 1. Définir le schéma d'entrée avec Pydantic
class SearchInput(BaseModel):
    query: str = Field(description="The search query to look for.")

# 2. Créer l'outil avec le décorateur @tool
@tool(args_schema=SearchInput)
def web_search(query: str) -> str:
    """
    Use this tool to search the web for recent information.
    The description is crucial for the agent to know when to use it.
    """
    # ... (code to call a search API like DuckDuckGo, Tavily, etc.)
    return f"Results for '{query}': ..."

# L'agent peut maintenant être initialisé avec [web_search]
# Le LLM verra le nom, la description, et le schéma d'arguments.

Snippet 2 : Pseudo-code d'un Orchestrateur ReAct


def run_react_loop(goal, tools):
    scratchpad = ""
    max_turns = 10
    
    for i in range(max_turns):
        # 1. Construire le prompt avec l'historique
        prompt = f"""
        Goal: {goal}
        
        You have access to these tools: {[t.name for t in tools]}
        
        Scratchpad (your previous thoughts and actions):
        {scratchpad}
        
        Thought:
        """
        
        # 2. Le LLM génère sa pensée et l'action à suivre
        response = llm.invoke(prompt) # ex: "I need to search for X. Action: web_search(query='X')"
        thought, action = parse_llm_response(response)
        
        scratchpad += f"Thought: {thought}\nAction: {action}\n"
        
        # 3. Si l'action est une réponse finale, on arrête
        if is_final_answer(action):
            return get_final_answer(action)
            
        # 4. Exécuter l'outil et obtenir l'observation
        observation = execute_tool(action, tools)
        scratchpad += f"Observation: {observation}\n"

    return "Agent could not reach a conclusion."

Playbook de Déploiement

Étape 1 : Commencer avec le "Tool Using", pas les agents. Avant de construire une boucle, assurez-vous que votre LLM peut choisir de manière fiable parmi un ensemble d'outils pour répondre à une question en un seul tour. C'est la base.
Étape 2 : Construire un agent ReAct simple. Utilisez un framework pour implémenter une boucle ReAct simple avec 2-3 outils. L'objectif est de valider que l'agent peut chaîner quelques actions pour atteindre un but.
Étape 3 : Obsédez-vous sur les descriptions d'outils. La majorité de vos efforts de "prompt engineering" doit se concentrer sur l'amélioration des descriptions des outils pour les rendre aussi claires et non ambiguës que possible.
Étape 4 : Utiliser des graphes d'états pour les workflows complexes. Dès que votre logique nécessite des boucles, des branches ou une intervention humaine, abandonnez les simples chaînes d'agents et passez à un modèle de graphe d'états comme **LangGraph**. C'est beaucoup plus robuste et maintenable.
Étape 5 : Réserver les systèmes multi-agents aux problèmes collaboratifs. Ne complexifiez pas votre architecture avec plusieurs agents si un seul agent bien "outillé" peut faire le travail. Utilisez les multi-agents pour des tâches qui bénéficient intrinsèquement de "points de vue" ou de rôles différents.
Étape 6 : Mettre en place des gardes-fous stricts. Implémentez des limites sur le nombre de tours, le coût total, et exigez une validation humaine pour toute action sensible avant même de penser à la production.