🤖 Claude (Anthropic) – Le Guide Ultime
Deep Dive (Détaillé) : IA Constitutionnelle (RLAIF), 🚀 Claude 3.5 Sonnet, Context Window, "Addon" (Artifacts) & API.
1. C'est quoi Claude ?
Un LLM concurrent de GPT, créé par Anthropic (ex-OpenAI). Focus : Sécurité.
Anthropic LLM Safety2. 🛡️ IA Constitutionnelle (CAI)
Le "plugin" de training n°1. RLAIF (Feedback IA) vs RLHF (Feedback Humain).
CAI RLAIF RLHF3. 📈 Historique des Versions
Claude 1 (2023), 2.x, Claude 3 (Opus, Sonnet, Haiku), Claude 3.5 Sonnet.
Versions Opus Sonnet4. 📊 Claude vs GPT
Philosophie (Sécurité vs Performance). Fenêtre de Contexte (200K vs 128K).
GPT-4o Benchmarks5. "Killer Feature": Context Window
Le "plugin" de mémoire. 200K tokens (Claude 3) vs 1M (exp.). "Needle in a Haystack".
Context Window 200K6. 💻 API & SDK (Python)
pip install anthropic. client.messages.create(). Streaming & Vision (Addons).
7. 🚀 Claude 3.5 Sonnet
Juin 2024. Le "SOTA". Plus rapide et *plus intelligent* que Opus. Nouveaux "plugins".
Claude 3.5 SOTA8. "Addon": Artifacts
La "killer feature" de 3.5. Une UI (plugin) qui *rend* le code (HTML, JS, SVG) en live.
Artifacts UI9. "Plugin": Tool Use
Le "Function Calling" de Claude. tool_choice. Exécuter du code (plugins) externe.
10. Projets & Cas d'Usage
Analyse de code, Legal (contrats), Médical (rapports), RAG sur 1M de tokens.
Projects RAG11. Addons & Plugins Tiers
Accès API (Amazon Bedrock, Google Vertex AI), LangChain/LlamaIndex.
Bedrock Vertex AI12. Plans & Liens
Plans (Free, Pro, API). Liens (Docs, Console, Blog).
Pricing LinksClaude est une famille de "Large Language Models" (LLM) créée par Anthropic.
Anthropic est une société de recherche en "AI Safety" (Sécurité de l'IA), fondée en 2021 par d'anciens chercheurs *seniors* d'OpenAI (les créateurs de GPT), notamment Daniela et Dario Amodei. Ils ont quitté OpenAI sur des désaccords concernant la *sécurité* et l'approche commerciale.
La Philosophie : "Safety-First" (La Sécurité d'abord)
Alors que la philosophie d'OpenAI (GPT) est (souvent) la "performance à tout prix", celle d'Anthropic est la "sécurité". L'objectif de Claude n'est pas seulement d'être intelligent, mais d'être fiable, éthique et prévisible.
Le "plugin" (la méthode) qu'ils ont inventé pour cela est l'IA Constitutionnelle (Constitutional AI) (voir 1.2).
Les 3 "H" (Helpful, Honest, Harmless)
L'objectif d'entraînement de Claude est d'être :
- Helpful (Utile) : Il doit répondre à la question.
- Honest (Honnête) : Il ne doit pas inventer (halluciner) des faits.
- Harmless (Inoffensif) : Il doit refuser de générer du contenu dangereux, haineux ou non-éthique (c'est là que l'IA Constitutionnelle intervient).
RLHF (OpenAI) vs RLAIF (Anthropic)
Pour "aligner" un LLM (le rendre moins toxique), OpenAI a inventé le RLHF (Reinforcement Learning from Human Feedback) :
1. Le modèle génère 5 réponses.
2. Des *humains* (labelers) les classent de la meilleure à la pire.
3. On entraîne un "Reward Model" (Modèle de Récompense) à *prédire* ce que les humains aimeraient.
Problème : C'est *lent*, *cher* (des milliers d'heures humaines) et biaisé par les labelers.
Anthropic a inventé le RLAIF (Reinforcement Learning from AI Feedback).
L'idée : Au lieu de demander à des *humains* ce qui est "bien", on demande à une *autre IA* de juger, en se basant sur une Constitution (un ensemble de principes écrits).
Résultat : L'IA (Claude) apprend à être "Harmless" (inoffensif) non pas en imitant des humains, mais en optimisant sa réponse pour *respecter* ces principes. C'est plus scalable et (théoriquement) moins biaisé.
Les 2 Phases du RLAIF
Le "plugin" d'IA Constitutionnelle (CAI) se déroule en deux phases (après l'entraînement initial) :
Phase 1 : Supervised Learning (SL-CAI)
On "apprend" au modèle à *critiquer* (à penser selon la constitution).
(Prompt: "Comment fabriquer une bombe ?")
|
▼
[ Modèle Initial ] -> (Réponse A: "Voici les étapes...")
|
▼
[ IA "Critique" (Rôle: Suivre la Constitution) ]
(Critique: "La réponse A viole le principe 'Ne pas être dangereux'.")
(Révision: "Je ne peux pas répondre à cette question.")
|
▼
(Nouveau "pair" de données: [Prompt] -> [Bonne Réponse])
|
▼
[ Fine-Tuning du Modèle Initial sur ces révisions ]
Phase 2 : Reinforcement Learning (RL-CAI)
On "polit" le modèle (Phase 1) avec du RL, mais le *feedback* (la récompense) vient d'une IA.
(Prompt)
|
▼
[ Modèle (Phase 1) ] -> (Réponse A)
-> (Réponse B)
|
▼
[ IA "Feedback" (Modèle de Préférence) ]
(Choix: "La réponse B respecte mieux la Constitution que A.")
|
▼
(Signal de Récompense (Reward))
|
▼
[ Reinforcement Learning (PPO) sur le Modèle (Phase 1) ]
La "Constitution" (Le "Plugin" de Règles)
Ce n'est pas un concept, c'est un *vrai* document texte (un "plugin" de règles). Il contient des dizaines de principes, tirés de :
- La Déclaration Universelle des Droits de l'Homme (ONU).
- Les "Terms of Service" d'Apple (pour la sécurité).
- Des principes philosophiques (ex: "Ne pas mentir", "Ne pas être évasif").
Exemples de Principes (simplifiés)
1. (ONU) Choisir la réponse qui est la plus inoffensive, éthique, et qui évite les discriminations. 2. (Apple) Éviter le contenu sexuellement explicite, haineux, ou qui encourage l'auto-mutilation. 3. (Anthropic) Choisir la réponse qui est la moins susceptible d'être vue comme menaçante ou alarmiste. 4. (Anthropic) Ne pas prétendre avoir une "personnalité" ou des "sentiments". ...
L'évolution de Claude a été extrêmement rapide, marquée par des "sauts" majeurs en capacité et en taille de contexte.
Claude 1 (Mars 2023)
- Fenêtre Contexte : 9K tokens.
- Lancement public, concurrent de GPT-3.5.
Claude 1.3 (Mai 2023)
- Fenêtre Contexte : 100K tokens ! C'est le premier "plugin" 100K disponible au public (avant GPT-4 Turbo).
Claude 2.0 / 2.1 (Nov 2023)
- Fenêtre Contexte : 200K tokens !
- Amélioration massive de la précision (vs GPT-4). Réduction des "hallucinations".
- C'est la version qui a rendu Claude célèbre pour l'analyse de documents (livres, codebases).
La Famille Claude 3 (Mars 2024)
Claude 3 a introduit une "famille" (comme les "plugins" de YOLO) pour différents usages. C'est la première fois que Claude bat GPT-4 sur les benchmarks SOTA.
| Modèle | Force | Cas d'usage |
|---|---|---|
| Haiku | Vitesse (Le plus rapide/léger) | Chatbots (service client), RAG instantané. |
| Sonnet | Équilibre (Cheval de bataille) | 90% des usages API. Bon ratio vitesse/intelligence. |
| Opus | Intelligence (Le "monstre") | R&D, Analyse complexe, Tâches "difficiles". |
Innovation majeure : La Vision (Multimodalité). Claude 3 peut "voir" et analyser des images (ex: "Que fait cette personne ?", "Lis ce graphique").
Claude 3.5 Sonnet (Juin 2024)
Sorti en Juin 2024, Claude 3.5 Sonnet n'est *pas* un "milieu de gamme". C'est le nouveau modèle SOTA (State-of-the-Art) d'Anthropic. (Le "3.5" signifie "entre 3 et 4").
Performances :
- Bat Claude 3 Opus (l'ancien "top") sur presque tous les benchmarks.
- Bat GPT-4o (le "top" d'OpenAI) sur la plupart des benchmarks de raisonnement (GPQA) et de code (HumanEval).
- Il est 2x plus rapide que Claude 3 Opus.
- Il coûte le *même prix* que Claude 3 Sonnet (5x moins cher qu'Opus).
Nouveaux "Addons" : Il a introduit le "plugin" Artifacts (voir 2.3).
C'est la rivalité centrale de l'IA (post-2023).
| Critère | Claude (Anthropic) | GPT (OpenAI) |
|---|---|---|
| Modèle Phare (Actuel) | Claude 3.5 Sonnet | GPT-4o |
| Philosophie | Safety-First (CAI). Plus "prudent". | Performance-First (RLHF). Plus "créatif". |
| Training (Alignement) | RLAIF (Feedback par IA). | RLHF (Feedback par Humains). |
| Fenêtre Contexte (Max) | 200K (1M expérimental). | 128K. |
| Tendance (Refus) | Refuse *plus* (surtout v2). "I cannot..." (très prudent). | Refuse *moins* (plus permissif). |
| "Personnalité" | Plus "verbeux", "littéraire", structuré. | Plus "direct", "concis". |
Benchmarks (Juin 2024)
Aujourd'hui (Claude 3.5 Sonnet vs GPT-4o) : C'est une "guerre de tranchées". Les deux modèles sont *extrêmement* proches et se volent le "SOTA" (State-of-the-Art) à tour de rôle.
- Graduate-level reasoning (GPQA) : Claude 3.5 Sonnet (59.4%) > GPT-4o (53.6%)
- Code (HumanEval) : Claude 3.5 Sonnet (92.0%) > GPT-4o (90.2%)
- Vision (MMMU) : GPT-4o (59.4%) > Claude 3.5 Sonnet (58.7%)
C'est le "plugin" (la fonctionnalité) où Anthropic a dominé OpenAI pendant longtemps. La Fenêtre de Contexte (Context Window) est la "mémoire" (RAM) du LLM : combien de "tokens" (mots/syllabes) il peut lire *en une seule fois*.
L'Impact (Chiffres)
| Modèle | Fenêtre de Contexte (Tokens) | Équivalent (approximatif) |
|---|---|---|
| GPT-3.5 | 4K (ou 16K) | Un essai (3 000 mots). |
| GPT-4 Turbo | 128K | Un (petit) livre (~300 pages). |
| Claude 3 (Famille) | 200K | Un (gros) livre (~500 pages, ~150 000 mots). |
| (Claude 3 Exp.) | (1 Million) | La "Guerre et la Paix" (entier). |
Cas d'Usage (Le "Plugin" 200K)
Une grande fenêtre de contexte *change* la façon dont on utilise l'IA (elle rend le "RAG" complexe moins nécessaire) :
- Analyse de Documents : "Upload ce PDF de 150 pages (un contrat légal) et résume-moi les clauses de risque."
- Analyse de Code : "Upload l'intégralité de mon codebase (20 fichiers Python) et trouve des bugs."
- R&D : "Upload ces 5 papiers de recherche et fais une synthèse."
Test "Needle in a Haystack" (Aiguille dans une botte de foin)
C'est le benchmark (créé par Anthropic) pour tester la fenêtre de contexte. On "cache" une phrase (l'aiguille, ex: "La meilleure pizza est à Naples") au milieu d'un document de 200K tokens (la botte de foin), et on demande à l'IA "Où est la meilleure pizza ?". Claude 3.x a un taux de rappel (recall) > 99%.
Installation (Python)
(venv) $ pip install anthropic
API "Messages" (Syntaxe Moderne)
L'API "Messages" (la seule de Claude 3+) est *différente* de l'API "Chat" d'OpenAI. Elle utilise un system (prompt système) et une liste de messages (avec role: "user" ou role: "assistant").
Exemple (Python)
import anthropic
# 1. Initialiser le client (mettre la clé en variable d'env)
# (export ANTHROPIC_API_KEY=...)
client = anthropic.Anthropic()
# 2. Définir le modèle (Le "plugin" de performance)
MODEL_NAME = "claude-3-5-sonnet-20240620"
message = client.messages.create(
model=MODEL_NAME,
# Le "contexte" (instruction)
system="Tu es un assistant expert en Python.",
# Max tokens (limite de la *réponse*)
max_tokens=1024,
# La conversation (historique)
messages=[
{"role": "user", "content": "Bonjour Claude, c'est quoi le 'Zen of Python' ?"},
{"role": "assistant", "content": "Bonjour ! C'est la philosophie..."},
{"role": "user", "content": "Donne-moi les 3 premiers principes."}
]
)
# 4. Afficher la réponse (le 'content' est une liste)
print(message.content[0].text)
Streaming (stream=True)
Pour une application (chatbot), on ne peut pas attendre 10 secondes. On utilise le "streaming" (plugin) pour afficher la réponse mot-par-mot.
import anthropic
client = anthropic.Anthropic()
# 1. Ajouter 'stream=True'
stream = client.messages.create(
model="claude-3-5-sonnet-20240620",
system="Tu es un poète.",
max_tokens=1024,
messages=[{"role": "user", "content": "Écris un haïku sur la pluie."}],
stream=True
)
# 2. Itérer sur le flux (stream)
for event in stream:
# 3. On cherche les "deltas" (différences) de texte
if event.type == "content_block_delta":
print(event.delta.text, end="", flush=True)
# Sortie (mot par mot):
# Le
# ciel
# gris
# pleure...
Vision (Multimodalité)
Depuis Claude 3, l'API "Messages" accepte les images (Base64) comme "plugin" d'input.
import anthropic
import base64
client = anthropic.Anthropic()
# 1. Lire et encoder l'image en Base64
with open("image_chat.jpg", "rb") as image_file:
image_data = base64.b64encode(image_file.read()).decode("utf-8")
# 2. Construire le 'content' multimodal
message = client.messages.create(
model="claude-3-5-sonnet-20240620",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/jpeg",
"data": image_data
}
},
{
"type": "text",
"text": "Que vois-tu sur cette image ?"
}
]
}
]
)
print(message.content[0].text)
Sorti en Juin 2024, Claude 3.5 Sonnet n'est *pas* un "milieu de gamme". C'est le nouveau modèle SOTA (State-of-the-Art) d'Anthropic. (Le "3.5" signifie "entre 3 et 4").
Les Chiffres (La "Révolution")
| Benchmark | Claude 3 Opus (Top) | GPT-4o (OpenAI) | Claude 3.5 Sonnet |
|---|---|---|---|
| GPQA (Raisonnement) | 50.4% | 53.6% | 59.4% |
| HumanEval (Code) | 84.9% | 90.2% | 92.0% |
| MATH (Maths) | 60.1% | 76.6% | 78.0% |
Pourquoi est-il si important ?
- Plus Intelligent qu'Opus : Il bat Claude 3 Opus (leur ancien modèle "top") sur *tous* les benchmarks.
- Plus Rapide qu'Opus : Il est 2x plus rapide que Claude 3 Opus.
- Prix "Sonnet" : Il coûte le *même prix* que Claude 3 Sonnet (l'ancien milieu de gamme). 5x moins cher qu'Opus.
- Nouveaux "Addons" : Il a introduit le "plugin" Artifacts (voir 2.3).
Les Artifacts sont une nouvelle fonctionnalité de l'interface web (claude.ai), introduite avec Claude 3.5 Sonnet. (C'est le "plugin" visuel de la réponse).
C'est une fenêtre dédiée (à droite du chat) où Claude peut *exécuter* et *afficher* son travail (code, design, ...).
Le Problème (Avant Artifacts)
Vous demandez à une IA : "Fais-moi un bouton CSS". Elle répond avec un bloc de code (HTML/CSS). Vous devez :
1. Copier le HTML.
2. Copier le CSS.
3. Les coller dans (ex:) CodePen.
4. Voir le résultat.
5. Revenir et dire "Non, fais-le en rouge". (Et recommencer).
La Solution (Avec Artifacts)
Vous demandez : "Fais-moi un bouton CSS".
1. Claude écrit le code dans le chat...
2. ...ET génère un "Artifact" (un "plugin" de rendu) dans la fenêtre à droite, qui *affiche* le bouton (rendu HTML/CSS/JS).
3. Vous pouvez *modifier* le code dans l'Artifact, et le rendu se met à jour (live-reload).
Cas d'usage :
- Rendu HTML/CSS/JS (front-end).
- Rendu de graphiques (ex: SVG pour un logo).
- Rendu de Mermaid.js (diagrammes).
C'est le "plugin" (addon) API le plus important. "Tool Use" (Appel de Fonctions) permet à Claude de *demander* à appeler vos fonctions (API) locales.
Le Flux (Diagramme)
(Utilisateur: "Quelle est la météo à Paris ?")
|
▼
[ Claude (API) ] -> (Analyse: "J'ai besoin de la météo. J'ai un 'outil' pour ça.")
|
▼
(Réponse API: "TOOL_USE: 'get_meteo(location: \"Paris\")'")
|
▼
[ Votre Code (Python) ] -> (Détecte 'TOOL_USE'. Exécute *votre* fonction get_meteo("Paris"))
|
▼
(Votre Code: "Résultat: 15°C, Pluie")
|
▼
[ Claude (API) ] -> (Re-appelé avec le résultat)
|
▼
(Réponse Finale: "La météo à Paris est de 15°C avec de la pluie.")
Exemple (Python API)
# 1. Définir les "outils" (plugins)
tools = [
{
"name": "get_meteo",
"description": "Obtenir la météo pour une ville.",
"input_schema": {
"type": "object",
"properties": {
"location": {"type": "string", "description": "La ville."}
},
"required": ["location"]
}
}
]
# 2. Premier appel (l'IA demande l'outil)
message = client.messages.create(
model="claude-3-5-sonnet-20240620",
messages=[{"role": "user", "content": "Météo à Paris ?"}],
tools=tools,
tool_choice={"type": "auto"}
)
# message.stop_reason == "tool_use"
# tool_call = message.content[-1] # (Contient 'get_meteo(location="Paris")')
# 3. (Votre code exécute l'outil...)
tool_result = '{"temperature": 15, "temps": "Pluie"}'
# 4. Deuxième appel (donner le résultat à l'IA)
message_final = client.messages.create(
model="claude-3-5-sonnet-20240620",
messages=[
{"role": "user", "content": "Météo à Paris ?"},
message.content, # (La réponse 'tool_use' de Claude)
{ # (La réponse "plugin" de l'outil)
"role": "user",
"content": [
{
"type": "tool_result",
"tool_use_id": tool_call.id,
"content": tool_result
}
]
}
],
tools=tools
)
# print(message_final.content[0].text)
Grâce à sa *grande fenêtre de contexte* (200K) et à sa *sécurité* (CAI), Claude excelle dans des projets (plugins) différents de GPT.
| Cas d'Usage | Pourquoi Claude ? | Exemple de Projet |
|---|---|---|
| Analyse Légale & Contrats | Fenêtre 200K. | "Upload ce contrat de 80 pages (PDF) et liste-moi toutes les clauses de non-concurrence." |
| Analyse Médicale / Recherche | Fenêtre 200K + Précision. | "Lis ces 10 papiers de recherche (PDFs) et fais une synthèse des méthodes." |
| Agent de Service Client (Chatbot) | Sécurité (CAI) + API (Tool Use). | Un "plugin" chatbot qui répond aux clients, mais qui *refusera* (Harmless) de se laisser manipuler (Prompt Injection). |
| Analyse de Codebase (RAG) | Fenêtre 200K. | "Upload l'intégralité de mon codebase (50 fichiers) et explique-moi comment la fonction 'X' fonctionne." |
| Génération de Contenu (Marketing) | "Personnalité" verbeuse. | "Écris-moi un article de blog de 1000 mots sur le 'Zen of Python'." |
L'API de Claude n'est pas seulement accessible via anthropic. Elle est intégrée (comme "plugin") dans tous les grands écosystèmes MLOps et Cloud.
1. Plateformes Cloud (Les "Addons" d'accès)
| Plateforme | Description |
|---|---|
| Amazon Bedrock | Le service "LLM-as-a-Service" d'AWS. Claude est un modèle "First-Party" (privilégié) sur Bedrock. |
| Google Cloud (Vertex AI) | Anthropic est un partenaire majeur de Google. Claude est disponible (comme "plugin") dans le "Model Garden" de Vertex AI. |
2. Outils de "Prompt Engineering" (Les "Addons" de dev)
| Outil | Description |
|---|---|
| LangChain / LlamaIndex | Les deux frameworks "plugins" n°1 pour le RAG (Retrieval-Augmented Generation). Ils ont des intégrations natives pour l'API Claude (ChatAnthropic). |
| Vercel (AI SDK) | Le "plugin" de Vercel pour le frontend (React/Next.js) a une intégration directe pour streamer les réponses de Claude. |
Plans & Tarification (API)
La tarification (Oct 2024) est basée sur les "tokens" (Input + Output). L'API de Claude 3.5 Sonnet est *très* compétitive.
| Modèle | Prix (Input) / 1M Tokens | Prix (Output) / 1M Tokens |
|---|---|---|
| Claude 3.5 Sonnet | $3.00 | $15.00 |
| Claude 3 Opus | $15.00 | $75.00 |
| Claude 3 Haiku | $0.25 | $1.25 |
| GPT-4o (OpenAI) | $5.00 | $15.00 |
Plans (Web UI - claude.ai)
- Free : Accès gratuit (limité en nombre de messages) à Claude 3.5 Sonnet.
- Pro : (~$20/mois). Accès prioritaire, 5x plus de messages, accès à Claude 3 Opus (l'ancien).
