Project Oxygen & Ideo-LabIDEO LAB Dashboard 2026
← Retour au PortFolio IA / Machine Learning / RAG / LLM • IA / ML / RAG Engineer

Assistant IA Interne — Support Technique

DeepMind Analytics Group — USA
Difficulté : Avancée

Assistant IA interne pour support technique – RAG multi-langue (Django / LLM / AWS)

DeepMind Analytics Group — USA — IA / Machine Learning / RAG / LLM

Période : 01/09/2022 → 31/05/2023 Rôle : IA Engineer / RAG Architect — responsable de : - Conception du pipeline RAG (ingestion → indexing → retrieval → génération) - Développement backend Django + API REST - Intégration LLM (OpenAI + modèle open source de fallback) - Mise en place de la base vectorielle et des pipelines d’ingestion - Monitoring qualité des réponses et amélioration continue - Formation des équipes support à l’usage de l’outil Métier : IA / ML / RAG Engineer Type : Architecture IA / RAG / LLM Confidentialité : Semi-public (détails partiels)
Contexte du projet

Mission / objectif : Mettre en place un assistant IA interne, basé sur un moteur RAG, pour répondre aux questions des équipes support à partir de la documentation produit, des tickets JIRA et des bases de connaissances techniques.

Aurora Vision Labs développe des solutions de vision industrielle pour de grands comptes (automobile, agroalimentaire, logistique). Le support technique devait traiter un volume croissant de tickets : configuration de caméras, tuning des modèles, intégration avec les systèmes clients.

La documentation existante était éparpillée : Confluence, PDF, anciens tickets JIRA, guides internes, e-mails. Les nouveaux arrivants perdaient énormément de temps à retrouver les bonnes informations. L’objectif était de centraliser cette connaissance dans une plateforme RAG multi-langue, accessible via une interface Django sécurisée.

Méthodologie & organisation :

- Méthode : Kanban avec flux continu (support produit)
- Weekly tech sync avec les équipes produit & support
- Roadmap itérative : POC → pilote interne → généralisation
- CI/CD GitLab pour tests / déploiements
- Environnements isolés (dev/stage/prod) sur AWS
- Suivi de la qualité via un tableau de bord dédié (feedback users + métriques RAG)

Livrables principaux :

- Webapp Django (interface chat IA + recherche avancée)
- API REST pour intégration Slack / MS Teams
- Pipeline d’ingestion documentaire (Confluence, PDF, JIRA, Git)
- Base vectorielle (FAISS) hébergée côté backend
- Tableau de bord de monitoring (qualité, usage, latence)
- Documentation technique + guide d’onboarding pour le support

Difficultés & enjeux

- Sources de données très hétérogènes (Confluence, JIRA, PDF, Git)
- Documents en français et en anglais (multi-langue obligatoire)
- Certaines informations obsolètes ou contradictoires
- Besoin de garder une trace et une justification des réponses IA
- Latence à maîtriser pour usage quotidien par le support (objectif < 2 secondes)

Solutions & architecture

- Pipeline d’ingestion unifié en Python (connecteurs Confluence, JIRA, Git, filesystem)
- Normalisation et nettoyage des contenus (HTML → Markdown → chunks)
- Vectorisation via embeddings multilingues (SentenceTransformers)
- Index FAISS embarqué côté backend (mise à jour nightly + incrémentale)
- Combinaison RAG : retrieval top-k + reranking + prompt structuré
- Mode "citation" : chaque réponse IA inclut les sources utilisées (lien vers doc/ticket)
- Mécanisme de feedback (👍 / 👎) stocké en base pour affiner le pipeline

Résultats & impact

- Réduction du temps moyen de résolution de ticket simple : -38%
- 60–70% des questions fréquentes traitées directement par l’assistant IA
- Onboarding des nouveaux membres du support divisé par 2
- Amélioration de la cohérence des réponses grâce aux citations systématiques
- Adoption rapide : 80% des membres du support utilisent l’assistant quotidiennement

Stack technique & outillage
Stack principale

Outillage, CI/CD, monitoring

Infos complémentaires

Type de projet : Architecture IA / RAG / LLM

Tags techniques :
AWS EC2 / RDS Django FAISS GitLab CI/CD IA Générative PostgreSQL Python RAG SentenceTransformers Slack / Teams

Sécurité & durcissement :

- Authentification SSO (SAML) connectée à l’IdP interne
- Gestion des permissions par rôles (support L1, L2, produit)
- Chiffrement TLS end-to-end (ALB + Nginx)
- Stockage secrets via AWS Systems Manager Parameter Store
- Logs d’accès et d’usage conservés 1 an pour audit interne

Notes d’architecture :

- Backend Django monolithique + services IA dédiés
- Orchestrateur RAG isolé dans un module Python partagé
- Workers Celery pour ingestion lourde
- Environnements séparés (dev/stage/prod) avec données synthétiques en dev
- Intégration ChatOps (Slack / Teams) via API REST

Publication : Visible sur le site public IDEO-Lab