Assistant IA Interne — Support Technique
Assistant IA interne pour support technique – RAG multi-langue (Django / LLM / AWS)
DeepMind Analytics Group — USA — IA / Machine Learning / RAG / LLM
Mission / objectif : Mettre en place un assistant IA interne, basé sur un moteur RAG, pour répondre aux questions des équipes support à partir de la documentation produit, des tickets JIRA et des bases de connaissances techniques.
Aurora Vision Labs développe des solutions de vision industrielle pour de grands comptes (automobile, agroalimentaire, logistique). Le support technique devait traiter un volume croissant de tickets : configuration de caméras, tuning des modèles, intégration avec les systèmes clients.
La documentation existante était éparpillée : Confluence, PDF, anciens tickets JIRA, guides internes, e-mails. Les nouveaux arrivants perdaient énormément de temps à retrouver les bonnes informations. L’objectif était de centraliser cette connaissance dans une plateforme RAG multi-langue, accessible via une interface Django sécurisée.
- Méthode : Kanban avec flux continu (support produit)
- Weekly tech sync avec les équipes produit & support
- Roadmap itérative : POC → pilote interne → généralisation
- CI/CD GitLab pour tests / déploiements
- Environnements isolés (dev/stage/prod) sur AWS
- Suivi de la qualité via un tableau de bord dédié (feedback users + métriques RAG)
- Webapp Django (interface chat IA + recherche avancée)
- API REST pour intégration Slack / MS Teams
- Pipeline d’ingestion documentaire (Confluence, PDF, JIRA, Git)
- Base vectorielle (FAISS) hébergée côté backend
- Tableau de bord de monitoring (qualité, usage, latence)
- Documentation technique + guide d’onboarding pour le support
- Sources de données très hétérogènes (Confluence, JIRA, PDF, Git)
- Documents en français et en anglais (multi-langue obligatoire)
- Certaines informations obsolètes ou contradictoires
- Besoin de garder une trace et une justification des réponses IA
- Latence à maîtriser pour usage quotidien par le support (objectif < 2 secondes)
- Pipeline d’ingestion unifié en Python (connecteurs Confluence, JIRA, Git, filesystem)
- Normalisation et nettoyage des contenus (HTML → Markdown → chunks)
- Vectorisation via embeddings multilingues (SentenceTransformers)
- Index FAISS embarqué côté backend (mise à jour nightly + incrémentale)
- Combinaison RAG : retrieval top-k + reranking + prompt structuré
- Mode "citation" : chaque réponse IA inclut les sources utilisées (lien vers doc/ticket)
- Mécanisme de feedback (👍 / 👎) stocké en base pour affiner le pipeline
- Réduction du temps moyen de résolution de ticket simple : -38%
- 60–70% des questions fréquentes traitées directement par l’assistant IA
- Onboarding des nouveaux membres du support divisé par 2
- Amélioration de la cohérence des réponses grâce aux citations systématiques
- Adoption rapide : 80% des membres du support utilisent l’assistant quotidiennement
Type de projet : Architecture IA / RAG / LLM
Tags techniques :
AWS EC2 / RDS Django FAISS GitLab CI/CD IA Générative PostgreSQL Python RAG SentenceTransformers Slack / Teams
- Authentification SSO (SAML) connectée à l’IdP interne
- Gestion des permissions par rôles (support L1, L2, produit)
- Chiffrement TLS end-to-end (ALB + Nginx)
- Stockage secrets via AWS Systems Manager Parameter Store
- Logs d’accès et d’usage conservés 1 an pour audit interne
- Backend Django monolithique + services IA dédiés
- Orchestrateur RAG isolé dans un module Python partagé
- Workers Celery pour ingestion lourde
- Environnements séparés (dev/stage/prod) avec données synthétiques en dev
- Intégration ChatOps (Slack / Teams) via API REST
Publication : Visible sur le site public IDEO-Lab
