Un assistant conversationnel fine-tuné sur la base documentaire interne d'une entreprise — capable de répondre aux questions métier avec citations et sources vérifiables.
Le client comptait plus de 12 000 documents internes (procédures, fiches techniques, contrats) répartis sur SharePoint, Notion et un ancien intranet. Trouver la bonne réponse prenait en moyenne 18 minutes par requête, et 30% des nouveaux employés posaient les mêmes questions répétitivement durant leurs trois premiers mois. L'enjeu : un assistant capable de raisonner sur le corpus interne sans halluciner et en citant ses sources.
Architecture RAG (Retrieval-Augmented Generation) bâtie en Python avec LangChain. Les documents sont vectorisés via embeddings OpenAI et stockés dans une base vectorielle Pinecone. Le LLM est appelé avec un prompt système strict qui interdit toute réponse hors du contexte récupéré et impose la citation des sources. Un pipeline d'indexation automatique détecte les nouveaux documents et les ré-embed sans intervention manuelle. Déploiement on-premise pour garantir la confidentialité du corpus.
Parlons de votre cas. Première rencontre sans engagement.