En bref
Une entreprise du secteur de l’énergie était confrontée à des difficultés pour récupérer efficacement des informations pertinentes dans sa documentation Confluence et ses référentiels de code GitLab. AWS et Eviden l’ont aidée à résoudre le problème avec une solution d’IA générative.
Résultats
- Amélioration de l’efficacité et de la précision de la récupération d’informations dans les référentiels Confluence et GitLab
- Accélération de la recherche et augmentation de la productivité grâce à des techniques d’IA avancées pour améliorer la gestion des connaissances internes
Le client
Une entreprise européenne leader dans le secteur de l’énergie
Une entreprise du secteur de l’énergie éprouvait des difficultés à extraire des informations pertinentes de sa documentation Confluence et de ses référentiels de code GitLab. Les recherches prenaient du temps et les résultats étaient souvent inexacts. La situation drainait la productivité et la gestion des connaissances internes.
L’entreprise a travaillé avec Eviden et AWS pour améliorer l’efficacité et la précision de la recherche d’informations.
Ensemble, ils ont créé une solution d’IA générative avancée utilisant la génération augmentée de récupération (RAG).
Cette technique améliore les capacités des grands modèles de langage en incorporant des connaissances externes provenant des bases de connaissances internes d’une organisation sans avoir besoin de réentraîner les modèles. L’approche RAG est rentable et garantit que les résultats restent pertinents et précis.
Comment transformer la recherche documentaire
La solution repose sur plusieurs composants clés, chacun jouant un rôle essentiel dans la transformation du processus de recherche de documentation de l’entreprise.
Pourquoi Eviden
Eviden est un partenaire AWS Premier Tier Services et un vendeur AWS Marketplace. Eviden sert des clients partout dans le monde, et propose des solutions associant compétences humaines, enjeux économiques et technologie. Partenaire AWS depuis 11 ans, Eviden possède 14 compétences AWS, dont le conseil en migration, et est également membre des programmes AWS Managed Service Provider (MSP) et AWS Well-Architected Partner.
Pipeline CI/CD
Les équipes de projet ont mis en place un pipeline robuste d’amélioration continue/livraison continue en utilisant AWS Cloud Development Kit, GitLab, AWS CodeCommit, AWS CodeBuild et AWS Pipeline. Le processus commence par le transfert du code CDK sur GitLab, qui le reflète sur AWS CodeCommit. Une poussée vers CodeCommit déclenche le pipeline de déploiement, où CodeBuild compile le code, et AWS Pipeline gère le déploiement. Cela garantit une intégration et un déploiement sans faille.
Ingestion de données
Les données sont ingérées depuis Confluence et GitLab à l’aide de leurs API REST respectives. Les tâches Glue traitent et indexent les données. Ces données traitées sont ensuite stockées dans AWS S3, et des messages sont envoyés à SQS pour un traitement ultérieur, créant ainsi un référentiel de données structuré et accessible.
Stockage de données
AWS OpenSearch Serverless optimise les capacités de recherche. Les données ingérées sont stockées dans des bases de données vectorielles, avec deux index distincts créés pour GitLab et Confluence, garantissant des résultats de recherche efficaces et précis.
Application et interface web
Une interface Streamlit hébergée sur AWS ECS Fargate améliore l’interaction utilisateur. Les utilisateurs interagissent avec un chatbot via cette interface, avec une authentification gérée par AWS Cognito. AWS Application Load Balancer gère le trafic, garantissant une expérience utilisateur fluide et sécurisée.
Composants de la solution de génération augmentée par récupération
- AWS Glue ingère les données de Confluence et GitLab. Les tâches Glue traitent les données et les envoient à S3 et SQS.
- Amazon S3 stocke les données ingérées et facilite le contrôle de version et les opérations CRUD.
- AWS EventBridge lie les actions S3 avec SQS pour découpler l’ingestion et le traitement des événements.
- Amazon SQS gère la file d’attente des messages pour le traitement des données.
- Amazon DynamoDB gère l’état d’indexation des pages Confluence.
- AWS Lambda traite et indexe les données des files d’attente GitLab et Confluence.
- Amazon OpenSearch Serverless effectue des recherches vectorielles et sémantiques sur les données indexées.
- Amazon Bedrock fournit des LLM pour la génération et l’analyse de texte, y compris l’intégration de documents et les réponses de chatbot.
- AWS Fargate héberge le code de l’application dans un environnement sans serveur.
- AWS ALB gère la charge de trafic et s’intègre avec AWS Web Application Firewall pour la sécurité.
- AWS Cognito gère l’authentification et l’autorisation des utilisateurs.
- Streamlit fournit l’interface web pour l’interaction utilisateur.
L’équipe de projet a également utilisé des techniques avancées telles que le reranking et la summarization.
Le Reranking améliore la pertinence des résultats de recherche en utilisant la méthode FlashrankRerank et le modèle de cross-encodeur ms-marco-MiniLM-L-12-v2, intégré via LangChain. Cela garantit que les utilisateurs reçoivent les informations les plus pertinentes en réponse à leurs requêtes.
La technique de summarization utilise le modèle anthropic.claude-v2:1 pour générer des résumés de documents qui conservent le contexte. Cette technique garantit une récupération d’informations efficace et précise, facilitant la compréhension rapide des détails essentiels par les utilisateurs.
La mise en œuvre de cette solution d’IA générative a considérablement amélioré l’efficacité et la précision de la récupération d’informations dans les référentiels Confluence et GitLab de la société d’énergie. Le projet a démontré le potentiel de l’utilisation de l’IA avancée pour améliorer la gestion des connaissances internes, accélérer la recherche et augmenter la productivité globale.