Ce projet permet de transformer du texte en requêtes SQL, de les exécuter et d'afficher les résultats dans un tableau. Il offre également la possibilité de télécharger les résultats au format CSV ainsi que d'afficher des graphes. On pourrait le comparer à un agent data analyst disponible à tout moment.
L'image qui sera jointe au site représente le modèle exécuté localement et entraîné sur mon laptop. Avec un langage plus large et un serveur plus performant, les résultats deviennent alors encore plus précis. Pour réaliser cela, j'ai utilisé Vanna AI et Mistra.
Dans un premier temps, je fine-tune le modèle sur la base de données de l'entreprise CERIU.
Pour ce faire, il suffit d'utiliser des requêtes SQL qui importent toutes les colonnes des tableaux et des vues.
Les descriptions des colonnes ou des tableaux et vues pendant le développement aident énormément.
Par exemple, si un tableau est nommé entr
avec la description « ce tableau rassemble les noms des entreprises et leurs données »,
cela permettra de répondre aux questions des entreprises sans avoir la nécessité de lui préciser de quel tableau et colonnes tirer les données.
Mistra et Vanna AI sont des outils avancés qui permettent d'automatiser et d'optimiser la génération de requêtes SQL à partir de texte naturel. - Mistra est une plateforme d'intelligence artificielle conçue pour faciliter la manipulation et l'analyse de données, en offrant des solutions adaptées pour entraîner et déployer des modèles de langage. - Vanna AI est un framework spécialisé dans la génération de langage naturel et la compréhension contextuelle, ce qui aide à transformer des descriptions textuelles en actions concrètes, telles que l'écriture de requêtes SQL.
Cette solution est particulièrement avantageuse pour quelqu'un qui n'est pas très à l'aise avec SQL ou avec des outils comme pgAdmin. Au lieu d'écrire manuellement des requêtes, l'utilisateur peut simplement poser des questions en langage naturel et obtenir des réponses précises. Cela rend la gestion et l'analyse des bases de données accessibles, rapides et efficaces, sans nécessiter une maîtrise approfondie du SQL.