Le probleme : les donnees sont la, mais personne ne les utilise #
Chaque entreprise a des donnees precieuses dans ses bases de donnees : commandes, clients, production, stocks, comptabilite. Mais pour en extraire des informations utiles, il faut quelqu’un qui sache ecrire du SQL — et dans la plupart des PME, cette personne est la seule (quand elle existe).
Le goulot d’etranglement des donnees #
Le cycle typique dans les PME :
- Le responsable commercial a une question : “Quels produits ont une marge negative au T1 ?”
- Il demande au service IT ou a l’analyste d’ecrire une requete
- L’analyste a d’autres priorites — il repond apres 2-3 jours
- La reponse arrive, mais genere de nouvelles questions
- Le cycle recommence
Resultat : les decisions sont prises sans donnees, ou avec des donnees vieilles de plusieurs semaines. Selon McKinsey, les entreprises data-driven ont 23% de chances en plus d’acquerir des clients et 19% de rentabilite en plus. Mais etre data-driven exige que tous puissent acceder aux donnees — pas seulement ceux qui savent ecrire du SQL.
Qu’est-ce que le Natural Language to SQL #
Le Natural Language to SQL (NL2SQL ou text-to-SQL) est une technologie qui utilise des modeles IA pour convertir des questions en langage naturel en requetes SQL.
Comment ca fonctionne #
- L’utilisateur pose une question en langage naturel : “Combien de commandes avons-nous recues en fevrier des clients de la region Rhone-Alpes ?”
- Le modele IA analyse la question, la mappe sur le schema de la base de donnees (tables, colonnes, relations)
- Il genere une requete SQL equivalente :
SELECT COUNT(*) FROM ordini JOIN clienti ON ... WHERE data >= '2026-02-01' AND regione = 'Veneto' - Il execute la requete sur la base de donnees et retourne les resultats dans un format lisible (tableau, graphique, texte)
Le processus se deroule en quelques secondes. L’utilisateur ne voit jamais le code SQL (sauf s’il le souhaite).
L’evolution des modeles text-to-SQL #
La technologie NL2SQL existe depuis des annees, mais les modeles de derniere generation ont change la donne :
| Generation | Precision | Limites |
|---|---|---|
| Rule-based (2015-2019) | ~50% | Requetes simples uniquement, schema fixe |
| Transformer fine-tuned (2020-2023) | ~70% | Necessite un entrainement specifique par schema |
| LLM general-purpose (GPT-4, 2023-2024) | ~80% | Cout eleve, donnees envoyees au cloud |
| LLM optimises + RAG (2025-2026) | 85-92% | Necessite une infrastructure dediee |
Les modeles actuels gerent les jointures complexes, sous-requetes, agregations et schemas avec des dizaines de tables — des cas qui, il y a deux ans encore, necessitaient un analyste SQL experimente.
Le risque vie privee : pourquoi le cloud pose probleme #
La majorite des solutions text-to-SQL sur le marche fonctionnent ainsi : vous envoyez le schema de la base de donnees (noms de tables, colonnes, relations) et la question a un serveur cloud, le modele genere la requete, la renvoie.
Ce qui finit dans le cloud #
- Le schema de la base de donnees : la structure complete de vos donnees — noms de tables comme
salaires_employes,marges_produit,clients_impayes - Les questions : “Quels employes gagnent plus de 50 000 euros ?” revele des informations sensibles meme sans acceder aux donnees
- Les resultats : si le service execute la requete pour vous, les donnees effectives transitent par les serveurs du fournisseur
Pour le RGPD, le schema d’une base de donnees peut contenir des donnees personnelles (noms de tables et colonnes qui identifient des personnes). Et la question elle-meme peut reveler des informations confidentielles sur la strategie de l’entreprise.
38,4% des solutions IA ne protegent pas les donnees #
Selon une etude HTX, 38,4% des implementations IA en environnement entreprise n’implementent pas de protections adequates des donnees. En text-to-SQL, le risque est amplifie : vous n’envoyez pas un document, vous donnez acces a la structure de vos donnees.
MANTA : text-to-SQL prive et securise #
MANTA est la solution text-to-SQL de HTX. Elle fonctionne entierement dans votre infrastructure — aucune donnee, aucun schema, aucune requete ne sort de votre perimetre.
Comment fonctionne MANTA #
- Connectez vos bases de donnees existantes — PostgreSQL, SQL Server, MariaDB, BigQuery, Snowflake et autres. Configuration en 5 minutes, sans migration
- Demandez en langage naturel. MANTA genere la requete SQL, la valide et l’execute
- Obtenez des reponses avec tableaux, graphiques et la requete SQL sous-jacente — tout est verifiable
Performances : comparables a ChatGPT-5 #
Grace a des modeles personnalises, un fine-tuning cible et une evaluation integree, MANTA atteint des performances text-to-SQL comparables ou superieures a ChatGPT-5 et Gemini 2.5 Pro — meme sur des schemas complexes avec des dizaines de tables.
La difference : vos donnees ne quittent jamais votre infrastructure.
Securite integree #
Chaque requete generee par MANTA est :
- Validee syntaxiquement avant execution
- Assainie contre les injections SQL et les requetes destructives
- Verifiee avec un score de confiance
- Enregistree dans le journal d’audit pour la conformite
Comparaison avec les alternatives #
| Caracteristique | ChatGPT + SQL | Solutions SaaS | MANTA |
|---|---|---|---|
| Ou resident les donnees | Serveurs USA | Cloud provider | Votre infrastructure |
| Schema envoye au cloud | Oui | Oui | Non |
| Bases de donnees supportees | Generique | Limitees | 8+ (PostgreSQL, SQL Server, BigQuery…) |
| Fine-tuning sur schema | Non | Partiel | Oui |
| Protection injection SQL | Non | Variable | Integree |
| Score de confiance | Non | Rare | Oui |
| Conforme RGPD | Non | Depend | Oui, by design |
| Cout | Par token | Par utilisateur/mois | Par infrastructure |
Cas d’usage reels #
ChemoMaker — Preparation de medicaments #
MANTA est integre au robot ChemoMaker pour la preparation de medicaments oncologiques, en collaboration avec Biovalley Investments et Trieste Valley.
Les pharmaciens peuvent interroger la base de donnees de preparations en langage naturel : “Quels medicaments ont des temps de preparation superieurs a la moyenne ?” — sans ecrire de SQL, sans solliciter le service IT.
Business intelligence pour les PME #
Une entreprise manufacturiere avec 3 bases de donnees separees (ERP, CRM, stocks) utilisait Excel pour les rapports mensuels. Le processus necessitait 3 jours de travail de l’analyste.
Avec MANTA :
- Rapports en temps reel : le responsable pose la question et obtient la reponse en quelques secondes
- Cross-database : MANTA interroge toutes les bases de donnees avec une seule interface
- Autonomie : l’equipe commerciale ne depend plus du service IT pour les donnees
- Reduction des delais : de 3 jours a quelques minutes par rapport
Qui devrait utiliser le text-to-SQL #
Le NL2SQL n’est pas pour tout le monde. Voici quand il est pertinent :
Oui, si :
- Vous avez des bases de donnees relationnelles avec des donnees structurees
- Plusieurs personnes dans l’entreprise ont besoin de donnees mais ne savent pas ecrire de SQL
- L’analyste est un goulot d’etranglement
- Vous voulez democratiser l’acces aux donnees sans former tout le monde au SQL
- Vous traitez des donnees sensibles que vous ne voulez pas envoyer dans le cloud
Non, si :
- Vos donnees sont dans des feuilles Excel (mieux vaut un outil de BI traditionnel)
- Vous avez une seule base de donnees simple avec peu de tables
- Vous avez deja une equipe d’analystes dediee et non saturee
Comment demarrer #
Le parcours pour integrer le text-to-SQL dans votre entreprise :
- Assessment (1 jour) : nous analysons vos bases de donnees, le schema et les cas d’usage
- Connexion (1 jour) : nous connectons MANTA a vos bases de donnees — sans migration
- Calibration (1-2 semaines) : fine-tuning du modele sur votre schema specifique
- Deploiement (1 semaine) : formation des utilisateurs et mise en production
Nous connectons MANTA a vos bases de donnees en 30 minutes. Ecrivez-nous.
Cet article a ete redige par l’equipe de HTX — Human Technology eXcellence. MANTA est base sur des composants open source du projet Dataherald v 1.0.3 (Apache License 2.0), avec des modifications et developpements proprietaires.
Questions frequentes #
Qu'est-ce que le Natural Language to SQL ?
Le Natural Language to SQL (NL2SQL ou text-to-SQL) est une technologie IA qui convertit les questions en langage naturel en requetes SQL. Au lieu d'ecrire du code, vous demandez 'Quels clients ont commande plus de 10 000 euros au T1 ?' et le systeme genere et execute la requete sur votre base de donnees.
Le NL2SQL est-il securise pour les donnees d'entreprise ?
Cela depend de la solution. Les services cloud envoient le schema et les donnees aux serveurs du fournisseur. MANTA de HTX fonctionne on-premise : aucune donnee ne quitte votre infrastructure. Chaque requete generee est validee et assainie contre les injections SQL.
Quelles bases de donnees MANTA supporte-t-il ?
MANTA supporte PostgreSQL, MySQL, SQL Server, MariaDB, BigQuery, Snowflake, Databricks, ClickHouse et AWS Athena. Une seule interface pour toutes les bases de donnees, sans changer de code.
Quelle est la precision du text-to-SQL par rapport a un analyste ?
Les modeles text-to-SQL de derniere generation atteignent des precisions superieures a 85% sur les benchmarks standards. MANTA, grace au fine-tuning cible et a l'evaluation integree, atteint des performances comparables ou superieures a ChatGPT-5 et Gemini 2.5 Pro sur des schemas complexes.
Faut-il une equipe technique pour utiliser MANTA ?
Non. MANTA est concu pour les utilisateurs non techniques. La configuration initiale prend 5 minutes pour connecter une base de donnees. Ensuite, n'importe qui peut poser des questions en francais et obtenir des reponses avec tableaux et graphiques.