Natural Language to SQL : interroger les bases de donnees d'entreprise sans ecrire de code

Q: "Qu'est-ce que le Natural Language to SQL ?"

"Le Natural Language to SQL (NL2SQL ou text-to-SQL) est une technologie IA qui convertit les questions en langage naturel en requetes SQL. Au lieu d'ecrire du code, vous demandez 'Quels clients ont commande plus de 10 000 euros au T1 ?' et le systeme genere et execute la requete sur votre base de donnees."

Q: "Le NL2SQL est-il securise pour les donnees d'entreprise ?"

"Cela depend de la solution. Les services cloud envoient le schema et les donnees aux serveurs du fournisseur. MANTA de HTX fonctionne on-premise : aucune donnee ne quitte votre infrastructure. Chaque requete generee est validee et assainie contre les injections SQL."

Q: "Quelles bases de donnees MANTA supporte-t-il ?"

"MANTA supporte PostgreSQL, MySQL, SQL Server, MariaDB, BigQuery, Snowflake, Databricks, ClickHouse et AWS Athena. Une seule interface pour toutes les bases de donnees, sans changer de code."

Q: "Quelle est la precision du text-to-SQL par rapport a un analyste ?"

"Les modeles text-to-SQL de derniere generation atteignent des precisions superieures a 85% sur les benchmarks standards. MANTA, grace au fine-tuning cible et a l'evaluation integree, atteint des performances comparables ou superieures a ChatGPT-5 et Gemini 2.5 Pro sur des schemas complexes."

Q: "Faut-il une equipe technique pour utiliser MANTA ?"

"Non. MANTA est concu pour les utilisateurs non techniques. La configuration initiale prend 5 minutes pour connecter une base de donnees. Ensuite, n'importe qui peut poser des questions en francais et obtenir des reponses avec tableaux et graphiques."

AI Privata per le Imprese - Cet article fait partie d'une série.

Partie : Comment choisir une infrastructure IA privee pour votre entreprise

Partie : IA en anesthésie : comment KOI réduit les erreurs de classification ASA-PS de 89 %

Partie : Cet article

Partie : AI Act 2026 : guide pratique pour les PME europeennes

Partie : ORCA vs ChatGPT : pourquoi votre chatbot d'entreprise doit etre prive

Partie : Pourquoi votre entreprise a besoin d'IA privee (et pas de ChatGPT)

73% des employes ne savent pas ecrire de SQL. Pourtant, les donnees les plus importantes de votre entreprise sont dans les bases de donnees. Le Natural Language to SQL comble ce fossee : posez des questions en francais, obtenez des reponses de la base de donnees. Sans code, sans analystes, sans attente.

Le probleme : les donnees sont la, mais personne ne les utilise
#

Chaque entreprise a des donnees precieuses dans ses bases de donnees : commandes, clients, production, stocks, comptabilite. Mais pour en extraire des informations utiles, il faut quelqu’un qui sache ecrire du SQL — et dans la plupart des PME, cette personne est la seule (quand elle existe).

Le goulot d’etranglement des donnees
#

Le cycle typique dans les PME :

Le responsable commercial a une question : “Quels produits ont une marge negative au T1 ?”
Il demande au service IT ou a l’analyste d’ecrire une requete
L’analyste a d’autres priorites — il repond apres 2-3 jours
La reponse arrive, mais genere de nouvelles questions
Le cycle recommence

Resultat : les decisions sont prises sans donnees, ou avec des donnees vieilles de plusieurs semaines. Selon McKinsey, les entreprises data-driven ont 23% de chances en plus d’acquerir des clients et 19% de rentabilite en plus. Mais etre data-driven exige que tous puissent acceder aux donnees — pas seulement ceux qui savent ecrire du SQL.

Qu’est-ce que le Natural Language to SQL
#

Le Natural Language to SQL (NL2SQL ou text-to-SQL) est une technologie qui utilise des modeles IA pour convertir des questions en langage naturel en requetes SQL.

Comment ca fonctionne
#

L’utilisateur pose une question en langage naturel : “Combien de commandes avons-nous recues en fevrier des clients de la region Rhone-Alpes ?”
Le modele IA analyse la question, la mappe sur le schema de la base de donnees (tables, colonnes, relations)
Il genere une requete SQL equivalente : SELECT COUNT(*) FROM ordini JOIN clienti ON ... WHERE data >= '2026-02-01' AND regione = 'Veneto'
Il execute la requete sur la base de donnees et retourne les resultats dans un format lisible (tableau, graphique, texte)

Le processus se deroule en quelques secondes. L’utilisateur ne voit jamais le code SQL (sauf s’il le souhaite).

L’evolution des modeles text-to-SQL
#

La technologie NL2SQL existe depuis des annees, mais les modeles de derniere generation ont change la donne :

Generation	Precision	Limites
Rule-based (2015-2019)	~50%	Requetes simples uniquement, schema fixe
Transformer fine-tuned (2020-2023)	~70%	Necessite un entrainement specifique par schema
LLM general-purpose (GPT-4, 2023-2024)	~80%	Cout eleve, donnees envoyees au cloud
LLM optimises + RAG (2025-2026)	85-92%	Necessite une infrastructure dediee

Les modeles actuels gerent les jointures complexes, sous-requetes, agregations et schemas avec des dizaines de tables — des cas qui, il y a deux ans encore, necessitaient un analyste SQL experimente.

Le risque vie privee : pourquoi le cloud pose probleme
#

La majorite des solutions text-to-SQL sur le marche fonctionnent ainsi : vous envoyez le schema de la base de donnees (noms de tables, colonnes, relations) et la question a un serveur cloud, le modele genere la requete, la renvoie.

Ce qui finit dans le cloud
#

Le schema de la base de donnees : la structure complete de vos donnees — noms de tables comme salaires_employes, marges_produit, clients_impayes
Les questions : “Quels employes gagnent plus de 50 000 euros ?” revele des informations sensibles meme sans acceder aux donnees
Les resultats : si le service execute la requete pour vous, les donnees effectives transitent par les serveurs du fournisseur

Pour le RGPD, le schema d’une base de donnees peut contenir des donnees personnelles (noms de tables et colonnes qui identifient des personnes). Et la question elle-meme peut reveler des informations confidentielles sur la strategie de l’entreprise.

38,4% des solutions IA ne protegent pas les donnees
#

Selon une etude HTX, 38,4% des implementations IA en environnement entreprise n’implementent pas de protections adequates des donnees. En text-to-SQL, le risque est amplifie : vous n’envoyez pas un document, vous donnez acces a la structure de vos donnees.

MANTA : text-to-SQL prive et securise
#

MANTA est la solution text-to-SQL de HTX. Elle fonctionne entierement dans votre infrastructure — aucune donnee, aucun schema, aucune requete ne sort de votre perimetre.

Comment fonctionne MANTA
#

Connectez vos bases de donnees existantes — PostgreSQL, SQL Server, MariaDB, BigQuery, Snowflake et autres. Configuration en 5 minutes, sans migration
Demandez en langage naturel. MANTA genere la requete SQL, la valide et l’execute
Obtenez des reponses avec tableaux, graphiques et la requete SQL sous-jacente — tout est verifiable

Performances : comparables a ChatGPT-5
#

Grace a des modeles personnalises, un fine-tuning cible et une evaluation integree, MANTA atteint des performances text-to-SQL comparables ou superieures a ChatGPT-5 et Gemini 2.5 Pro — meme sur des schemas complexes avec des dizaines de tables.

La difference : vos donnees ne quittent jamais votre infrastructure.

Securite integree
#

Chaque requete generee par MANTA est :

Validee syntaxiquement avant execution
Assainie contre les injections SQL et les requetes destructives
Verifiee avec un score de confiance
Enregistree dans le journal d’audit pour la conformite

Comparaison avec les alternatives
#

Caracteristique	ChatGPT + SQL	Solutions SaaS	MANTA
Ou resident les donnees	Serveurs USA	Cloud provider	Votre infrastructure
Schema envoye au cloud	Oui	Oui	Non
Bases de donnees supportees	Generique	Limitees	8+ (PostgreSQL, SQL Server, BigQuery…)
Fine-tuning sur schema	Non	Partiel	Oui
Protection injection SQL	Non	Variable	Integree
Score de confiance	Non	Rare	Oui
Conforme RGPD	Non	Depend	Oui, by design
Cout	Par token	Par utilisateur/mois	Par infrastructure

Cas d’usage reels
#

ChemoMaker — Preparation de medicaments
#

MANTA est integre au robot ChemoMaker pour la preparation de medicaments oncologiques, en collaboration avec Biovalley Investments et Trieste Valley.

Les pharmaciens peuvent interroger la base de donnees de preparations en langage naturel : “Quels medicaments ont des temps de preparation superieurs a la moyenne ?” — sans ecrire de SQL, sans solliciter le service IT.

Business intelligence pour les PME
#

Une entreprise manufacturiere avec 3 bases de donnees separees (ERP, CRM, stocks) utilisait Excel pour les rapports mensuels. Le processus necessitait 3 jours de travail de l’analyste.

Avec MANTA :

Rapports en temps reel : le responsable pose la question et obtient la reponse en quelques secondes
Cross-database : MANTA interroge toutes les bases de donnees avec une seule interface
Autonomie : l’equipe commerciale ne depend plus du service IT pour les donnees
Reduction des delais : de 3 jours a quelques minutes par rapport

Qui devrait utiliser le text-to-SQL
#

Le NL2SQL n’est pas pour tout le monde. Voici quand il est pertinent :

Oui, si :

Vous avez des bases de donnees relationnelles avec des donnees structurees
Plusieurs personnes dans l’entreprise ont besoin de donnees mais ne savent pas ecrire de SQL
L’analyste est un goulot d’etranglement
Vous voulez democratiser l’acces aux donnees sans former tout le monde au SQL
Vous traitez des donnees sensibles que vous ne voulez pas envoyer dans le cloud

Non, si :

Vos donnees sont dans des feuilles Excel (mieux vaut un outil de BI traditionnel)
Vous avez une seule base de donnees simple avec peu de tables
Vous avez deja une equipe d’analystes dediee et non saturee

Comment demarrer
#

Le parcours pour integrer le text-to-SQL dans votre entreprise :

Assessment (1 jour) : nous analysons vos bases de donnees, le schema et les cas d’usage
Connexion (1 jour) : nous connectons MANTA a vos bases de donnees — sans migration
Calibration (1-2 semaines) : fine-tuning du modele sur votre schema specifique
Deploiement (1 semaine) : formation des utilisateurs et mise en production

Demandez une demo de MANTA →

Nous connectons MANTA a vos bases de donnees en 30 minutes. Ecrivez-nous.

Cet article a ete redige par l’equipe de HTX — Human Technology eXcellence. MANTA est base sur des composants open source du projet Dataherald v 1.0.3 (Apache License 2.0), avec des modifications et developpements proprietaires.

Questions frequentes
#

Qu'est-ce que le Natural Language to SQL ?

Le Natural Language to SQL (NL2SQL ou text-to-SQL) est une technologie IA qui convertit les questions en langage naturel en requetes SQL. Au lieu d'ecrire du code, vous demandez 'Quels clients ont commande plus de 10 000 euros au T1 ?' et le systeme genere et execute la requete sur votre base de donnees.

Le NL2SQL est-il securise pour les donnees d'entreprise ?

Cela depend de la solution. Les services cloud envoient le schema et les donnees aux serveurs du fournisseur. MANTA de HTX fonctionne on-premise : aucune donnee ne quitte votre infrastructure. Chaque requete generee est validee et assainie contre les injections SQL.

Quelles bases de donnees MANTA supporte-t-il ?

MANTA supporte PostgreSQL, MySQL, SQL Server, MariaDB, BigQuery, Snowflake, Databricks, ClickHouse et AWS Athena. Une seule interface pour toutes les bases de donnees, sans changer de code.

Quelle est la precision du text-to-SQL par rapport a un analyste ?

Les modeles text-to-SQL de derniere generation atteignent des precisions superieures a 85% sur les benchmarks standards. MANTA, grace au fine-tuning cible et a l'evaluation integree, atteint des performances comparables ou superieures a ChatGPT-5 et Gemini 2.5 Pro sur des schemas complexes.

Faut-il une equipe technique pour utiliser MANTA ?

Non. MANTA est concu pour les utilisateurs non techniques. La configuration initiale prend 5 minutes pour connecter une base de donnees. Ensuite, n'importe qui peut poser des questions en francais et obtenir des reponses avec tableaux et graphiques.

AI Privata per le Imprese - Cet article fait partie d'une série.

Partie : Comment choisir une infrastructure IA privee pour votre entreprise

Partie : IA en anesthésie : comment KOI réduit les erreurs de classification ASA-PS de 89 %

Partie : Cet article

Partie : AI Act 2026 : guide pratique pour les PME europeennes

Partie : ORCA vs ChatGPT : pourquoi votre chatbot d'entreprise doit etre prive

Partie : Pourquoi votre entreprise a besoin d'IA privee (et pas de ChatGPT)

Le probleme : les donnees sont la, mais personne ne les utilise #

Le goulot d’etranglement des donnees #

Qu’est-ce que le Natural Language to SQL #

Comment ca fonctionne #

L’evolution des modeles text-to-SQL #

Le risque vie privee : pourquoi le cloud pose probleme #

Ce qui finit dans le cloud #

38,4% des solutions IA ne protegent pas les donnees #

MANTA : text-to-SQL prive et securise #

Comment fonctionne MANTA #

Performances : comparables a ChatGPT-5 #

Securite integree #

Comparaison avec les alternatives #

Cas d’usage reels #

ChemoMaker — Preparation de medicaments #

Business intelligence pour les PME #

Qui devrait utiliser le text-to-SQL #

Comment demarrer #

Questions frequentes #