El problema: los datos estan, pero nadie los usa #
Cada empresa tiene datos valiosos en sus bases de datos: pedidos, clientes, produccion, almacen, contabilidad. Pero para extraer informacion util se necesita alguien que sepa escribir SQL — y en la mayoria de las pymes, esa persona es una sola (cuando existe).
El cuello de botella de los datos #
El ciclo tipico en las pymes:
- El responsable comercial tiene una pregunta: “Que productos tienen margen negativo en el T1?”
- Pide al departamento de IT o al analista que escriba una consulta
- El analista tiene otras prioridades — responde despues de 2-3 dias
- La respuesta llega, pero genera nuevas preguntas
- El ciclo vuelve a empezar
Resultado: las decisiones se toman sin datos, o con datos de hace semanas. Segun McKinsey, las empresas data-driven tienen un 23% mas de probabilidad de captar clientes y un 19% mas de rentabilidad. Pero ser data-driven requiere que todos puedan acceder a los datos — no solo quienes saben escribir SQL.
Que es el Natural Language to SQL #
El Natural Language to SQL (NL2SQL o text-to-SQL) es una tecnologia que usa modelos de IA para convertir preguntas en lenguaje natural en consultas SQL.
Como funciona #
- El usuario hace una pregunta en lenguaje natural: “Cuantos pedidos hemos recibido en febrero de los clientes del Veneto?”
- El modelo IA analiza la pregunta, la mapea sobre el esquema de la base de datos (tablas, columnas, relaciones)
- Genera una consulta SQL equivalente:
SELECT COUNT(*) FROM ordini JOIN clienti ON ... WHERE data >= '2026-02-01' AND regione = 'Veneto' - Ejecuta la consulta sobre la base de datos y devuelve los resultados en formato legible (tabla, grafico, texto)
El proceso ocurre en segundos. El usuario nunca ve el codigo SQL (a menos que lo desee).
La evolucion de los modelos text-to-SQL #
La tecnologia NL2SQL existe desde hace anos, pero los modelos de ultima generacion han cambiado el rendimiento:
| Generacion | Precision | Limites |
|---|---|---|
| Rule-based (2015-2019) | ~50% | Solo consultas simples, esquema fijo |
| Transformer fine-tuned (2020-2023) | ~70% | Requiere entrenamiento especifico por esquema |
| LLM general-purpose (GPT-4, 2023-2024) | ~80% | Coste elevado, datos enviados al cloud |
| LLM optimizados + RAG (2025-2026) | 85-92% | Requiere infraestructura dedicada |
Los modelos actuales gestionan joins complejos, subconsultas, agregaciones y esquemas con decenas de tablas — casos que hace dos anos requerian un analista SQL experto.
El riesgo de privacidad: por que el cloud es un problema #
La mayoria de las soluciones text-to-SQL del mercado funcionan asi: envias el esquema de la base de datos (nombres de tablas, columnas, relaciones) y la pregunta a un servidor cloud, el modelo genera la consulta, la devuelve.
Que acaba en el cloud #
- El esquema de la base de datos: la estructura completa de tus datos — nombres de tablas como
salarios_empleados,margenes_producto,clientes_morosos - Las preguntas: “Que empleados ganan mas de 50.000 euros?” revela informacion sensible incluso sin acceder a los datos
- Los resultados: si el servicio ejecuta la consulta por ti, los datos efectivos transitan por los servidores del proveedor
Para el RGPD, el esquema de una base de datos puede contener datos personales (nombres de tablas y columnas que identifican personas). Y la pregunta en si puede revelar informacion confidencial sobre la estrategia empresarial.
El 38,4% de las soluciones IA no protege los datos #
Segun un estudio de HTX, el 38,4% de las implementaciones de IA en entorno empresarial no implementa protecciones adecuadas de los datos. En text-to-SQL el riesgo se amplifica: no estas enviando un documento, estas dando acceso a la estructura de tus datos.
MANTA: text-to-SQL privado y seguro #
MANTA es la solucion text-to-SQL de HTX. Funciona completamente en tu infraestructura — ningun dato, ningun esquema, ninguna consulta sale de tu perimetro.
Como funciona MANTA #
- Conecta tus bases de datos existentes — PostgreSQL, SQL Server, MariaDB, BigQuery, Snowflake y otros. Configuracion en 5 minutos, sin migracion
- Pregunta en lenguaje natural. MANTA genera la consulta SQL, la valida y la ejecuta
- Obtiene respuestas con tablas, graficos y la consulta SQL subyacente — todo verificable
Rendimiento: comparable a ChatGPT-5 #
Gracias a modelos personalizados, fine-tuning dirigido y evaluacion integrada, MANTA alcanza un rendimiento text-to-SQL comparable o superior a ChatGPT-5 y Gemini 2.5 Pro — incluso en esquemas complejos con decenas de tablas.
La diferencia: tus datos nunca salen de tu infraestructura.
Seguridad integrada #
Cada consulta generada por MANTA es:
- Validada sintacticamente antes de la ejecucion
- Saneada contra inyecciones SQL y consultas destructivas
- Verificada con una puntuacion de confianza
- Registrada en el registro de auditoria para cumplimiento normativo
Comparacion con las alternativas #
| Caracteristica | ChatGPT + SQL | Soluciones SaaS | MANTA |
|---|---|---|---|
| Donde residen los datos | Servidores USA | Cloud provider | Tu infraestructura |
| Esquema enviado al cloud | Si | Si | No |
| Bases de datos soportadas | Generico | Limitadas | 8+ (PostgreSQL, SQL Server, BigQuery…) |
| Fine-tuning sobre esquema | No | Parcial | Si |
| Proteccion inyeccion SQL | No | Variable | Integrada |
| Puntuacion de confianza | No | Raro | Si |
| Conforme RGPD | No | Depende | Si, by design |
| Coste | Por token | Por usuario/mes | Por infraestructura |
Casos de uso reales #
ChemoMaker — Preparacion de farmacos #
MANTA esta integrado con el robot ChemoMaker para la preparacion de farmacos oncologicos, en colaboracion con Biovalley Investments y Trieste Valley.
Los farmaceuticos pueden interrogar la base de datos de preparaciones en lenguaje natural: “Que farmacos tienen tiempos de preparacion superiores a la media?” — sin escribir SQL, sin involucrar al departamento de IT.
Business intelligence para pymes #
Una empresa manufacturera con 3 bases de datos separadas (ERP, CRM, almacen) usaba Excel para los informes mensuales. El proceso requeria 3 dias de trabajo del analista.
Con MANTA:
- Informes en tiempo real: el responsable hace la pregunta y obtiene la respuesta en segundos
- Cross-database: MANTA interroga todas las bases de datos con una sola interfaz
- Autonomia: el equipo comercial ya no depende del departamento de IT para los datos
- Reduccion de tiempos: de 3 dias a pocos minutos por informe
Quien deberia usar el text-to-SQL #
El NL2SQL no es para todos. He aqui cuando tiene sentido:
Si, si:
- Tienes bases de datos relacionales con datos estructurados
- Varias personas en la empresa necesitan datos pero no saben escribir SQL
- El analista es un cuello de botella
- Quieres democratizar el acceso a los datos sin formar a todos en SQL
- Tratas datos sensibles que no quieres enviar al cloud
No, si:
- Tus datos estan en hojas Excel (mejor una herramienta de BI tradicional)
- Tienes una sola base de datos simple con pocas tablas
- Ya tienes un equipo de analistas dedicado y no saturado
Como empezar #
El recorrido para llevar el text-to-SQL a tu empresa:
- Assessment (1 dia): analizamos tus bases de datos, el esquema y los casos de uso
- Conexion (1 dia): conectamos MANTA a tus bases de datos — sin migracion
- Calibracion (1-2 semanas): fine-tuning del modelo sobre tu esquema especifico
- Despliegue (1 semana): formacion de usuarios y puesta en produccion
Conectamos MANTA a tus bases de datos en 30 minutos. Escribenos.
Este articulo ha sido redactado por el equipo de HTX — Human Technology eXcellence. MANTA esta basado en componentes open source del proyecto Dataherald v 1.0.3 (Apache License 2.0), con modificaciones y desarrollos propietarios.
Preguntas frecuentes #
Que es el Natural Language to SQL?
El Natural Language to SQL (NL2SQL o text-to-SQL) es una tecnologia IA que convierte preguntas en lenguaje natural en consultas SQL. En lugar de escribir codigo, preguntas 'Que clientes han pedido mas de 10.000 euros en el T1?' y el sistema genera y ejecuta la consulta sobre tu base de datos.
Es seguro el NL2SQL para los datos empresariales?
Depende de la solucion. Los servicios cloud envian el esquema y los datos a los servidores del proveedor. MANTA de HTX funciona on-premise: ningun dato sale de tu infraestructura. Cada consulta generada se valida y sanea contra inyecciones SQL.
Que bases de datos soporta MANTA?
MANTA soporta PostgreSQL, MySQL, SQL Server, MariaDB, BigQuery, Snowflake, Databricks, ClickHouse y AWS Athena. Una sola interfaz para todas las bases de datos, sin cambiar de codigo.
Que precision tiene el text-to-SQL respecto a un analista?
Los modelos text-to-SQL de ultima generacion alcanzan precisiones superiores al 85% en benchmarks estandar. MANTA, gracias al fine-tuning dirigido y la evaluacion integrada, alcanza rendimientos comparables o superiores a ChatGPT-5 y Gemini 2.5 Pro en esquemas complejos.
Se necesita un equipo tecnico para usar MANTA?
No. MANTA esta disenado para usuarios no tecnicos. La configuracion inicial requiere 5 minutos para conectar una base de datos. Despues, cualquier persona puede hacer preguntas en espanol y obtener respuestas con tablas y graficos.