Il problema: i dati ci sono, ma nessuno li usa #
Ogni azienda ha dati preziosi nei suoi database: ordini, clienti, produzione, magazzino, contabilità. Ma per estrarre informazioni utili serve qualcuno che sappia scrivere SQL — e nella maggior parte delle PMI italiane, quella persona è una sola (quando c’è).
Il collo di bottiglia dei dati #
Il ciclo tipico nelle PMI:
- Il responsabile commerciale ha una domanda: “Quali prodotti hanno margine negativo nel Q1?”
- Chiede all’IT o all’analista di scrivere una query
- L’analista ha altre priorità — risponde dopo 2-3 giorni
- La risposta arriva, ma genera nuove domande
- Il ciclo ricomincia
Risultato: le decisioni vengono prese senza dati, o con dati vecchi di settimane. Secondo McKinsey, le aziende data-driven hanno il 23% di probabilità in più di acquisire clienti e il 19% in più di redditività. Ma essere data-driven richiede che tutti possano accedere ai dati — non solo chi sa scrivere SQL.
Cos’è il Natural Language to SQL #
Il Natural Language to SQL (NL2SQL o text-to-SQL) è una tecnologia che usa modelli AI per convertire domande in linguaggio naturale in query SQL.
Come funziona #
- L’utente fa una domanda in linguaggio naturale: “Quanti ordini abbiamo ricevuto a febbraio dai clienti del Veneto?”
- Il modello AI analizza la domanda, la mappa sullo schema del database (tabelle, colonne, relazioni)
- Genera una query SQL equivalente:
SELECT COUNT(*) FROM ordini JOIN clienti ON ... WHERE data >= '2026-02-01' AND regione = 'Veneto' - Esegue la query sul database e restituisce i risultati in formato leggibile (tabella, grafico, testo)
Il processo avviene in secondi. L’utente non vede mai il codice SQL (a meno che non lo voglia).
L’evoluzione dei modelli text-to-SQL #
La tecnologia NL2SQL esiste da anni, ma i modelli di ultima generazione hanno cambiato le prestazioni:
| Generazione | Accuratezza | Limiti |
|---|---|---|
| Rule-based (2015-2019) | ~50% | Solo query semplici, schema fisso |
| Transformer fine-tuned (2020-2023) | ~70% | Richiede training specifico per schema |
| LLM general-purpose (GPT-4, 2023-2024) | ~80% | Costo elevato, dati inviati al cloud |
| LLM ottimizzati + RAG (2025-2026) | 85-92% | Richiede infrastruttura dedicata |
I modelli attuali gestiscono join complessi, subquery, aggregazioni, e schemi con decine di tabelle — casi che fino a due anni fa richiedevano un analista SQL esperto.
Il rischio privacy: perché il cloud è un problema #
La maggior parte delle soluzioni text-to-SQL sul mercato funziona così: invii lo schema del database (nomi tabelle, colonne, relazioni) e la domanda a un server cloud, il modello genera la query, la rimanda indietro.
Cosa finisce nel cloud #
- Schema del database: la struttura completa dei tuoi dati — nomi di tabelle come
stipendi_dipendenti,margini_prodotto,clienti_morosi - Le domande: “Quali dipendenti guadagnano più di 50.000 euro?” rivela informazioni sensibili anche senza accedere ai dati
- I risultati: se il servizio esegue la query per te, i dati effettivi transitano sui server del provider
Per il GDPR, lo schema di un database può contenere dati personali (nomi di tabelle e colonne che identificano persone). E la domanda stessa può rivelare informazioni riservate sulla strategia aziendale.
Il 38,4% delle soluzioni AI non protegge i dati #
Secondo uno studio HTX, il 38,4% delle implementazioni AI in ambito enterprise non implementa adeguate protezioni dei dati. Nel text-to-SQL il rischio è amplificato: non stai inviando un documento, stai dando accesso alla struttura dei tuoi dati.
MANTA: text-to-SQL privato e sicuro #
MANTA è la soluzione text-to-SQL di HTX. Funziona interamente nella tua infrastruttura — nessun dato, nessuno schema, nessuna query esce dal tuo perimetro.
Come funziona MANTA #
- Connetti i tuoi database esistenti — PostgreSQL, SQL Server, MariaDB, BigQuery, Snowflake e altri. Setup in 5 minuti, senza migrazione
- Chiedi in linguaggio naturale. MANTA genera la query SQL, la valida e la esegue
- Ottieni risposte con tabelle, grafici e la query SQL sottostante — tutto verificabile
Prestazioni: paragonabili a ChatGPT-5 #
Grazie a modelli personalizzati, fine-tuning mirato e valutazione integrata, MANTA raggiunge prestazioni text-to-SQL paragonabili o superiori a ChatGPT-5 e Gemini 2.5 Pro — anche su schemi complessi con decine di tabelle.
La differenza: i tuoi dati non escono mai dalla tua infrastruttura.
Sicurezza integrata #
Ogni query generata da MANTA viene:
- Validata sintatticamente prima dell’esecuzione
- Sanitizzata contro SQL injection e query distruttive
- Verificata con un punteggio di confidenza
- Registrata nell’audit trail per compliance
Confronto con le alternative #
| Caratteristica | ChatGPT + SQL | Soluzioni SaaS | MANTA |
|---|---|---|---|
| Dove risiedono i dati | Server USA | Cloud provider | Tua infrastruttura |
| Schema inviato al cloud | Sì | Sì | No |
| Database supportati | Generico | Limitati | 8+ (PostgreSQL, SQL Server, BigQuery…) |
| Fine-tuning su schema | No | Parziale | Sì |
| Protezione SQL injection | No | Variabile | Integrata |
| Punteggio di confidenza | No | Raro | Sì |
| GDPR compliant | No | Dipende | Sì, by design |
| Costo | Per token | Per utente/mese | Per infrastruttura |
Casi d’uso reali #
ChemoMaker — Preparazione farmaci #
MANTA è integrato con il robot ChemoMaker per la preparazione di farmaci oncologici, in collaborazione con Biovalley Investments e Trieste Valley.
I farmacisti possono interrogare il database di preparazioni in linguaggio naturale: “Quali farmaci hanno tempi di preparazione superiori alla media?” — senza scrivere SQL, senza coinvolgere l’IT.
Business intelligence per PMI #
Un’azienda manifatturiera con 3 database separati (ERP, CRM, magazzino) usava Excel per i report mensili. Il processo richiedeva 3 giorni di lavoro dell’analista.
Con MANTA:
- Report in tempo reale: il responsabile fa la domanda e ottiene la risposta in secondi
- Cross-database: MANTA interroga tutti i database con una singola interfaccia
- Autonomia: il team commerciale non dipende più dall’IT per i dati
- Riduzione tempi: da 3 giorni a pochi minuti per report
Chi dovrebbe usare il text-to-SQL #
Il NL2SQL non è per tutti. Ecco quando ha senso:
Sì, se:
- Hai database relazionali con dati strutturati
- Più persone in azienda hanno bisogno di dati ma non sanno scrivere SQL
- L’analista è un collo di bottiglia
- Vuoi democratizzare l’accesso ai dati senza formare tutti su SQL
- Tratti dati sensibili che non vuoi inviare al cloud
No, se:
- I tuoi dati sono in fogli Excel (meglio un tool di BI tradizionale)
- Hai un solo database semplice con poche tabelle
- Hai già un team di analisti dedicato e non saturato
Come iniziare #
Il percorso per portare il text-to-SQL nella tua azienda:
- Assessment (1 giorno): analizziamo i tuoi database, lo schema e i casi d’uso
- Connessione (1 giorno): colleghiamo MANTA ai tuoi database — senza migrazione
- Calibrazione (1-2 settimane): fine-tuning del modello sul tuo schema specifico
- Rollout (1 settimana): formazione utenti e deploy in produzione
Colleghiamo MANTA ai tuoi database in 30 minuti. Scrivici.
Questo articolo è stato scritto dal team di HTX — Human Technology eXcellence. MANTA è basato su componenti open source del progetto Dataherald v 1.0.3 (Apache License 2.0), con modifiche e sviluppi proprietari.
Domande frequenti #
Cos'è il Natural Language to SQL?
Il Natural Language to SQL (NL2SQL o text-to-SQL) è una tecnologia AI che converte domande in linguaggio naturale in query SQL. Invece di scrivere codice, chiedi 'Quali clienti hanno ordinato più di 10.000 euro nel Q1?' e il sistema genera ed esegue la query sul tuo database.
NL2SQL è sicuro per i dati aziendali?
Dipende dalla soluzione. I servizi cloud inviano lo schema e i dati ai server del provider. MANTA di HTX funziona on-premise: nessun dato esce dalla tua infrastruttura. Ogni query generata viene validata e sanitizzata contro SQL injection.
Quali database supporta MANTA?
MANTA supporta PostgreSQL, MySQL, SQL Server, MariaDB, BigQuery, Snowflake, Databricks, ClickHouse e AWS Athena. Una sola interfaccia per tutti i database, senza cambiare codice.
Quanto è accurato il text-to-SQL rispetto a un analista?
I modelli text-to-SQL di ultima generazione raggiungono accuratezze superiori all'85% su benchmark standard. MANTA, grazie a fine-tuning mirato e valutazione integrata, raggiunge prestazioni paragonabili o superiori a ChatGPT-5 e Gemini 2.5 Pro su schemi complessi.
Serve un team tecnico per usare MANTA?
No. MANTA è progettato per utenti non tecnici. Il setup iniziale richiede 5 minuti per connettere un database. Dopo, chiunque può fare domande in italiano e ottenere risposte con tabelle e grafici.