Das Problem: Die Daten sind da, aber niemand nutzt sie #
Jedes Unternehmen hat wertvolle Daten in seinen Datenbanken: Bestellungen, Kunden, Produktion, Lager, Buchhaltung. Doch um nützliche Informationen zu extrahieren, braucht man jemanden, der SQL schreiben kann — und in den meisten europäischen KMU ist diese Person eine Seltenheit (wenn sie überhaupt existiert).
Der Daten-Engpass #
Der typische Ablauf in KMU:
- Der Vertriebsleiter hat eine Frage: „Welche Produkte hatten im Q1 eine negative Marge?"
- Er fragt die IT oder den Analysten, eine Abfrage zu schreiben
- Der Analyst hat andere Prioritäten — er antwortet nach 2–3 Tagen
- Die Antwort kommt, wirft aber neue Fragen auf
- Der Kreislauf beginnt von vorn
Ergebnis: Entscheidungen werden ohne Daten getroffen, oder mit Daten, die Wochen alt sind. Laut McKinsey haben datengetriebene Unternehmen eine 23 % höhere Wahrscheinlichkeit, Kunden zu gewinnen, und 19 % mehr Rentabilität. Aber datengetrieben zu sein erfordert, dass alle auf die Daten zugreifen können — nicht nur diejenigen, die SQL schreiben können.
Was ist Natural Language to SQL #
Natural Language to SQL (NL2SQL oder text-to-SQL) ist eine Technologie, die KI-Modelle nutzt, um Fragen in natürlicher Sprache in SQL-Abfragen umzuwandeln.
Wie es funktioniert #
- Der Nutzer stellt eine Frage in natürlicher Sprache: „Wie viele Bestellungen haben wir im Februar von Kunden aus dem Veneto erhalten?"
- Das KI-Modell analysiert die Frage und bildet sie auf das Datenbankschema ab (Tabellen, Spalten, Beziehungen)
- Es generiert eine äquivalente SQL-Abfrage:
SELECT COUNT(*) FROM ordini JOIN clienti ON ... WHERE data >= '2026-02-01' AND regione = 'Veneto' - Es führt die Abfrage aus auf der Datenbank und liefert die Ergebnisse in lesbarem Format (Tabelle, Diagramm, Text)
Der Vorgang dauert Sekunden. Der Nutzer sieht den SQL-Code nie (es sei denn, er möchte es).
Die Entwicklung der text-to-SQL-Modelle #
Die NL2SQL-Technologie gibt es seit Jahren, aber die neueste Modellgeneration hat die Leistung grundlegend verändert:
| Generation | Genauigkeit | Einschränkungen |
|---|---|---|
| Regelbasiert (2015–2019) | ~50 % | Nur einfache Abfragen, festes Schema |
| Transformer Fine-tuned (2020–2023) | ~70 % | Erfordert schemaspezifisches Training |
| General-Purpose LLM (GPT-4, 2023–2024) | ~80 % | Hohe Kosten, Daten in die Cloud gesendet |
| Optimiertes LLM + RAG (2025–2026) | 85–92 % | Erfordert dedizierte Infrastruktur |
Heutige Modelle bewältigen komplexe Joins, Subqueries, Aggregationen und Schemata mit Dutzenden von Tabellen — Fälle, die vor gerade zwei Jahren einen erfahrenen SQL-Analysten erforderten.
Das Datenschutz-Risiko: Warum die Cloud ein Problem ist #
Die meisten text-to-SQL-Lösungen auf dem Markt funktionieren so: Sie senden das Datenbankschema (Tabellennamen, Spalten, Beziehungen) und die Frage an einen Cloud-Server, das Modell generiert die Abfrage und sendet sie zurück.
Was in der Cloud landet #
- Datenbankschema: Die vollständige Struktur Ihrer Daten — Tabellennamen wie
gehaelter_mitarbeiter,produkt_margen,saeulige_kunden - Die Fragen: „Welche Mitarbeiter verdienen mehr als 50.000 Euro?" verrät sensible Informationen, auch ohne auf die eigentlichen Daten zuzugreifen
- Die Ergebnisse: Wenn der Dienst die Abfrage für Sie ausführt, fließen die tatsächlichen Daten über die Server des Anbieters
Gemäß DSGVO kann ein Datenbankschema personenbezogene Daten enthalten (Tabellen- und Spaltennamen, die Personen identifizieren). Und die Frage selbst kann vertrauliche Informationen über die Geschäftsstrategie preisgeben.
38,4 % der KI-Lösungen schützen Daten nicht #
Laut einer HTX-Studie implementieren 38,4 % der KI-Implementierungen im Unternehmensbereich keinen angemessenen Datenschutz. Bei text-to-SQL ist das Risiko verstärkt: Sie senden kein Dokument, Sie geben Zugang zur Struktur Ihrer Daten.
MANTA: Privates und sicheres text-to-SQL #
MANTA ist die text-to-SQL-Lösung von HTX. Sie läuft vollständig in Ihrer Infrastruktur — keine Daten, kein Schema, keine Abfrage verlässt jemals Ihren Perimeter.
Wie MANTA funktioniert #
- Verbinden Sie Ihre bestehenden Datenbanken — PostgreSQL, SQL Server, MariaDB, BigQuery, Snowflake und mehr. Einrichtung in 5 Minuten, ohne Migration
- Fragen Sie in natürlicher Sprache. MANTA generiert die SQL-Abfrage, validiert sie und führt sie aus
- Erhalten Sie Antworten mit Tabellen, Diagrammen und der zugrunde liegenden SQL-Abfrage — alles überprüfbar
Leistung: Vergleichbar mit ChatGPT-5 #
Dank maßgeschneiderter Modelle, gezieltem Fine-Tuning und integrierter Bewertung erreicht MANTA eine text-to-SQL-Leistung, die mit ChatGPT-5 und Gemini 2.5 Pro vergleichbar oder besser ist — selbst bei komplexen Schemata mit Dutzenden von Tabellen.
Der Unterschied: Ihre Daten verlassen nie Ihre Infrastruktur.
Integrierte Sicherheit #
Jede von MANTA generierte Abfrage wird:
- Syntaktisch validiert vor der Ausführung
- Bereinigt gegen SQL-Injection und destruktive Abfragen
- Überprüft mit einem Konfidenz-Score
- Protokolliert im Audit-Trail für Compliance
Vergleich mit Alternativen #
| Merkmal | ChatGPT + SQL | SaaS-Lösungen | MANTA |
|---|---|---|---|
| Wo die Daten liegen | US-Server | Cloud-Anbieter | Ihre Infrastruktur |
| Schema in die Cloud gesendet | Ja | Ja | Nein |
| Unterstützte Datenbanken | Generisch | Begrenzt | 8+ (PostgreSQL, SQL Server, BigQuery…) |
| Fine-Tuning auf Schema | Nein | Teilweise | Ja |
| SQL-Injection-Schutz | Nein | Variabel | Integriert |
| Konfidenz-Score | Nein | Selten | Ja |
| DSGVO-konform | Nein | Kommt darauf an | Ja, by design |
| Kosten | Pro Token | Pro Nutzer/Monat | Pro Infrastruktur |
Reale Anwendungsfälle #
ChemoMaker — Medikamentenherstellung #
MANTA ist in den ChemoMaker-Roboter für die Herstellung onkologischer Medikamente integriert, in Zusammenarbeit mit Biovalley Investments und Trieste Valley.
Apotheker können die Datenbank der Zubereitungen in natürlicher Sprache abfragen: „Welche Medikamente haben überdurchschnittliche Zubereitungszeiten?" — ohne SQL zu schreiben, ohne die IT einzubeziehen.
Business Intelligence für KMU #
Ein Fertigungsunternehmen mit 3 separaten Datenbanken (ERP, CRM, Lager) nutzte Excel für monatliche Berichte. Der Prozess erforderte 3 Tage Arbeit des Analysten.
Mit MANTA:
- Berichte in Echtzeit: Der Verantwortliche stellt die Frage und erhält die Antwort in Sekunden
- Datenbankübergreifend: MANTA fragt alle Datenbanken über eine einzige Oberfläche ab
- Autonomie: Das Vertriebsteam ist nicht mehr von der IT für Daten abhängig
- Zeitersparnis: Von 3 Tagen auf wenige Minuten pro Bericht
Wer sollte text-to-SQL nutzen #
NL2SQL ist nicht für jeden geeignet. Hier ist, wann es Sinn ergibt:
Ja, wenn:
- Sie relationale Datenbanken mit strukturierten Daten haben
- Mehrere Personen im Unternehmen Daten benötigen, aber kein SQL schreiben können
- Der Analyst ein Engpass ist
- Sie den Datenzugang demokratisieren möchten, ohne alle in SQL zu schulen
- Sie sensible Daten verarbeiten, die Sie nicht in die Cloud senden wollen
Nein, wenn:
- Ihre Daten in Excel-Tabellen liegen (ein klassisches BI-Tool ist besser geeignet)
- Sie eine einzige einfache Datenbank mit wenigen Tabellen haben
- Sie bereits ein dediziertes und nicht überlastetes Analysten-Team haben
So starten Sie #
Der Weg, um text-to-SQL in Ihr Unternehmen zu bringen:
- Assessment (1 Tag): Wir analysieren Ihre Datenbanken, Schemata und Anwendungsfälle
- Verbindung (1 Tag): Wir verbinden MANTA mit Ihren Datenbanken — ohne Migration
- Kalibrierung (1–2 Wochen): Fine-Tuning des Modells auf Ihr spezifisches Schema
- Rollout (1 Woche): Nutzerschulung und Produktiv-Deployment
Fordern Sie eine MANTA-Demo an →
Wir verbinden MANTA mit Ihren Datenbanken in 30 Minuten. Schreiben Sie uns.
Dieser Artikel wurde vom HTX-Team verfasst — Human Technology eXcellence. MANTA basiert auf Open-Source-Komponenten des Dataherald-Projekts v 1.0.3 (Apache License 2.0), mit proprietären Modifikationen und Entwicklungen.
Häufig gestellte Fragen #
Was ist Natural Language to SQL?
Natural Language to SQL (NL2SQL oder text-to-SQL) ist eine KI-Technologie, die Fragen in natuerlicher Sprache in SQL-Abfragen umwandelt. Statt Code zu schreiben, fragen Sie 'Welche Kunden haben im Q1 mehr als 10.000 Euro bestellt?' und das System generiert und fuehrt die Abfrage auf Ihrer Datenbank aus.
Ist NL2SQL sicher fuer Unternehmensdaten?
Das haengt von der Loesung ab. Cloud-Dienste senden Ihr Schema und Ihre Daten an die Server des Anbieters. MANTA von HTX laeuft on-premise: Keine Daten verlassen jemals Ihre Infrastruktur. Jede generierte Abfrage wird gegen SQL-Injection validiert und bereinigt.
Welche Datenbanken unterstuetzt MANTA?
MANTA unterstuetzt PostgreSQL, MySQL, SQL Server, MariaDB, BigQuery, Snowflake, Databricks, ClickHouse und AWS Athena. Eine einzige Oberflaeche fuer alle Ihre Datenbanken, ohne Codeaenderungen.
Wie genau ist text-to-SQL im Vergleich zu einem Analysten?
Modernste text-to-SQL-Modelle erreichen Genauigkeiten von ueber 85% auf Standard-Benchmarks. Dank gezieltem Fine-Tuning und integrierter Bewertung erreicht MANTA Leistungen, die mit ChatGPT-5 und Gemini 2.5 Pro bei komplexen Schemata vergleichbar oder besser sind.
Brauche ich ein technisches Team, um MANTA zu nutzen?
Nein. MANTA ist fuer nicht-technische Nutzer konzipiert. Die Ersteinrichtung dauert 5 Minuten, um eine Datenbank zu verbinden. Danach kann jeder Fragen in natuerlicher Sprache stellen und Antworten mit Tabellen und Diagrammen erhalten.