Il problema: la variabilità nella classificazione ASA-PS #
La classificazione ASA-PS è il gold standard per la valutazione preoperatoria del rischio anestesiologico. Ogni paziente che deve essere operato riceve un punteggio da ASA I (paziente sano) a ASA V (paziente moribondo), che guida le decisioni dell’anestesista su tipo di anestesia, monitoraggio e gestione postoperatoria.
Un sistema critico con un difetto noto #
Il problema è conosciuto da decenni: la variabilità inter-osservatore è alta. Studi pubblicati mostrano che gli anestesisti concordano sulla classificazione corretta solo nel 70% dei casi — 7 volte su 10.
Questo significa che lo stesso paziente, visitato da due anestesisti diversi, può ricevere classificazioni diverse. E la classificazione ASA-PS non è un esercizio accademico: determina il livello di monitoraggio, le precauzioni anestesiologiche e l’allocazione delle risorse.
Cosa succede quando la classificazione è sbagliata #
| Errore | Conseguenza |
|---|---|
| Sottostima del rischio (es. ASA II invece di ASA III) | Monitoraggio insufficiente, complicanze non previste |
| Sovrastima del rischio (es. ASA III invece di ASA II) | Risorse sprecate, interventi ritardati, ansia nel paziente |
| Variabilità tra ospedali | Confronti clinici inaffidabili, dati epidemiologici distorti |
Lo studio HTX: 11 modelli AI, 20 casi clinici #
HTX ha condotto uno studio sistematico per valutare se i modelli linguistici (LLM) possono migliorare la consistenza della classificazione ASA-PS.
Metodologia #
- 20 vignette cliniche standardizzate, selezionate dai benchmark ASA-PS più studiati nella letteratura scientifica
- 11 modelli linguistici testati, da modelli di prima generazione a modelli di ragionamento avanzati
- Test multilingue: ogni caso valutato sia in inglese che in italiano
- Trials ripetuti: ogni modello testato più volte per verificare la riproducibilità
I modelli testati #
| Categoria | Modelli | Accuratezza media |
|---|---|---|
| Prima generazione | GPT-4, LLaMA 2, LLaMA 3, Mistral | ~77% |
| Seconda generazione | GPT-4o, Claude 3.5 Sonnet | ~85% |
| Ragionamento avanzato | GPT-o3, Claude Sonnet (latest), DeepSeek R1 | 97,5% |
Risultati chiave #
I modelli di ragionamento avanzati raggiungono il 97,5% di accuratezza (95% CI: 92,9%-99,1%), superando significativamente:
- I modelli di prima generazione (~77%)
- Il benchmark umano (7,7/10 = 77%)
L’errore medio scende drasticamente:
- Medici: 2,3 misclassificazioni ogni 10 casi
- Modelli prima generazione: 2,3 misclassificazioni (simile ai medici)
- Modelli avanzati: 0,25 misclassificazioni ogni 10 casi
Questo rappresenta una riduzione dell'89% dell’errore rispetto alla classificazione manuale.
DeepSeek R1: privacy senza compromessi #
Un risultato particolarmente rilevante: DeepSeek R1, un modello open-source deployabile completamente on-premise, ha mostrato:
- Accuratezza al pari dei migliori modelli commerciali
- Perfetta riproducibilità su trials ripetuti (stesso caso, stesso risultato)
- Zero dipendenza da server cloud
Questo dimostra che il deploy privato — fondamentale in sanità — è fattibile senza sacrificare l’accuratezza.
Come funziona KOI #
KOI è il sistema di supporto decisionale per l’anestesiologia sviluppato da HTX. Trasforma i risultati della ricerca in uno strumento clinico utilizzabile.
Il flusso di lavoro #
Step 1 — Analisi della cartella clinica
KOI riceve i dati del paziente: anamnesi, esame fisico, esami diagnostici. Il modello AI analizza il quadro clinico completo usando un approccio chain-of-thought — lo stesso tipo di ragionamento strutturato che un anestesista esperto applica mentalmente.
Step 2 — Classificazione ASA-PS
Il modello produce:
- Una classificazione ASA-PS (da I a V)
- Un ragionamento clinico dettagliato che spiega perché ha scelto quella classe
- Un punteggio di confidenza che indica quanto il modello è sicuro della classificazione
- Le diagnosi chiave che hanno influenzato la decisione
Ogni classificazione è spiegabile e verificabile. Non è una black box.
Step 3 — Decisione del medico
L’anestesista:
- Legge la classificazione proposta e il ragionamento
- La confronta con il proprio giudizio clinico
- Decide se accettarla, modificarla o approfondire
KOI è un sistema human-in-the-loop: supporta la decisione del medico, non la sostituisce.
Architettura: i dati non escono mai dall’ospedale #
KOI gira su PRISMA, l’infrastruttura AI privata di HTX:
- On-premise: il modello gira dentro l’ospedale
- Crittografia end-to-end: i dati sono protetti in transito e a riposo
- Nessun dato verso l’esterno: nemmeno i metadati
- GDPR e AI Act compliant by design
In un settore dove il 38,4% degli studi su LLM non implementa adeguate protezioni dei dati, KOI è progettato per la privacy fin dalla fondazione.
Stato normativo e roadmap #
Research Use Only (RUO) #
KOI è attualmente classificato come Research Use Only — utilizzabile per:
- Ricerca clinica
- Validazione scientifica
- Studi osservazionali
- Formazione e training
Non è utilizzabile per la pratica diagnostica clinica.
Percorso verso il dispositivo medico #
HTX sta seguendo un percorso strutturato di certificazione:
| Milestone | Timeline |
|---|---|
| Studio di validazione (20 casi, 11 LLM) | Completato |
| Certificazione ISO 13485 (sistema qualità) | In corso |
| Certificazione IEC 62304 (software medicale) | In corso |
| Validazione clinica con Ospedale del Quadrante | Dic 2025 - Nov 2026 |
| Marcatura come dispositivo medico | Prevista 2027 |
Il progetto finanziato #
KOI nasce dal progetto “ASA-PS Classification”, finanziato dalla Regione Friuli Venezia Giulia (LR 22/2022, art. 7 — sostegno a progetti di validazione TRL 6-8, grant 90.000 euro). In collaborazione con l’Ospedale del Quadrante (Ramsay Santé), il progetto valida clinicamente il sistema AI per la classificazione ASA-PS nel periodo dicembre 2025 - novembre 2026.
Perché l’AI in anestesiologia è diversa #
L’AI in medicina è spesso associata a promesse eccessive. La classificazione ASA-PS è un caso diverso, per tre motivi:
1. Il problema è ben definito #
La classificazione ASA-PS ha criteri chiari, casi di studio pubblicati e benchmark consolidati. Non stiamo chiedendo all’AI di “diagnosticare il cancro” — le chiediamo di classificare un paziente su una scala standardizzata, usando informazioni strutturate.
2. L’errore umano è documentato e frequente #
La variabilità inter-osservatore del 30% non è contestata: è un dato pubblicato e replicato. L’AI non deve essere perfetta — deve essere più consistente dei medici. E con il 97,5% di accuratezza, lo è.
3. Il modello human-in-the-loop mitiga il rischio #
KOI non decide: propone. Il medico ha sempre l’ultima parola. Il sistema aggiunge un secondo parere oggettivo — come avere un collega esperto sempre disponibile.
Per chi è KOI #
KOI è rilevante per:
- Ospedali che vogliono ridurre la variabilità nella valutazione preoperatoria
- Gruppi ospedalieri che cercano consistenza tra strutture diverse
- Ricercatori in anestesiologia che studiano il supporto decisionale AI
- Università che formano specializzandi in anestesia
Se sei interessato a una collaborazione di ricerca o a un pilota RUO, contattaci.
Questo articolo è stato scritto dal team di HTX — Human Technology eXcellence. KOI è attualmente Research Use Only (RUO). Le informazioni contenute in questo articolo hanno carattere divulgativo e non costituiscono consiglio medico.
Domande frequenti #
Cos'è la classificazione ASA-PS?
La classificazione ASA-PS (American Society of Anesthesiologists - Physical Status) è lo standard internazionale per valutare il rischio anestesiologico preoperatorio. Classifica i pazienti da ASA I (sano) a ASA VI (morte cerebrale), guidando le decisioni su tipo di anestesia e monitoraggio.
Quanto è accurata l'AI nella classificazione ASA-PS?
Nello studio HTX, i modelli di ragionamento avanzati (GPT-o3, Claude Sonnet, DeepSeek R1) hanno raggiunto il 97,5% di accuratezza su 20 casi clinici standardizzati. L'errore medio scende da 2,3 a 0,25 misclassificazioni ogni 10 casi rispetto ai medici.
KOI sostituisce l'anestesista?
No. KOI è un sistema di supporto decisionale human-in-the-loop. Propone una classificazione con ragionamento clinico dettagliato, ma la decisione finale resta sempre del medico. KOI supporta, non sostituisce.
KOI è un dispositivo medico?
Al momento KOI è classificato Research Use Only (RUO) — utilizzabile per ricerca e validazione clinica, non per la pratica diagnostica. HTX è in certificazione ISO 13485 e IEC 62304, con marcatura come dispositivo medico prevista per il 2027.
Posso usare KOI nel mio ospedale?
Sì, per attività di ricerca e validazione clinica (RUO). KOI gira su PRISMA, installabile on-premise. I dati clinici non lasciano mai la struttura ospedaliera. Il progetto è sviluppato con l'Ospedale del Quadrante (Ramsay Santé).