Intervista

Michele Milesi Senior Principal Consultant | Data & AI Architecture LUTECH

Quali sono le principali sfide che un’azienda deve affrontare nell’implementare la GenAI nel rispetto delle normative e dei regolamenti?

Un’azienda che intende investire in progetti in ambito di Intelligenza Artificiale (AI), e in particolar modo per l’Intelligenza Artificiale Generativa (GenAI), deve confrontarsi con normative e regolamenti – definiti a livello europeo, nazionale o settoriale – sempre più stringenti i quali tutelano clienti ed utenti relativamente all’utilizzo dei propri dati e nel modo in cui questi sono valutati per l’erogazione dei servizi. Sebbene questo rappresenti un passo cruciale verso un’AI più sicura, affidabile e rispettosa delle persone, l’implementazione di tali regole per, una tecnologia in rapida evoluzione, presenta sfide significative.

Le sfide principali

  1. Trasparenza e Verificabilità: Se utilizziamo un modello statistico classico per effettuare una valutazione – come il benestare per l’erogazione di un prestito, la definizione dell’indice di rischio di un’operazione, la diagnosi di una malattia o la previsione del malfunzionamento di un macchinario – abbiamo ben chiaro quali siano i parametri che guidino la valutazione e l’impatto che ognuno di essi ha sull’esito finale. Risulta quindi semplice dimostrare che il modello utilizzato è trasparente, verificabile e soprattutto ripetibile, cosa molto importante in caso di certificazione o contestazione della bontà del modello. Per la GenAI, questo è un ostacolo enorme. I modelli fondazionali sono addestrati su dataset immensi, spesso acquisiti dal web, rendendo quasi impossibile una tracciabilità completa dei dati di addestramento. Diventa difficile dimostrare la provenienza dei dati, l’assenza di bias o la conformità alle normative sulla privacy, così come spiegare in modo esaustivo il funzionamento interno di un modello di per sé opaco.
  2. Responsabilità e Catena del Valore: Un’altra questione critica riguarda la responsabilità. Chi è responsabile per un output problematico o illegale generato da un modello GenAI? Con la GenAI, la catena del valore è lunga e complessa, e spesso l’output dipende dall’input dell’utente (il “prompt”). Stabilire le responsabilità legali in caso di contenuti diffamatori, fuorvianti o che violano il diritto d’autore è un processo giuridicamente intricato.
  3. Gestione del Diritto d’autore e dei Dati Personali: L’addestramento dei modelli GenAI su grandi quantità di testi e immagini protetti da diritto d’autore solleva enormi interrogativi legali. Identificare e rimuovere materiale protetto da diritto d’autore da un dataset di miliardi di dati è tecnicamente proibitivo. Allo stesso modo, gestire i dati personali e rispettare il GDPR nei dataset di addestramento è una sfida enorme, pensiamo alla sola necessità di dover rispettare il diritto all’oblio, il dover sfilare i dati di una singola persona può voler dire riaddestrare da zero il modello. E questo va fatto ad ogni cancellazione il prima possibile.
  4. Monitoraggio e Valutazione Continua: La natura dinamica della GenAI, che produce output imprevedibili, rende il monitoraggio continuo un requisito impegnativo. Per garantire il rispetto di normative può essere necessario implementare un meccanismo sorveglianza del modello in campo ma controllare ogni singola interazione e output di un modello generativo su larga scala è tecnicamente molto complesso e oneroso.

In sintesi, il rispetto delle normative e dei regolamenti si scontra con la realtà tecnica e la velocità di sviluppo della GenAI. Le norme presenti, e quelle future, offrono una base solida, ma richiederanno uno sforzo congiunto da parte di legislatori, aziende e sviluppatori per definire linee guida chiare e implementare soluzioni tecnologiche che garantiscano le conformità.

 

Come può una azienda implementare una soluzione di GenAI nel rispetto delle normative e dei regolamenti?

L’implementazione di soluzioni di Intelligenza Artificiale Generativa (GenAI) conformi a normative e regolamenti non è solo un obbligo ma una scelta strategica che rafforza la fiducia e la sicurezza. Questa sfida richiede un approccio strutturato, che parta dalla governance dei dati e punti sulla gestione di modelli e infrastrutture private.

Data Governance e Privacy-by-Design

Una solida data governance è alla base di qualsiasi progetto di GenAI. Un’azienda deve stabilire politiche chiare per la raccolta, l’archiviazione e l’utilizzo dei dati, applicando il principio di “privacy-by-design”. Questo significa che ogni fase dell’iniziativa di GenAI, dalla progettazione all’implementazione, deve considerare la protezione dei dati personali. Le attività chiave includono

  • Classificazione e Anonimizzazione dei Dati: I dati usati per l’addestramento e il fine-tuning dei modelli devono essere accuratamente classificati. Se possibile, si dovrebbero utilizzare tecniche di anonimizzazione per minimizzare il rischio di re-identificazione.
  • Gestione dei Diritti d’Autore e della Privacy: È fondamentale implementare processi che permettano di rispettare i diritti degli autori, evitando di addestrare i modelli su contenuti protetti da copyright senza il dovuto consenso, ed il diritto all’oblio.

Vantaggi di un Cloud Ibrido o Privato

La scelta dell’infrastruttura ibrida o privata è cruciale per la conformità. A differenza del cloud pubblico, che può sollevare problemi di sovranità dei dati e di sicurezza, un’infrastruttura privata offre un controllo maggiore.

  • Sicurezza e Controllo Totale: Un’infrastruttura privata permette di mantenere i dati sensibili all’interno dei confini aziendali, riducendo il rischio di fughe di dati e garantendo la conformità con normative specifiche di settore.
  • Tracciabilità e Audit: Con i dati e i modelli sotto il proprio controllo diretto, è più semplice documentare l’origine (data lineage), la freschezza e la qualità dei dati di addestramento e dimostrare la conformità durante un audit. Questo semplifica la gestione della documentazione tecnica e la verificabilità del modello.

Gestione del Ciclo di Vita del Modello (MLOps)

L’implementazione non finisce con l’addestramento del modello. Le normative possono richiedere un monitoraggio continuo, che può essere gestito efficacemente attraverso pratiche di MLOps (Machine Learning Operations). Questo approccio garantisce che il modello rimanga conforme e affidabile nel tempo.

  • Validazione e Testing Rigoroso: Prima del rilascio, il modello deve essere sottoposto a test approfonditi per valutare l’assenza di bias, l’accuratezza e la sicurezza degli output. È importante testare la robustezza del modello contro attacchi malevoli o input avversari.
  • Monitoraggio Post-Deployment: Dopo il rilascio, è necessario un monitoraggio costante per identificare eventuali deviazioni (drift) nei dati o negli output, che potrebbero indicare una perdita di conformità o prestazioni.

Queste fasi di controllo continuo permettono di mettere fuori linea il modello. quando non più conforme, spegnendolo o attivando un modello alternativo.

Trasparenza e Documentazione Interna

La trasparenza, intesa come la capacità di spiegare il funzionamento del modello, è una sfida complessa per la GenAI, ma è un requisito non negoziabile. L’azienda deve mantenere una documentazione completa e aggiornata che includa:

  • I dettagli dei dati di addestramento.
  • Le metriche di performance e le valutazioni di rischio.
  • Le misure di mitigazione dei rischi adottate.

In sintesi, la conformità a normative e regolamenti per la GenAI è un processo continuo che si basa su una gestione scrupolosa dei dati, l’adozione di un’infrastruttura che garantisca controllo e sicurezza, e una supervisione costante del ciclo di vita del modello.

Nell’implementare questo processo le aziende possono fare affidamento a prodotti e system integrator che le aiutino ad indirizzare i vari aspetti con soluzioni affidabili e adattabili alle varie necessità.

 

 

 

 

 

 

 

 

 

© 2017 Brainz s.r.l. - All right reserved

Designed and Developed by ThemeXpert.