DevFest Pisa 2025

Speaker

Daniele Mario Areddu

STUDENT @ ITIS VALLAURI VELLETRI | ASSOCIATED @ UNIDEA

Daniele Mario Areddu, studente dell’ultimo anno di un istituto informatico e freelance, si occupa di sviluppo web e coltiva passioni e progetti legati all’Intelligenza Artificiale. Da sempre interessato all’informatica, partecipa a workshop e conferenze per approfondire le sue competenze e restare aggiornato sulle ultime novità del settore

Personalizzare l'IA per il Diritto: Addestrare Modelli su Dataset Legali

Intermediate

🇮🇹

14:00

40min

Sala Pacinotti

L’intelligenza artificiale può essere adattata per compiti specifici tramite il fine-tuning di modelli pre-addestrati, trasformandoli in strumenti altamente specializzati. In questo talk presenterò un progetto pratico basato su GPT-2, personalizzato per comprendere e generare testi giuridici, con un focus sull’interpretazione del Codice Civile e Penale e sulla creazione automatizzata di querele. Il progetto sfrutta tecnologie open source per ottimizzare un modello di linguaggio già esistente, rendendolo capace di rispondere a domande legali e generare documenti strutturati con un linguaggio formale e contestualizzato.

Durante l’intervento illustrerò il workflow seguito, suddiviso in tre fasi principali. La prima riguarda la preparazione del dataset, che prevede l’estrazione dei testi normativi tramite web scraping e parsing, seguita dalla pulizia e tokenizzazione del testo con NLTK e Hugging Face Tokenizers, per garantire un’elaborazione efficace del linguaggio giuridico. La seconda fase si concentra sul fine-tuning di GPT-2, eseguito con PyTorch e TensorFlow per adattare il modello al dominio legale. Verranno ottimizzati iperparametri chiave come batch size, learning rate ed epoche, applicando tecniche di early stopping e gradient accumulation per migliorare le prestazioni su hardware limitato. Infine, nella terza fase, verrà presentata l’interfaccia web, sviluppata con Flask, che consente agli utenti di inserire domande giuridiche o descrivere un caso, ricevendo in risposta un’analisi legale dettagliata o una bozza di querela generata automaticamente dal modello.

Il talk si concluderà con una demo live, dimostrando come la personalizzazione di GPT-2 possa trasformare un modello generico in uno strumento avanzato per il settore giuridico. L'obiettivo è mostrare come sia possibile adattare un LLM alle esigenze specifiche di qualsiasi organizzazione o settore.