figshare
Browse

SEMPL-IT: un modello di intelligenza artificiale per la semplificazione dell’italiano

Version 4 2025-01-16, 09:12
Version 3 2025-01-14, 22:58
Version 2 2025-01-14, 21:26
Version 1 2025-01-14, 21:25
software
posted on 2025-01-16, 09:12 authored by Vittorio Ganfi, Marco RussodivitoMarco Russodivito
In questo articolo, viene presentato un sistema di Intelligenza Artificiale, denominato SEMPL-IT e dedicato alla semplificazione del linguaggio amministrativo italiano. Come mostrato in una nutrita serie di lavori (tra gli altri, Piemontese 2023, Cortellazzo e Pellegrino 2003, Fiorentino e Ganfi in stampa), il linguaggio amministrativo è caratterizzato da strutture morfosintattiche complesse e dall'uso di un lessico poco trasparente. Tali caratteristiche possono rendere questa varietà piuttosto ostica per molti potenziali fruitori dei testi istituzionali, ostacolando la piena fruizione del contenuto testuale. Attraverso lo sviluppo di SEMPL-IT si è tentato di dare un contributo esplicito al problema della complessità dei testi amministrativi, creando uno strumento facile da usare che semplifichi automaticamente i testi.

Il modello è stato addestrato sulla base dei dati del corpus ItaIst, che colleziona testi di italiano amministrativo e consta di 915.759 token. Sfruttando tecniche avanzate di elaborazione del linguaggio naturale, sono state selezionate alcune versioni semplificate del corpus ItaIst, per le quali sono stati impiegati (a) procedure di semplificazione automatica che si sono avvalse del modello di intelligenza artificiale di OpenAI (ChatGPT) e (b) controlli manuali. Le due versioni del corpus, quella originale e quella semplificata, sono state impiegate per addestrare vari modelli di intelligenza artificiale che permettono il funzionamento di SEMPL-IT. Il software, infatti, impiegando questi modelli, se riceve come input dei testi complessi, effettua una semplificazione automatica, che accresce la leggibilità dei testi. L'efficacia delle operazioni di semplificazione viene misurata, in fine, attraverso varie metriche (ad esempio, gli indici di Gulpease o di Flesch).

Funding

VerbACxSS

Ministry of Education, Universities and Research

Find out more...

History

Usage metrics

    Licence

    Exports

    RefWorks
    BibTeX
    Ref. manager
    Endnote
    DataCite
    NLM
    DC