15.05.2025
12 Street, Rome City, Italy
Technology

LiLA e LiITA, nascono le banche dati della lingua latina e italiana


In principio c’è LiLa (Linking Latin), una banca dati che dispone, per l’antica lingua di Roma, di un patrimonio di oltre 200.000 “parole” interconnesse, per un reticolo di prezioso ausilio alla ricerca linguistica, estratte da dizionari, corpora e altri repertori lessicali. Da quell’albero già ben ramificato, e capace di costruire relazioni di senso fra gli elementi dell’insieme, ha ora gemmato LiITA (Linking ITAlian), che sarà lanciato a Pisa il 6 dicembre, nell’ultima delle tre giornate previste della decima Conferenza Italiana di Linguistica Computazionale (CLiC).

Deus ex machina del doppio progetto è Marco Passarotti, professore ordinario presso il Dipartimento di Scienze Linguistiche dell’Università Cattolica del Sacro Cuore. Sarà lui, insieme ad alcuni componenti del suo gruppo di ricerca, a parlare del lemmario del LiITA nell’intervento del 6 dicembre, focalizzato sulla costruzione del modello conoscitivo con cui riunire e far reagire e interagire le risorse lessicali dell’italiano.

Il punto di forza del progetto, la piena portabilità del modello (a cambiare sono le sole componenti applicative), la cui architettura è identica per LiLA E LiITA, ne assicura l’implementazione per qualunque lingua. Alla base di LiITA c’è l’intento di far dialogare fra loro milioni di testi, fra antichi e moderni, di norma fruibili solo singolarmente. Una scommessa importante anche per l’intelligenza artificiale, che è ancora ai suoi primi passi. Al momento, se chiediamo a ChatGPT di comporre un sonetto amoroso in fiorentino del Duecento, per l’esiguità (o, peggio, l’insufficienza) delle fonti attingibili, i risultati sono tragicamente esilaranti. Provare per credere.

© RIPRODUZIONE RISERVATA

Leave feedback about this

  • Quality
  • Price
  • Service
[an error occurred while processing the directive]