"La Rivista di Engramma (open access)" ISSN 1826-901X

200 | marzo 2023

97888948401

Banchetti Reali in Scenari Virtuali

Corpus Linguistics & Al Art Generation

Federico Boschetti

English abstract

Immagine generata da Midjourney a partire dal testo tradotto automaticamente in inglese di Anthologia Latina 796.

Nell’ambito degli studi classici, i corpora digitali di testi letterari e documentari affiancano gli strumenti tradizionali del filologo e del critico letterario in modi che tendono a differenziarsi sempre più dalla consultazione di semplici indici e concordanze (o parole-chiave in contesto) basati su autorevoli edizioni di riferimento.

Infatti, fino alla fine del secolo scorso il vantaggio maggiore di ricorrere a risorse digitali era la velocità di ricercare e confrontare co-occorrenze lessicali, basate sull’identità (totale o parziale) delle forme flesse o lemmatizzate. Sveltire una procedura migliora il metodo d’indagine, tuttavia non lo modifica nella sostanza. Ma la combinazione delle vecchie risorse digitali con le nuove, come vedremo di seguito, tende invece a offrire alcuni spunti originali anche sul versante del metodo.

Le prime campagne di digitalizzazione hanno prodotto ― e continuano a produrre ― risorse indispensabili come il TLG (a licenza chiusa) o la Perseus Digital Library (licenza aperta) per il greco antico e il PHI per il latino. A queste ne sono seguite altre, in Italia, in Europa e nel mondo, sia per estendere le collezioni di testi al di là dell’arco temporale dei primi corpora verso il medioevo (ad esempio ALIM), l’umanesimo e il rinascimento (come Poeti d’Italia), sia per corredare i testi di apparato critico (Musisque Deoque), sia per associare ai testi diversi livelli di analisi, come l’analisi metrica (Pedecerto), l’analisi sintattica o l’analisi di temi e motivi (Memorata Poetis).

Inoltre, alle risorse testuali (con o senza annotazioni) si sono affiancate risorse linguistiche come le wordnets, cioè risorse lessico-semantiche ad accesso sia semasiologico (dal termine al nodo concettuale) che onomasiologico (dal nodo concettuale al gruppo di sinonimi che lo esprimono; ne sono esempi Latin WordNet e Greek Wordnet), o i dizionari etimologici (come il dizionario etimologico del latino).

Sfogliando l’Index Rerum Notabilium di Memorata Poetis, che è ripartito in sei macrocategorie (Animalia, Arbores et virentia, Dei et Heroes, Homines, Loca e Res), si possono trovare epigrammi in greco e latino relativi al tema della Festa (in senso religioso, come sottocategoria di Dei et Heroes / Religio et superstitio) o relativi, in senso lato, alla dimensione conviviale (Homines / Convivium, con i temi correlati Carmina convivalia, Convivae corona, Convivia barbara, Convivia deorum, Invitationes, Sedes convivii, Vinum curis remedium e Vinum et ebrietas). Scelta come chiave di ricerca Sedes convivii, per la maggiore opportunità di rappresentare visivamente il contenuto dei testi trovati, l’epigramma 796 dell’Anthologia Latina è sembrato il più adatto per formulare un piccolo caso di studio. Il testo dell’epigramma dice:

Ad cenam Varus me nuper forte uocauit:
Ornatus, diues, paruula cena fuit.
Auro, non dapibus decoratur mensa; ministri
Apponunt oculis plurima, pauca gulae.
Tunc ego “non oculos sed uentrem pascere ueni: 5
Vel tu pone dapes, Vare, uel aufer opes.”

Il caso di studio consiste nel tradurre in immagini generate dall’intelligenza artificiale la scena centrale dell’epigramma (vv. 2-3), in cui il poeta nota: “l’allestimento, ricco, ma la cena fu minuscola. / La tavola è decorata d’oro, non di pietanze”. La generazione automatica di immagini a partire dalla loro descrizione (text-to-image) è un tema molto caldo nell’ambito dell’intelligenza artificiale (dibattuto anche durante la tavola rotonda finale di una recente training school organizzata da Irene Russo, CNR-ILC (per informazioni: https://diptext-kc.clarin-it.it/helpdesk).

Fra i numerosi sistemi di traduzione di testi in immagini si è scelto, per l’alta qualità grafica, Midjourney (per un elenco di alternative, fra cui DALL-E 2, si veda per esempio https://alternativeto.net/software/dall-e). Siccome il sistema è addestrato sulla lingua inglese, si è proceduto prima alla traduzione automatica dal latino all’inglese tramite Google Translate, che a sua volta è basato sull’Intelligenza Artificiale. Per avere una traduzione accettabile, è stato necessario aggiustare la punteggiatura e normalizzare l’ortografia delle prime parole: “Ornatus dives, parvula cena fuit […]”, per ottenere: “It was a small dinner, richly decorated. The table is decorated with gold, not protein (sic!)”. Fa sorridere la traduzione di “dapibus” con “protein”, ma nel complesso il senso originale è preservato, soprattutto ai fini della generazione di immagini dal testo. Per ottenere un’immagine soddisfacente, è stato necessario aggiungere un’indicazione di contesto all’inizio della prima frase: “In ancient Rome, there was a small dinner…”. Il risultato è visibile nell’immagine a corredo del testo.

Al di là degli scopi ludici, la concatenazione di strumenti basati sull’intelligenza artificiale apre scenari allo stesso tempo discutibili e stimolanti. Questi scenari sono discutibili, perché i risultati necessitano di costante controllo e correzione da parte di esperti (della lingua, per la traduzione automatica, della civiltà, per la generazione automatica di immagini). Il rischio, naturalmente, è la sovragenerazione di prodotti digitali che sfuggono al controllo di qualità. Ma questi scenari sono anche molto stimolanti, perché potenziano la creatività artistica. Allo stato attuale, le immagini generate non sono adatte in edizioni scientifiche digitali, ma possono essere accattivanti in edizioni illustrate per il largo pubblico (se corredate da un opportuno caveat).

English abstract

Memorata Poetis is a corpus of short poetic texts in classical and modern languages annotated by themes and motifs. Thanks to the thematic index, it is possible to search, for instance, for poems about feasts, banquets, wine, etc. After identifying an interesting poem, a pertinent image can be generated through AI systems. This process opens new perspectives toward the composition of picture books in the digital age and poses new philological and artistic questions.

keywords | Artificial intelligence; Classical Philology; Corpus Linguistics; Text-to-Image.

Per citare questo articolo / To cite this article: F.Boschetti, Banchetti Reali in Scenari Virtuali. Corpus Linguistics & Al Art Generation ”La rivista di Engramma” n.200, vol.1, marzo 2023, pp. 117-119| PDF

doi: https://doi.org/10.25432/1826-901X/2023.200.0034