Direcció General de Comunicació

Projecte Aina

El Govern potencia el català digitalment a través del projecte "AINA"

query_builder   21 desembre 2020 07:55

event_note Nota de premsa

El Govern potencia el català digitalment a través del projecte "AINA"

  • La ciutadania podrà interactuar en català amb la tecnologia al mateix nivell que els parlants d’una llengua global, com ara l’anglès, i evitar així l’extinció digital de la llengua

 

  • Té un pressupost de 13,5M€, que es finançaran amb els fons NextGenerationEU, i el Departament de Polítiques Digitals fa una aportació inicial de 250.000 euros

 

  • Properament es generarà els models de la llengua, models de la parla i models per a la traducció utilitzant xarxes neuronals multicapa

Un projecte estratègic i lingüístic

 

El projecte ha estat batejat amb el nom d’AINA en homenatge a la filòloga menorquina Aina Moll, figura central de la promoció i la normalització del català i primera Directora General de Política Lingüística de la Generalitat de Catalunya del 1980 al 1988. Ella va ser l’artífex del llançament, el 1982, de la primera campanya institucional de sensibilització sobre l’ús de la llengua ‘El català, cosa de tots’, que, amb el popular personatge de la Norma al capdavant, tenia com a objectiu conscienciar la societat sobre la situació sociolingüística del català. Un any després, s'aprovava la primera llei de normalització lingüística.

 

AINA conté una referència a la tecnologia (AI: Intel·ligència Artificial) que farà possible la seva normalització en l’àmbit digital.

 

El projecte AINA s’emmarca en l’estratègia digital del Govern, a través de dues iniciatives liderades pel Departament de Polítiques Digitals: el Consell de Direcció interdepartamental per a la promoció del català a Internet i en les tecnologies digitals avançades, aprovat el desembre del 2018, i l’Estratègia d'Intel·ligència Artificial de Catalunya (Catalonia.AI), aprovat el febrer del 2020.

 

El primer compta amb la participació de la Direcció General de Societat Digital, la Direcció General de Política Lingüística, la Direcció General de Mitjans de Comunicació, l’Agència de Ciberseguretat de Catalunya, la Direcció General d’Atenció Ciutadana i la Fundació puntCAT, i té entre els seus objectius impulsar la presència del català en els assistents de veu. Per la seva banda, un dels eixos prioritaris de l’estratègia Catalonia.AI està vinculat a l’ús normalitzat de la llengua catalana en les interfícies com a element clau en el desplegament de la IA, ja que la llengua és l’element de comunicació de base per accedir, utilitzar i interactuar amb aquestes tecnologies

 

Pressupost i abast del projecte AINA

 

El projecte AINA té un pressupost global de 13,5 milions d’euros per al període 2020-2024 i és un dels projectes prioritzats pel Departament de Polítiques Digitals per ser finançat amb els fons europeus NextGenerationEU. De moment, el projecte arrenca amb una aportació inicial de 250.000€ que el Departament de Polítiques Digitals ha assignat al BSC per ampliar els corpus de la llengua catalana i així obtenir models lingüístics que abastin les diferents variants i registres.

 

El BSC ja disposa d’un primer corpus textual del català, consistent en 1.770 milions de paraules, reunides en 95 milions de frases. Aquest corpus, el més gran que s’ha fet mai de la llengua catalana, s’ha obtingut a base de descarregar textos de diferents fonts digitals (planes web, arxius, etc), netejar-los i esborrar duplicitats.

 

La Generalitat de Catalunya ha proveït tota la informació de les seves pàgines web i del DOGC, cosa que ha suposat el 33% de tots els continguts descarregats, i han estat necessàries 2.000 hores de processadors del superordinador MareNostrum per revisar les dades obtingudes, desduplicar-les i eliminar tot allò que no fossin pròpiament oracions del català.