Àmbit de la notícia
Tecnològic

La veu sintètica personalitzada obre la porta a una ràdio inclusiva per a les persones sordes signants

Entitat redactora
Colectic
Autor/a
Alejandra Sanchez
  • El projecte Signària vol convertir-se en eina que doni veu pròpia a les persones sordes signants.

Signària neix per garantir la participació plena de les persones sordes signants en entorns exclusivament auditius i per impulsar una nova manera d’entendre la inclusió tecnològica.

Signària és un projecte pioner que vol trencar la barrera històrica que ha mantingut les persones sordes signants fora de la ràdio i d’altres formats sonors. Impulsat per la Universitat Pompeu Fabra i la consultora tecnològica Sorensen, el prototip converteix la llengua de signes catalana en una veu sintètica personalitzada, preservant la identitat de cada usuària. 

Per saber-ne més, parlem amb l’equip impulsor de Signària, format per Marcel Mauri i Roger Cassany, professors de la Universitat Pompeu Fabra i investigadors principals del projecte, juntament amb Gemma Barberà, professora i investigadora del Laboratori de llengua de signes catalana, i Xavi Vinaixa, director tècnic de Sorensen i líder tècnic de Signària.

Com neix el projecte i per què és tan rellevant en entorns exclusivament auditius com la ràdio?

Aquest projecte neix per donar resposta a una necessitat molt concreta: la de la primera alumna sorda que cursa el grau de periodisme de la Universitat Pompeu Fabra en els 34 anys de la titulació. Davant l’assignatura de primer ‘Teoria i tècniques del periodisme audiovisual’, dedicada a la ràdio, l’estudiant planteja el repte de trobar una manera de cursar l’assignatura en igualtat de condicions que els seus companys. A partir d’aquí, en el marc del Grup de Recerca en Comunicació Política, Periodisme i Democràcia (POLCOM-GRP) de la UPF, l’equip docent i investigador inicia un procés de recerca de solucions creatives per superar la barrera estructural que suposa la ràdio com a mitjà exclusivament auditiu.

Treballem plegats amb el Laboratori de llengua de signes catalana, vinculat al Departament de Traducció i Ciències del Llenguatge de la UPF, i fem l’aliança amb la tecnològica Sorensen, una empresa que proporciona solucions d’IA al món dels mèdia, l’educació, les arts i la cultura. Amb Sorensen treballem en el desenvolupament d’un prototip tecnològic per transformar la llengua de signes catalana en una veu personalitzada. Signària és innovació docent i un exemple de com la tecnologia pot ser un aliat indispensable per fer una ràdio inclusiva, un mitjà sovint inabastable per a la comunitat sorda. 

Quins impactes té, a nivell de representació i dignitat, poder disposar d’una veu pròpia?

El primer que hem de tenir clar és que les persones sordes ja tenen una llengua pròpia, i és la llengua de signes catalana. De fet, Signària és una eina tecnològica que, per sobre de tot, permet que les persones sordes no hagin de renunciar a la seva llengua. Dit això, des del principi vam tenir clar que havíem de crear una identitat sonora ètica. Ja hi ha moltes veus sintètiques, però no preserven la identitat de la persona, i aquí és on entra el concepte de donant de veu.

La idea era fer-ho a través d’un familiar, algú de l’entorn de l’usuari, per captar-ne l’accent i la prosòdia. En el cas de la Berta, la donant de veu va ser la seva cosina, que té la mateixa edat i s’han criat a la mateixa ciutat. La veu sintètica resultant és la fusió entre el timbre de veu de la mateixa Berta, que vam gravar i processar separadament, i la prosòdia captada de la veu de la seva cosina. 

Com s’integra la Llengua de Signes Catalana (LSC) en el procés de creació d’una veu sintètica i quins reptes tècnics comporta?

Un dels grans reptes del projecte ha estat l’escassetat de dades amb les quals compta una llengua doblement minoritzada com la llengua de signes catalana. En aquest punt ha estat clau treballar tant amb la comunitat sorda com amb lingüistes de llengua de signes catalana de la Universitat Pompeu Fabra, perquè gràcies a aquesta col·laboració hem aconseguit ampliar la base de dades de manera sintètica.

A partir d’un conjunt d’oracions signades complexes i de verbs en infinitiu gravats en vídeo per sords nadius, hem conjugat aquests verbs sintèticament fent servir models de videojoc, multiplicant així la base de dades. Incloure lingüistes des del primer moment ens va permetre avançar de manera àgil i donar solidesa al projecte. A més, hem generat dades de lliure accés per impulsar la recerca en reconeixement de la LSC.

Com es reparteixen els rols entre desenvolupament tecnològic i recerca aplicada?

Signària és una feina d’equip on les tasques es divideixen segons l’expertesa de cada part. La universitat identifica la necessitat —resoldre un cas real d’inclusió a l’aula— i aporta el coneixement científic i metodològic: recerca lingüística, ètica, innovació docent… També s’encarrega de la part qualitativa a través de grups de discussió amb la comunitat sorda i personal docent per validar l’eina i discutir-ne els usos.

Sorensen hi aporta la innovació tecnològica. Amb ells treballem en el disseny i implementació del prototip, que inclou l’adaptació i entrenament dels models de llenguatge, l’ampliació sintètica de la base de dades i la generació de la veu sintètica personalitzada

Quins canvis espereu que generi Signària en ràdios, pòdcasts i entorns audiovisuals?

Signària dota la persona sorda signant d’una veu sintètica i, per tant, de presència directa a la ràdio. Això és un canvi de paradigma: la persona sorda té autonomia per parlar en temps real i sense intèrpret en mitjans exclusivament auditius. La veu —l’opinió, el pensament, la mirada— deixa de ser “invisible” en els mitjans sonors.

També comporta una normalització de la llengua de signes en espais on fins ara ha estat invisibilitzada, i té un impacte directe en la recerca i en el sector tecnològic

Quins són els següents passos perquè aquesta tecnologia arribi a la ciutadania?

El primer estadi és que la Berta, el curs que ve, cursi l’assignatura de ràdio a la UPF amb l’eina Signària a ple rendiment i pugui fer-la en igualtat de condicions que els seus companys. El prototip ja funciona, però cal afinar-lo: el corpus, la computer vision, el model de llenguatge i, més endavant, explorar emocions amb la veu.

En paral·lel, estem treballant per aconseguir més finançament i crear un portal on les persones sordes signants puguin crear la seva pròpia veu personalitzada per accedir a la ràdio i altres entorns audiovisuals.

Comparteix i difon

Afegeix un nou comentari