Common Voice, auzolan digital en euskera en Tabakalera | Tabakalera - Donostia / San Sebastián
01-04-2019 - 12:00

Common Voice, auzolan digital en euskera en Tabakalera

El 9 de abril Hirikilabs será escenario del primer maratón para grabar voces en euskera en el marco de la iniciativa Common Voice y con la colaboración de Iametza Interaktiboa.

La asociación Librezale se propone conseguir 10.000 horas de grabaciones de voz en euskera durante los próximos meses.

La iniciativa, impulsada por la asociación Librezale, tiene como objetivo crear un motor libre para el reconocimiento de voz en euskera. Se trata de que los dispositivos que utilizamos en nuestro día a día sean capaces de entender el euskera: teléfonos móviles, ordenadores, televisiones... Dicha tecnología forma ya parte de nuestras vidas, y a partir de ahora utilizar nuestros dispositivos mediante la voz será algo muy habitual. Pero a las personas que utilizan el euskera tienen que dirigirse a los dispositivos en otras lenguas: francés, castellano e incluso inglés. La iniciativa que se ha puesto en marcha pretende cambiar dicha realidad y posibilitar el reconocimiento de voz en euskera.

Para ello, el 9 de abril, Iametza Interaktiboa y el laboratorio de cultura digital y tecnología de Tabakalera Hirikilabs, han organizado un encuentro para realizar las grabaciones en comunidad. Llaman a todas las personas que hablan euskera a participar en el maratón que tendrá lugar en Hirikilabs (Tabakalera, 3ª planta) de 18:00 a 20:00 el 9 de abril.

Para que el motor sea capaz de reconocer distintas voces se necesitan personas de diferentes géneros, edades y orígenes. Aunque se han organizado varias maratones a lo largo del País Vasco para dar a conocer la iniciativa, se puede participar en cualquier momento desde cualquier lugar, utilizando cualquier dispositivo. Para colaborar, son estos los pasos a seguir:

1. Abrir el enlace https://voice.mozilla.org/eu en un navegador.

2. Pulsar el botón "Hablar".

3. Leer en alto las frases que aparecen, siguiendo siempre las instrucciones.

 

También se pueden verificar las grabaciones que ya se han realizado. Para ello, se debe pulsar "Escuchar" y seguir las instrucciones. Es muy fácil, y se puede hacer bien en el ordenador o bien en un teléfono móvil. Se recomienda grabar en un lugar tranquilo, para garantizar la calidad de las grabaciones.

La asociación Librezale se fija así el reto de conseguir 10.000 horas de grabaciones en euskera durante los próximos meses.

 

Tecnología y lenguas minoritarias

Las grandes empresas tecnológicas han creado motores para el reconocimiento de voz: Google Assistant, Apple Siri, Microsoft Cortana y Amazon Alexa, entre otros. Como dichos sistemas están bajo el control de esas empresas, trabajan únicamente con aquellas lenguas que son imprescindibles para comercializar el producto en una zona concreta.

Además, a diferencia de otros softwares, desarrollar sistemas de reconocimiento de voz resulta especialmente complicado, y el euskera, como muchas otras lenguas minoritarias, no forma parte de los planes económicos de las grandes compañías.

Por lo tanto, aunque todo parece indicar que pronto la televisión, los móviles y otros dispositivos se utilizarán mediante la voz, quienes quieren utilizarlos en euskera, tienen que utilizar otras lenguas, como el castellano, el inglés o el francés. Las cientos de millones de personas

que hablan lenguas minoritarias en todo el mundo compartirán la misma problemática.

Aunque no es tan complicado traducir interfaces de texto al euskera, hay pocas empresas que se dedican a ello. Las interfaces de voz requieren un esfuerzo más grande. La Fundación Mozilla ha puesto en marcha un software para hacer frente a esa problemática, un sistema llamado Common Voice. La compañía que, entre otros, desarrolla el navegador libre Firefox, desarrollará un motor libre para el reconocimiento de voz basado en estudios automáticos (una rama de la inteligencia artificial). Junto con el euskera, están recopilando grabaciones en otros 20 idiomas (inglés, alemán, francés, castellano, catalán, persa...) y otras 70 lenguas se están preparando para realizar grabaciones (chino, georgiano, japonés, suomi, maldivés, telugua...).

 

Privacidad

Mediante esta iniciativa se obtendrá un motor libre que de preferencia a la privacidad de los hablantes. El proyecto motor Common Voice se ejecutará en nuestro dispositivo, por lo que no transferirá nuestra voz a ninguna parte. Nuestras palabras serán procesadas en el mismo dispositivo.

 

Primer encuentro en Tabakalera

Aunque la ciudadanía pueda colaborar desde casa, se han organizado varias maratones en todo el País Vasco para dar impulso al proyecto. El primer encuentro tendrá lugar el martes 9 de abril en Hirikilabs (Tabakalera, 3ª planta) de 18:00 a 20:00.