Objetivo del proyecto
El objetivo del proyecto Euskrowd es evaluar y, en la medida de lo posible, mejorar la capacidad de las tecnologías del lenguaje para comprender el euskera natural, prestando especial atención a los euskalkis. Para ello, estamos recopilando un corpus de audios y transcripciones compuesto por preguntas y comandos dirigidos a sistemas inteligentes. Con este fin, hemos creado una página web (euskrowd.ehu.eus), donde cualquier persona que sepa euskera puede entrar y realizar algunas grabaciones, tanto en euskera batua como en euskalkis.
La base de datos recopilada será abierta, con fines de investigación, y el proyecto ha sido evaluado y aprobado por el Comité de Ética de la UPV/EHU. Una vez recogidos los datos, analizaremos hasta qué punto los modelos actuales de Inteligencia Artificial entienden cada euskalki y lo compararemos con el euskera batua. Por lo tanto, el corpus también servirá para validar los modelos que se desarrollen en el futuro. Además, el proyecto puede resultar útil para el ámbito de la lingüística, ya que la base de datos recogerá tanto la lengua oral de los distintos euskalkis como su escritura informal actual.
¿cómo hacer tu aportación?
Para participar, entra en la página euskrowd.ehu.eus. En esta, te pediremos unos datos mínimos (franja de edad, género, y la zona de la que procede tu euskera). Después, comenzarán a aparecer preguntas y comandos, y te pediremos que los formules en tu euskera, los grabes y los transcribas. Puedes parar cuando quieras; en solo dos o tres minutos puedes realizar una aportación significativa.
La participación es altruista y podrás solicitar el borrado de tus datos en cualquier momento. Los datos se tratarán según la normativa de la Unión Europea y la base de datos será abierta, con fines de investigación.