Common Voice

Common Voice
Información general
Tipo de programa	voice dataset
Lanzamiento inicial	19 de junio de 2017
Idiomas	plurilingüe
Enlaces
	Sitio web oficial
	[editar datos en Wikidata]

Common Voice es un proyecto de crowdsourcing iniciado por Mozilla para crear una base de datos gratuita para software de reconocimiento de voz. El proyecto cuenta con el apoyo de voluntarios que graban frases de muestra con un micrófono y revisan las grabaciones de otros usuarios.^[1] Las frases transcritas se recopilan en una base de datos de voz disponible bajo la licencia de dominio público CC0. Esta licencia garantiza que los desarrolladores locales puedan utilizar la base de datos para aplicaciones de voz a texto sin restricciones ni costos.^[2]

A mediados de 2024, el corpus de Common Voice contiene alrededor de 30 000 horas de audio con sus respectivas transcripciones y abarca 120 lenguajes, incluyendo lenguas como el catalán, el guaraní y el italiano.^[2]^[3]

Nvidia, la Fundación Bill y Melinda Gates, la Sociedad Alemana para la Cooperación Internacional y el Ministerio Británico de Asuntos Exteriores y de la Commonwealth apoyan el proyecto desde 2021.^[4]

Origen del nombre

El nombre “Common Voice” proviene del inglés y significa “voz común”. Mozilla eligió el nombre basándose en Creative Commons, que se remonta a la idea básica común de propiedad común.^[5]

Objetivos

El objetivo de Common Voice es recopilar diversas muestras de voz. Según Katharina Borchert, directora de innovación de Mozilla, muchos proyectos de reconocimiento de voz existentes han tomado sus datos de la radio pública, y los conjuntos de datos tradicionales tienden a representar insuficientemente a las mujeres y a las personas con acento minoritario.^[6]^[7]

Referencias

↑ Ziesemer, Ann-Kristin (7 de noviembre de 2023). «Insights into the processes of Common Voice – Digital Society Blog». HIIG (en inglés estadounidense). Consultado el 18 de octubre de 2024.
↑ ^a ^b Armentano-Oller, Carme; Marimon, Montserrat; Villegas, Marta (2024-05). «Becoming a High-Resource Language in Speech: The Catalan Case in the Common Voice Corpus». En Calzolari, Nicoletta, ed. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) (ELRA and ICCL): 2142-2148. Consultado el 18 de octubre de 2024.
↑ Zarza, Santiago Rubén Acevedo; Gill, Mateo Andrés Fidabel; Martínez, Christian Daniel von Lücken; Roa, Diego Pedro Pinto (19 de septiembre de 2024). «Desarrollo de un sistema de reconocimiento del habla en guaraní». Memorias de las JAIIO 10 (1): 158-166. ISSN 2451-7496. Consultado el 18 de octubre de 2024.
↑ «Mozilla erweitert freien Sprachdatensatz massiv.». www.golem.de. Consultado el 22 de octubre de 2024.
↑ «Golem.de: IT-News für Profis». www.golem.de. Consultado el 21 de octubre de 2024.
↑ Yates, Kieran (11 de enero de 2020). «Why do we gender AI? Voice tech firms move to be more inclusive». The Guardian (en inglés británico). ISSN 0261-3077. Archivado desde el original el 19 de abril de 2020. Consultado el 22 de octubre de 2024.
↑ «Mozilla Common Voice». commonvoice.mozilla.org (en inglés). Archivado desde el original el 5 de septiembre de 2022. Consultado el 22 de octubre de 2024.