![]() | |
![]() | |
Cineál | bunachar sonraí gutha agus sluafhoinsiú ![]() |
---|---|
Bunleagan | 19 Meitheamh 2017 |
Ceadúnas | Ceadúnas Creative Commons CC0 ![]() |
Ar fáil sa | |
Saintréithe teicniúla | |
Gléas ionchuir | scáileán tadhaill |
Foireann | |
Dáileoir | Google Play |
Tuilleadh eolais | |
Láithreán Gréasáin | commonvoice.mozilla.org (ilteangacha) ![]() |
| |
Is tionscadal sluafhoinsithe é Common Voice a chuir Mozilla ar bun chun corpas cainte saor agus oscailte a chruthú. Tacaíonn oibrithe deonacha leis an tionscadal trí shampla-abairtí a thaifeadadh le micreafón agus trí thaifeadtaí úsáideoirí eile a athbhreithniú. Bailítear na habairtí tras-scríofa i mbunachar sonraí gutha atá ar fáil faoin gceadúnas fearainn phoiblí CC0.[1] Cinntíonn an ceadúnas seo gur féidir le forbróirí an bunachar sonraí a úsáid le haghaidh feidhmchlár guth-go-téacs agus téacs-go-guth gan srianta ná costais.
Fuair polasaí seo na foinse oscailte moladh ó NÓS: "Ba chóir dúinn uile feidhmiú de réir an chur chuige seo, le gur féidir linn acmhainní a roinnt agus tógáil ar obair a chéile."[2] Táthar ag súil go gcuirfidh an chorpas seo le hinniúlacht taighdeoirí samhail aitheanta cainte a chur ar fáil don Ghaeilge.[3]
Tá sé mar aidhm ag Common Voice samplaí gutha éagsúla a sholáthar. De réir Katharina Borchert ó Mozilla, bhí go leor tionscadal ann cheana a bhain úsáid as tacair shonraí ó raidió poiblí nó a raibh tacair shonraí acu nach raibh ionadaíocht leordhóthanach ann do mhná ná do dhaoine le blasanna láidre.[4]
Scaoileadh an chéad tacar sonraí i mí na Samhna 2017. Bhí níos mó ná 20,000 úsáideoir ar fud an domhain tar éis 500 uair a chloig d’abairtí Béarla a thaifeadadh.[5]
I mí Feabhra 2019, eisíodh an chéad bhaisc teangacha lena n-úsáid. Áiríodh leis seo 18 teanga: Béarla, Fraincis, Gearmáinis agus Mandairínis, ach teangacha nach bhfuil chomh coitianta céanna ar nós Breatnais agus an Chaibílis. San iomlán, bhí beagnach 1,400 uair an chloig de thaifeadtaí gutha ann ó níos mó ná 42,000 rannpháirtí.[6]
Ó mhí Iúil 2020 i leith, tá 7,226 uair an chloig de thaifeadtaí gutha bailithe sa bhunachar sonraí i 54 teanga, agus tá 5,591 uair an chloig díobh sin deimhnithe ag oibrithe deonacha.[7]
I mí na Bealtaine 2021, i ndiaidh na hoibre chun an Ruandais a chur leis, fuair siad deontas chun an Ciosvahaílis a chur leis freisin.[8]
Ag tús 2022, chuaigh Bengali.AI i gcomhpháirtíocht le Common Voice chun an tionscadal "Bangla Speech Recognition" a bhfuil sé mar aidhm aige go dtuigfidh meaisíní an Bheangáilis. Bailíodh 2000 uair an chloig d'urlabhra agus é mar aidhm níos mó ná 10,000 uair an chloig a bhaint amach.[9]
I Meán Fómhair 2022, fógraíodh gurbh í Tíbhis Ghána an 100ú teanga a cuireadh le bunachar sonraí Mozilla Common Voice.[10]
Faoi Dheireadh Fómhair 2022, bailíonn Mozilla Common Voice sonraí gutha go hoifigiúil do na teangacha seo a leanas:[11]