Common Voice — პროექტი, რომელიც დაიწყო Mozilla-ს მიერ, რათა შეიქმნას უფასო მონაცემთა ბაზა მეტყველების ამოცნობის პროგრამული უზრუნველყოფისთვის. პროექტის მხარდამჭერები არიან მოხალისეები, რომლებიც წერენ წინადადებების ნიმუშებს მიკროფონით და განიხილავენ სხვა მომხმარებლების ჩანაწერებს. ჩაწერილი წინადადებები გროვდება ხმოვან მონაცემთა ბაზაში, რომელიც ხელმისაწვდომია საჯარო დომენის CC ლიცენზიით.[1] ეს ლიცენზია უზრუნველყოფს, რომ დეველოპერებს შეუძლიათ გამოიყენონ მონაცემთა ბაზა ხმოვანი ტექსტის აპლიკაციებისთვის შეზღუდვებისა და ხარჯების გარეშე.
Common Voice მიზნად ისახავს მრავალფეროვანი ხმის ნიმუშების ბაზის უზრუნველყოფას. Mozilla-ს თანამშრომლის, კატარინა ბორხერტის თქმით, ბევრმა არსებულმა პროექტმა მიიღო მონაცემთა ბაზა საჯარო რადიოდან ან სხვა გზით, რომელშიც ნაკლებად იყო როგორც ქალების ხმები, ასევე ადამიანების ხმები გამოხატული აქცენტით.[2]
2022 წლის დასაწყისში Bengali.AI partnered თანამშრომლობდა Common Voice-თან, რათა წამოიწყო პროექტი „Bangla Speech Recognition“, რომელიც მიზნად ისახავდა მანქანებს გაეგოთ ბენგალური ენა. 2000 საათის ხმოვანი ჩანაწერი შეგროვდა 10000 საათზე მეტის შეგროვების მიზნით.[3]
პირველი მონაცემთა ბაზა გამოქვეყნდა 2017 წლის ნოემბერში. 20000-ზე მეტმა მომხმარებელმა მთელი მსოფლიოდან ჩაწერა 500 საათის ხანგრძლივობის ინგლისური წინადადებები.[4]
2019 წლის თებერვალში გამოვიდა პირველი პარტია გამოსაყენებლად 18 ენაზე. ამ ენებში შედიოდა: ინგლისური, ფრანგული, გერმანული და ჩინური (მანდარინი), მაგრამ ასევე ნაკლებად გავრცელებული ენები, როგორიცაა უელსური და კაბილური. საერთო ჯამში, ეს მოიცავდა 42000-ზე მეტი მოხალისეს მიერ თითქმის ჩაწერილ 1400 საათის ხმოვან მონაცემებს.[5]
2020 წლის ივლისის მონაცემებით მონაცემთა ბაზაში შევიდა 7226 საათის ხანგრძლივობის ხმოვანი ჩანაწერი 54 ენაზე, აქედან 5591 საათი მოხალისეების მიერ იქნა გადამოწმებული.[6]
2021 წლის მაისში, რუანდის ხალხის ენის დამატების სამუშაოების შემდეგ, მათ მიიღეს გრანტი სუაჰილი ენის დასამატებლად.[7]
2022 წლის სექტემბერში გამოცხადდა, რომ განას აკანების ენა (ერთ-ერთი დიალექტი) იყო მე-100 ენა, რომელიც დაემატა Common Voice-ს მონაცემთა ბაზას. [8]
2022 წლის ოქტომბრის მონაცემებით Mozilla Common Voice ოფიციალურად ხმოვან მონაცემებს აგროვებს შემდეგ ენებზე:[9]
|
|