Phát triển bởi | Mozilla Foundation |
---|---|
Phát hành lần đầu | 2017 tháng 6 năm 19 |
Kho mã nguồn | https://github.com/mozilla/voice-web |
Ngôn ngữ có sẵn | Đa ngôn ngữ (Danh sách ngôn ngữ) |
Giấy phép | Creative Commons CC0 |
Website | voice.mozilla.org |
Common Voice là một dự án crowdsourcing bắt đầu bởi Mozilla để tạo ra một cơ sở dữ liệu miễn phí cho phần mềm nhận dạng giọng nói. Dự án được hỗ trợ bởi các tình nguyện viên ghi lại các câu mẫu bằng micrô và duyệt lại các bản ghi âm của những người dùng khác. Các câu chép lại sẽ được thu thập trong một cơ sở dữ liệu bằng giọng nói phát hành theo giấy phép phạm vi công cộng CC0. Giấy phép này đảm bảo rằng các nhà phát triển có thể sử dụng cơ sở dữ liệu cho các ứng dụng thoại thành văn bản mà không bị hạn chế hoặc mất phí.
Common Voice xuất hiện như là sự đáp lại cho các trợ lý ngôn ngữ của các công ty lớn như Amazon Echo, Siri hoặc Trợ lý Google.
Common Voice nhằm mục đích cung cấp các mẫu giọng nói đa dạng. Theo Katharina Borchert của Mozilla, nhiều dự án hiện có đã lấy các bộ dữ liệu từ đài phát thanh công cộng hoặc nói cách khác là có các bộ dữ liệu không có nhiều giọng nói của phụ nữ hay của những người có giọng nói không chuẩn.[1]
Cơ sở dữ liệu Common Voice tiếng Anh là cơ sở dữ liệu giọng nói có thể truy cập tự do lớn thứ hai sau LibriSpeech. Vào thời điểm dữ liệu đầu tiên được công bố vào ngày 29 tháng 11 năm 2017, hơn 20.000 người dùng trên toàn thế giới đã đăng ký 400.000 câu được xác thực, với tổng thời lượng 500 giờ.[2]
Tháng 2 năm 2019, loạt ngôn ngữ đầu tiên được phát hành để sử dụng. Nó bao gồm 18 ngôn ngữ: tiếng Anh, tiếng Pháp, tiếng Đức và tiếng Quan thoại, nhưng cũng có các ngôn ngữ ít phổ biến hơn như tiếng Wales và tiếng Kabyle. Tổng cộng, nó bao gồm gần 1.400 giờ dữ liệu giọng nói được ghi lại từ hơn 42.000 người đóng góp.[3]