Ngữ liệu tiếng nói

Ngữ liệu tiếng nói (hay còn gọi là ngữ liệu lời nói) là một cơ sở dữ liệu các tệp âm thanh giọng nói và văn bản phiên âm.

Trong công nghệ tiếng nói (speech technology), ngữ liệu tiếng nói được sử dụng, trong số nhiều thứ khác, để tạo mô hình âm thanh (acoustic model) (sau đó có thể dùng để nhận dạng tiếng nói hay cơ chế nhận dạng người nói).[1] Trong ngôn ngữ học, ngữ liệu tiếng nói được dùng để làm nghiên cứu ngữ âm học, phân tích hội thoại, phương ngữ học (dialectology) và các lĩnh vực khác.

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ Sarangi, Susanta; Sahidullah, Md; Saha, Goutam (tháng 9 năm 2020). “Optimization of data-driven filterbank for automatic speaker verification”. Digital Signal Processing. 104: 102795. arXiv:2007.10729. doi:10.1016/j.dsp.2020.102795.

Đọc thêm

[sửa | sửa mã nguồn]
  • Edwards, Jane / Lampert, Martin (eds.) (1992): Talking Data – Transcription and Coding in Discourse Research. Hillsdale: Erlbaum.
  • Leech, Geoffrey / Myers, Greg / Thomas, Jenny (eds.) (1995): Spoken English on Computer: Transcription, Markup and Application. Harlow: Longman.

Liên kết ngoài

[sửa | sửa mã nguồn]
Chúng tôi bán
Bài viết liên quan
Vật phẩm thế giới Longinus - Overlord
Vật phẩm thế giới Longinus - Overlord
☄️🌟 Longinus 🌟☄️ Vật phẩm cấp độ thế giới thuộc vào nhóm 20 World Item vô cùng mạnh mẽ và quyền năng trong Yggdrasil.
[Review sách] Cân bằng cảm xúc cả lúc bão giông
[Review sách] Cân bằng cảm xúc cả lúc bão giông
Một trong cuốn sách kỹ năng sống mình đọc khá yêu thích gần đây là cuốn Cân bằng cảm xúc cả lúc bão giông của tác giả Richard Nicholls.
Tại sao chúng ta nên trở thành một freelancer?
Tại sao chúng ta nên trở thành một freelancer?
Freelancer là một danh từ khá phổ biến và được dùng rộng rãi trong khoảng 5 năm trở lại đây
Sơ lược về Đế quốc Phương Đông trong Tensura
Sơ lược về Đế quốc Phương Đông trong Tensura
Đế quốc phương Đông (Eastern Empire), tên chính thức là Nasca Namrium Ulmeria United Eastern Empire