Ngữ liệu tiếng nói (hay còn gọi là ngữ liệu lời nói) là một cơ sở dữ liệu các tệp âm thanh giọng nói và văn bản phiên âm.
Trong công nghệ tiếng nói (speech technology), ngữ liệu tiếng nói được sử dụng, trong số nhiều thứ khác, để tạo mô hình âm thanh (acoustic model) (sau đó có thể dùng để nhận dạng tiếng nói hay cơ chế nhận dạng người nói).[1] Trong ngôn ngữ học, ngữ liệu tiếng nói được dùng để làm nghiên cứu ngữ âm học, phân tích hội thoại, phương ngữ học (dialectology) và các lĩnh vực khác.