British National Corpus (BNC) atau Korpus Nasional Inggris adalah korpus monolingual berupa data atau kumpulan teks berbahasa Inggris yang berjumlah lebih dari 100 juta kata.[1] BNC juga disebut sebagai “bank of English” atau bank data bahasa Inggris yang terdiri atas data lisan dan data tulis, serta dikumpulkan melalui berbagai sumber dan topik.
British National Corpus dibuat pertama kali oleh Penerbit Universitas Oxford pada 1980 hingga awal 1990.[1] Saat ini, proyek ini merupakan kolaborasi beberapa pihak yaitu, Penerbit Universitas Oxford, Longman, Chambers, Universitas Lancaster, dan Perpustakaan Inggris.[2]
Sumber data BNC berasal dari 90% data tulis dan 10% data lisan. Data tulis diambil dari surat kabar, jurnal penelitian, majalah, dan buku-buku fiksi. Selain itu, data lisan antara lain bersumber dari transkripsi percakapan alami dan transkripsi rekaman acara-acara.[2]
BNC berfungsi untuk membantu pekerjaan-pekerjaan di bidang linguistik, seperti:
Saat ini, BNC2014 telah dibuat sebagai bentuk pemutakhiran BNC1994. Perbandingan keduanya cukup seimbang dan secara umum memiliki genre atau register yang sama. Pada BNC2014 terdapat tambahan fitur ‘E-language’. Meski begitu, mayoritas proporsi data dari setiap subdivisi korpora memiliki kemiripan.[2]