Cặp base (viết tắt tiếng Anh là bp trong base pair) là một đơn vị gồm hai nucleobase liên kết với nhau bởi các liên kết hydro. Chúng tạo thành những khối cấu trúc xoắn kép DNA, và đóng góp vào cấu trúc gập của cả DNA và RNA. Cặp base Watson-Crick (guanine-cytosine và adenine-thymine) tạo ra các liên kết hydro, cho phép các chuỗi xoắn DNA duy trì cấu trúc xoắn ốc thông thường, cấu trúc này phụ thuộc trình tự nucleotide.[1]Nguyên tắc bổ sung của cấu trúc nhóm base này cung cấp một bản sao dự phòng của tất cả thông tin di truyền được mã hóa bên trong DNA sợi kép. Cấu trúc thông thường và sự dư thừa dữ liệu cung cấp bởi chuỗi xoắn kép DNA đã khiến DNA rất phù hợp với việc lưu trữ thông tin di truyền. DNA polymerase giúp DNA tái bản, còn RNA polymerase phiên mã DNA thành RNA. Nhiều protein liên kết DNA có thể nhận ra trình tự cặp base đặc trưng, từ đó nhận diện những vùng gen điều hòa riêng biệt.
Các cặp base nội phân tử có thể xuất hiện bên trong các acid nucleic sợi đơn. Đây là tính chất rất quan trọng trong các phân tử RNA (ví dụ RNA vận chuyển), nơi cặp base Watson-Crick (guanine-cytosine và adenine-uracil) cho phép sự hình thành cấu trúc xoắn kép ngắn. Các tương tác không phải là base Watson-Crick (như G-U hay A-A) cho phép các RNA gập thành một phạm vi rộng lớn, tạo thành cấu trúc ba chiều đặc trưng. Thêm nữa, việc ghép cặp base giữa RNA vận chuyển (tRNA) và RNA thông tin (mRNA) trong quá trình dịch mã để tạo ra trình tự amino acid, từ đó hình thành protein thông qua mã di truyền.
Kích thước của từng gen hoặc toàn bộ bộ gen của một sinh vật thường được đo theo đơn vị cặp base bởi vì DNA thường là sợi kép. Do đó, số lượng tổng các cặp base thì bằng với số nucleotide ở một trong hai mạch (ngoại lệ là các vùng đơn sợi không mã hóa của telomere). Bộ gen đơn bội của người (23 nhiễm sắc thể) được ước tính dài khoảng 3,2 triệu base và chứa 20.000–25.000 gen mã hóa protein riêng biệt.[2][3][4] Một kilobase (kb) là một đơn vị đo trong sinh học phân tử bằng với 1000 cặp base của DNA hoặc RNA.[5] Tổng lượng cặp base DNA liên kết trên Trái Đất ước tính vào 5.0 × 1037, và nặng 50 tỷ tấn.[6] Để so sánh thì tổng sinh khối của sinh quyển đã được ước tính nặng 4 nghìn tỷ tấn carbon.[7]
Hình trên, một cặp base GC với ba liên kết hydro. Hình dưới, một cặp base AT với hai liên kết hydro. Các liên kết hydro không cộng hóa trị giữa các cặp được thể hiện bởi các đường nét đứt.
Liên kết hydro là tương tác hóa học giúp sự bắt cặp base tuân theo các nguyên tắc bổ sung. Sự tương ứng về mặt cấu hình của các base cho phép bắt cặp "chính xác" và ổn định. DNA với số lượng tượng GC cao thì ổn định hơn là DNA có số lượng GC thấp. Tuy nhiên, trái ngược với các quan niệm phổ biến, các liên kết hydro không làm ổn định một cách đáng kể DNA, và sự ổn định thì chủ yếu là do các tương tác xếp chồng.[8]
Các chữ viết tắt dưới đây thường được sử dụng để mô tả độ dài của một phân tử DNA/RNA:
bp = cặp base (base pair)— một bp tương ứng với khoảng 3,4 Å (340 pm) [9] chiều dài dọc theo sợi, và khoảng 618 hoặc 643 daltons cho DNA và RNA theo thứ tự.
^Nuwer, Rachel (ngày 18 tháng 7 năm 2015). “Counting All the DNA on Earth”. The New York Times. New York: The New York Times Company. ISSN0362-4331. Truy cập ngày 18 tháng 7 năm 2015.
^Alberts, Bruce; Johnson, Alexander; Lewis, Julian; Morgan, David; Raff, Martin; Roberts, Keith; Walter, Peter (tháng 12 năm 2014). Molecular Biology of the Cell (ấn bản thứ 6). New York/Abingdon: Garland Science, Taylor & Francis Group. tr. 177. ISBN978-0-8153-4432-2.
Watson JD; Baker TA; Bell SP; Gann A; Levine M; Losick R (2004). Molecular Biology of the Gene (ấn bản thứ 5). Pearson Benjamin Cummings: CSHL Press. (See esp. ch. 6 and 9)
Astrid Sigel; Helmut Sigel; Roland K. O. Sigel biên tập (2012). Interplay between Metal Ions and Nucleic Acids. Metal Ions in Life Sciences. 10. Springer. doi:10.1007/978-94-007-2172-2. ISBN978-9-4007-2171-5.
Clever, Guido H.; Shionoya, Mitsuhiko (2012). “Chapter 10. Alternative DNA Base-Pairing through Metal Coordination”. Interplay between Metal Ions and Nucleic Acids. tr. 269–294. doi:10.1007/978-94-007-2172-2_10.
Megger, Dominik A.; Megger, Nicole; Mueller, Jens (2012). “Chapter 11. Metal-Mediated Base Pairs in Nucleic Acids with Purine and Pyrimidine-Derived Neucleosides”. Interplay between Metal Ions and Nucleic Acids. tr. 295–317. doi:10.1007/978-94-007-2172-2_11.