Byte (đọc là bai-(tơ)) là một đơn vị lưu trữ dữ liệu cho máy tính, bất kể loại dữ liệu đang được lưu trữ. Nó cũng là một trong những kiểu dữ liệu (data type) trong nhiều ngôn ngữ lập trình.
Bội số của byte theo IEC 60027-2 | ||||||
---|---|---|---|---|---|---|
Tiền tố SI | Tiền tố nhị phân | |||||
Tên | Ký hiệu | Bội số | Tên | Ký hiệu | Bội số | |
kilobyte | kB | 103 (hay 210) | kibibyte | KiB | 210 | |
megabyte | MB | 106 (hay 220) | mebibyte | MiB | 220 | |
gigabyte | GB | 109 (hay 230) | gibibyte | GiB | 230 | |
terabyte | TB | 1012 (or 240) | tebibyte | TiB | 240 | |
petabyte | PB | 1015 (hay 250) | pebibyte | PiB | 250 | |
exabyte | EB | 1018 (hay 260) | exbibyte | EiB | 260 | |
zettabyte | ZB | 1021 (hay 270) | ||||
yottabyte | YB | 1024 (hay 280) |
Chữ "byte" có một số nghĩa, đều liên quan đến nhau:
char
có thể lưu trữ ít nhất 8 bit (điều khoản 5.2.4.2.1), một byte trong C có thể giữ được ít nhất 256 giá trị khác nhau (char
không phân biệt có dấu hay không có dấu). Kiểu dữ liệu nguyên thủy byte
trong Java được định nghĩa có 8 bit và là một kiểu dữ liệu có dấu, có thể lưu giá trị tự -128 đến 127.Thuật ngữ byte được Werner Buchholz đặt ra trong năm 1956 trong giai đoạn thiết kế ban đầu cho hệ thống IBM 7030. Thoạt tiên nó được mô tả là 1 đến 6 bit; các thiết bị I/O thời đó dùng đơn vị 6 bit. Cuối năm 1956, một byte đã được đổi thành 8 bit, và độ lớn này đã được phổ thông hóa trong hệ thống System/360. Từ này được đặt ra bằng cách đổi cách viết chữ bite (cắn, một lối chơi chữ với chữ bit - miếng) để nó khỏi bị viết sai thành bit.
Byte 8 bit còn thường được gọi là octet (bộ tám) trong ngữ cảnh chính thức như các tài liệu tiêu chuẩn, hay trong mạng máy tính và viễn thông. Từ này cũng được sử dụng trong thuật ngữ của một số ngôn ngữ không phải tiếng Anh khi lối chơi chữ bite không có nghĩa.
Một nửa byte 8 bit (4 bit) đôi khi còn được gọi là nibble (gặm). Nibble còn được gọi là semioctet (nửa octet) trong ngữ cảnh mạng máy tính và viễn thông cũng như bởi một số tổ chức tiêu chuẩn.
Cụm 32 bit được gọi là một word. Cụm tương ứng 64bit gọi là double word.
Một số được biểu diễn 8 bit: 10011001 (với bit đầu tiên là msb (most significant bit: bit có trọng số cao nhất), bit cuối cùng là lsb (least significant bit: bit có trọng số thấp nhất).
"Byte" thường được viết tắt là "B", và "megabyte" được viết tắt là "MB".
''b'' là viết tắt của bit, ví dụ như 10b được hiểu là 10 bits,10mb được hiểu là 10 Megabits.
Do đó cần phần biệt giữa bit ''b'' và Byte ''B''.
Một số nước nói tiếng Pháp đôi khi dùng "o" cho "octet". Việc này không chấp nhận được trong SI vì nó có thể nhầm lẫn với số 0.
Lưu ý: các tên "kilobyte", "megabyte", "gigabyte", v.v. có thể được dùng cho các tiền tố SI hay nhị phân. Xin xem Tiền tố nhị phân để biết thêm chi tiết.