Trong toán học và thống kê, trung bình cộng (và rất ít khi là trung bình số học), hay được gọi ngắn đi là trung bình (khi đã rõ ngữ cảnh), là thương số giữa tổng của một họ các số với số lượng các con số trong họ đó.[1] Họ các con số ở đây thường là tập kết quả từ một cuộc thí nghiệm, nghiên cứu quan sát hoặc phỏng vấn. Tên gọi "trung bình số học" đôi khi được dùng để đối chiếu với bản tiếng Anh (arithmetic mean), tương tự đối với trung bình hình học.
Bên ngoài toán học và thống kê, trung bình cộng cũng được dùng nhiều trong kinh tế học, nhân loại học và lịch sử và gần như có sử dụng trong mọi nhánh học. Ví dụ chẳng hạn, thu nhập bình quân đầu người là trung bình cộng của thu nhập của toàn bộ dân số của một quốc gia.
Mặc dù trung bình cộng thường được dùng để báo cáo xu hướng tập trung, nó không phải là thống kê chuẩn mạnh: nó bị ảnh hưởng rất nhiều từ các giá trị bất thường (các giá trị hoặc cực lớn hoặc cực nhỏ so với số còn lại). Đối với các phân phối bị xiên, ví dụ như trong phân phối thu nhập, trong đó sẽ có một số người có thu nhập hơn rất nhiều so với đa số những người còn lại, trung bình cộng sẽ khó xác định "giá trị đứng giữa" của phân phối đó. Trong trường hợp này, dùng trung vị có thể mô tả tốt hơn xu hướng tập trung.
Cho tập dữ liệu , trung bình cộng (hoặc được gọi ngắn đi là trung bình), và được ký hiệu là (đọc là gạch trên), là trung bình cộng của giá trị .[2]
Trong tập dữ liệu, trung bình cộng là trong những cách thường dùng để hiểu độ đo của xu hướng tập trung. Trung bình cộng của tập dữ liệu quan sát bằng với tổng các giá trị số của mỗi quan sát chia cho số lần quan sát. Viết dưới công thức cho tập dữ liệu bao gồm các giá trị, trung bình cộng được định nghĩa như sau:
(Dấu ký hiệu cho phép lấy tổng.)
Ví dụ chẳng hạn, nếu lương hàng tháng của nhân viên là như sau: , thì trung bình cộng của lương của bọn họ là:
Nếu tập dữ liệu là quần thể thống kê (tức là chứa mọi quan sát khả thi và không chỉ là tập con của chúng) thì trung bình cộng đó được gọi là trung bình quần thể và được ký hiệu bởi chữ Hy Lạp . Nếu tập dữ liệu là mẫu thống kê (là tập con của quần thể), thì trung bình cộng được gọi là trung bình mẫu (trung bình đối với tập dữ liệu được viết là ).
Trung bình cộng được định nghĩa tương tự cho vectơ trong nhiều chiều, chứ không nhất thiết phải giữa các giá trị scalar. Tổng quát hơn, bởi vì trung bình cộng là tổ hợp lồi (tức là tổng các hệ số của nó bằng ), nó có thể được định nghĩa trên không gian lồi chứ không chỉ không gian vectơ.
Trung bình cộng có một số tính chất đặc biệt, nhất là khi dùng để đo xu hướng tập trung. Chúng bao gồm:
Trung bình cộng có thể trái với trung vị. Giá trị trung vị được định nghĩa sao cho không có hơn một nửa trong tập lớn hơn nó và cũng không có hơn một nửa trong tập nhỏ hơn nó. Khi sắp xếp các dữ liệu theo một thứ tự nào đó sao cho các dữ liệu tăng theo cấp số cộng, thì trong trường hợp này trung bình và trung vị là cùng một giá trị. Ví dụ chẳng hạn, xét tập . Giá trị trung bình là , và giá trị trung vị cũng bằng 2.5. Tuy nhiên, nếu như tập hợp không thể sắp xếp được sao cho dữ liệu tăng theo cấp số cộng, chẳng hạn như tập , thì giá trị trung bình sẽ sai khác đáng kể so với giá trị trung vị. Trong ví dụ này, trung bình bằng với , còn trung vị là . Giá trị trung bình có thể lớn hơn hoặc nhỏ hơn so với đa số dữ liệu trong tập.
Có nhiều ứng dụng cho hiện tượng này trong nhiều ngành. Ví dụ chẳng hạn, kể từ năm 1980, trung vị thu nhập của Hoa Kỳ chậm hơn nhiều so với trung bình thu nhập.[4]
Trung bình có trọng số là trung bình trong đó có một số điểm dữ liệu có "trọng lượng" nhiều hơn một số khác khi tính toán.[5] Ví dụ chẳng hạn, trung bình của và là , hoặc tương đương . Ngược lại, trong trung bình có trọng số, ta có thể đổi sao cho số đầu tiên có trọng số gấp đôi số thứ hai (có thể là vì số đó có tần suất xuất hiện gấp đôi số còn lại). Khi đó trung bình sẽ được như sau: . Ở đây, các trọng số phải có tổng bằng một, là và , trong đó cái đầu gấp đôi cái thứ hai. Do đó, trung bình cộng có thể được coi là trường hợp đặc biệt của trung bình có trọng số trong đó các trọng số đều bằng nhau ( trong trường hợp trên và trong trường hợp tổng quát xét số).
Trung bình cộng thường được ký hiệu bằng dấu gạch trên đầu, như trong .[2]
Một số phần mềm (chẳng hạn như các phần mềm xử lý văn bản, trình duyệt web) có thể không hiển thị đúng ký hiệu "x̄". Ví dụ chẳng hạn, dấu HTML "x̄" gộp hai mã — ký tự gốc "x" thêm một mã cho dấu gạch trên (̄ hoặc ¯).[6]