Lý thuyết Số trung bình, mốt của mẫu số liệu ghép nhóm và ý nghĩa
Lý thuyết Số trung bình, mốt của mẫu số liệu ghép nhóm và ý nghĩa
Cho mẫu số liệu ghép nhóm
Nhóm |
[a1; a2) |
… |
[ai; ai+1) |
… |
[ak; ak+1) |
Tần số |
m1 |
… |
mi |
… |
mk |
a) Số trung bình của mẫu số liệu ghép nhóm kí hiệu là .
Số trung bình của mẫu số liệu ghép nhóm được tính theo công thức:
Trong đó n = m1 + ... + mk là cỡ mẫu và (với i = 1; …; k) là giá trị đại diện của nhóm [ai; ai+1)
+ Chú ý: Đối với số liệu rời rạc, người ta thường cho các nhóm dưới dạng k1 – k2, trong đó k1, k2 Î ℕ. Nhóm k1 – k2 được hiểu là nhóm gồm các giá trị k1, k1 + 1, …, k2. Khi đó, ta cần hiệu chỉnh mẫu dữ liệu ghép nhóm để đưa về dạng bảng tần số trước khi thực hiện tính toán các số đặc trưng bằng cách hiệu chỉnh nhóm k1 – k2 với k1, k2 Î ℕ thành nhóm [k1 – 0,5; k2 + 0,5).
+ Ý nghĩa: Số trung bình của mẫu số liệu ghép nhóm xấp xỉ cho số trung bình của mẫu số liệu gốc, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu.
b) Mốt
– Để tìm mốt của mẫu số liệu ghép nhóm, ta thực hiện theo các bước sau:
Bước 1. Xác định nhóm có tần số lớn nhất (gọi là nhóm chứa mốt), giả sử là nhóm j, đó là [aj; aj+1).
Bước 2. Mốt được xác định là: trong đó mj là tần số của nhóm j (quy ước m0 = mk+1 = 0) và h là độ dài của nhóm.
+ Chú ý: Khi tần số của các nhóm số liệu bằng nhau thì mẫu số liệu ghép nhóm không có mốt.
+ Ý nghĩa: Mốt của mẫu số liệu ghép nhóm xấp xỉ cho mốt của mẫu số liệu gốc, nó được dùng để đo xu thế trung tâm của mẫu số liệu.
Ví dụ 1. Quãng đường (km) các cầu thủ (không tính thủ môn) chạy trong một trận bóng đá tại giải ngoại hạng Anh được cho trong bảng thống kê sau:
Quãng đường (km) |
[2; 4) |
[4; 6) |
[6; 8) |
[8; 10) |
[10; 12) |
Số cầu thủ |
2 |
5 |
6 |
9 |
3 |
Tính quãng đường trung bình một cầu thủ chạy trong trận đấu này.
Hướng dẫn giải:
Cỡ mẫu: n = 2 + 5 + 6 + 9 + 3 = 25.
Trong mỗi khoảng quãng đường, giá trị đại diện là trung bình cộng của hai đầu mút nên ta có bảng sau:
Quãng đường (km) |
3 |
5 |
7 |
9 |
11 |
Số cầu thủ |
2 |
5 |
6 |
9 |
3 |
Vậy quãng đường trung bình một cầu thủ chạy trong trận đấu này là:
(km).
Ví dụ 2. Mức thưởng tết (triệu đồng) mà các công nhân một nhà máy nhận được như sau:
Mức thưởng |
[5; 10) |
[10; 15) |
[15; 20) |
[20; 25) |
Số công nhân |
13 |
35 |
47 |
25 |
Tìm mốt của mẫu số liệu ghép nhóm. Cho biết ý nghĩa của giá trị thu được.
Hướng dẫn giải:
Cỡ mẫu: n = 13 + 35 + 47 + 25 = 120.
Số công nhân có mức thưởng tết từ 15 đến dưới 20 triệu đồng là nhiều nhất nên nhóm chứa mốt là nhóm [15; 20).
Ta có, j = 3, a3 = 15; m3 = 47; m2 = 35; m4 = 25; h = 20 – 15 = 5.
Do đó, mốt của mẫu số liệu là
Ý nghĩa: Số công nhân nhận được mức thưởng tết khoảng 16,76 triệu đồng là nhiều nhất.
Ví dụ 3. Một bưu tá thống kê lại số bưu phẩm gửi đến một cơ quan mỗi ngày trong tháng 6/2023 ở bảng sau:
30 |
32 |
28 |
34 |
37 |
26 |
44 |
24 |
22 |
38 |
34 |
20 |
30 |
27 |
28 |
34 |
38 |
32 |
42 |
39 |
43 |
42 |
32 |
26 |
36 |
32 |
37 |
24 |
29 |
32 |
a) Tính số trung bình và mốt của mẫu số liệu trên.
b) Tổng hợp lại số liệu trên vào bảng tần số ghép nhóm theo mẫu sau:
Số bưu phẩm |
[20; 24] |
[25; 29] |
[30; 34] |
[35; 39] |
[40; 44] |
Số ngày |
? |
? |
? |
? |
? |
c) Hãy ước lượng số trung bình và mốt của mẫu số liệu ghép nhóm trên.
Hướng dẫn giải:
a) Số trung bình của mẫu số liệu là:
Mốt của mẫu số liệu là 32 (với tần số là 5).
b) Bảng tần số ghép nhóm theo mẫu được hoàn thành như sau:
Số bưu phẩm |
[20; 24] |
[25; 29] |
[30; 34] |
[35; 39] |
[40; 44] |
Số ngày |
4 |
6 |
10 |
6 |
4 |
c) Do số bưu phẩm là số nguyên nên ta hiệu chỉnh lại bảng tần số ghép nhóm như sau:
Số bưu phẩm |
[19,5; 24,5) |
[24,5; 29,5) |
[29,5; 34,5) |
[34,5; 39,5) |
[39,5; 44,5) |
Giá trị đại diện |
22 |
27 |
32 |
37 |
42 |
Số ngày |
4 |
6 |
10 |
6 |
4 |
Số trung bình của mẫu số liệu ghép nhóm là
Nhóm chứa mốt của mẫu số liệu trên là nhóm [29,5; 34,5).
Ta có: m = 3, u3 = 29,5; n2 = 6; n3 = 10; n4 = 6; u4 – u3 = 34,5 – 29,5 = 5.
Mốt của mẫu số liệu ghép nhóm là