Lý thuyết Tính đại diện, hợp lí của dữ liệu
a) Tính đại diện của dữ liệu
Để đảm bảo tính đại diện, dữ liệu cần phải đáp ứng đúng tiêu chí: đối tượng thu thập dữ liệu là toàn bộ đối tượng được quan tâm hoặc đối tượng thu thập dữ liệu được lựa chọn một cách ngẫu nhiên trong toàn bộ đối tượng được quan tâm.
b) Tính hợp lí của dữ liệu
Để đảm bảo tính hợp lí, dữ liệu cần phải đáp ứng đúng các tiêu chí toán học đơn giản, chẳng hạn như:
+ Tổng tỉ lệ phần trăm của tất cả các thành phần phải bằng 100%;
+ Số lượng của bộ phận phải nhỏ hơn số lượng của toàn thể;...
+ Phải có tính đại diện đối với vấn đề cần thu thập dữ liệu.
Ví dụ 1. Để khảo sát mức độ yêu thích bơi lội của học sinh toàn trường, giáo viên thể dục đã thu thập ý kiến bằng cách phỏng vấn ngẫu nhiên 5 bạn học sinh ở mỗi lớp và ghi lại kết quả. Em hãy cho biết cách thu thập dữ liệu của giáo viên thể dục có đảm bảo tính đại diện không? Vì sao?
Hướng dẫn giải:
Cách thu thập dữ liệu như trên của giáo viên thể dục đã đảm bảo tính đại diện vì đối tượng khảo sát đã được lấy ngẫu nhiên ở mỗi lớp.
Ví dụ 2. Thầy tổng phụ trách đã thống kê số lượng học sinh khối 7 tham gia chuyến đi ngoại khóa như bảng sau:
Lớp |
Sĩ số |
Số lượng học sinh tham gia chuyến đi ngoại khóa |
7A |
40 |
38 |
7B |
38 |
40 |
7C |
40 |
40 |
7D |
36 |
33 |
7E |
39 |
38 |
Em hãy so sánh số học sinh tham gia chuyến đi ngoại khóa so với sĩ số của mỗi lớp để tìm ra điểm bất hợp lý của bảng thống kê trên.
Hướng dẫn giải:
Ta thấy số lượng học sinh tham gia chuyến đi ngoại khóa của mỗi lớp phải luôn nhỏ hơn hoặc bằng sĩ số lớp đó.
Ta xét từng lớp:
Lớp 7A: 38 < 40 (đúng).
Lớp 7B: 40 < 38 (vô lý).
Lớp 7C: 40 = 40 (đúng).
Lớp 7D: 33 < 36 (đúng).
Lớp 7E: 38 < 39 (đúng).
Ta thấy số lượng học sinh tham gia ngoại khóa ở lớp 7B lớn hơn sĩ số của lớp 7B nên đây là điểm bất hợp lý của bảng thống kê đã cho.