Lý thuyết Trung vị, tứ phân vị của mẫu số liệu ghép nhóm và ý nghĩa

Trung vị, tứ phân vị của mẫu số liệu ghép nhóm và ý nghĩa

1 199 lượt xem


Cho mẫu số liệu ghép nhóm

Nhóm

[a­­1; a2)

[a­­i; ai+1)

[a­­k; ak+1)

Tần số

m1

mi

mk

a) Trung vị

Để tính trung vị của mẫu số liệu ghép nhóm, ta làm như sau:

Bước 1. Xác định nhóm chứa trung vị. Giả sử đó là nhóm thứ p là [ap; ap+1).

Bước 2. Trung vị là Me=ap+n2m1+...+mp1mpap+1ap, trong đó n là cỡ mẫu, mp là tần số nhóm p. Với p = 1, ta quy ước m1 + … + mp–1 = 0.

Ý nghĩa trung vị: Trung vị của mẫu số liệu ghép nhóm xấp xỉ cho trung vị của mẫu số liệu gốc, nó chia mẫu số liệu thành hai phần, mỗi phần chứa 50% giá trị.

b) Tứ phân vị

– Để tính tứ phân vị thứ nhất Q1 của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa Q1. Giả sử đó là nhóm thứ p, là [ap; ap + 1). Khi đó,

Q1=ap+n4m1+...+mp1mpap+1ap,

trong đó, n là cỡ mẫu, m­p là tần số nhóm p, với p = 1 ta quy ước m1 + + mp – 1 = 0.

  Để tính tứ phân vị thứ ba Q3 của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa Q3. Giả sử đó là nhóm thứ p, là [ap; ap + 1). Khi đó,

Q3=ap+3n4m1+...+mp1mpap+1ap,

trong đó, n là cỡ mẫu, mp là tần số nhóm p, với p = 1 ta quy ước m1 + + mp – 1 = 0.

– Tứ phân vị thứ hai Q2 chính là trung vị Me.

Chú ý:

Ta cũng có thể xác định nhóm chứa tứ phân vị thứ r nhờ tính chất có khoảng rn4 giá trị nhỏ hơn tứ phân vị này.

Nếu chỉ tính số trung bình của mẫu số liệu ghép nhóm thì ta không cần hiệu chỉnh nhóm rời rạc k1 – k2, chọn giá trị đại diện là k1+k22.

Ý nghĩa của tứ phân vị: Các tứ phân vị của mẫu số liệu ghép nhóm xấp xỉ cho các tứ phân vị của mẫu số liệu gốc, chúng chia mẫu số liệu thành 4 phần, mỗi phần chứa 25% giá trị.

Ví dụ 1. Độ bão hoà oxygen trong máu (còn được gọi là chỉ số SpO2) biểu thị cho tỉ lệ hemoglobin có oxygen trên tổng lượng hemoglobin trong máu. Chỉ số SpO2 (đơn vị đo là %) từ 97 – 99 là oxygen trong máu tốt, 94 – 96 là oxygen trong máu trung bình, 90 – 93 là oxygen trong máu thấp, dưới 90 là trường hợp cấp cứu trên lâm sàng. (Theo: Vinmec.com). Đo chỉ số SpO2 ở một số bệnh nhân Covid–19 người ta thu được kết quả sau:

SpO2 (%)

90 - 93

94 – 96

97 – 99

Số bệnh nhân

12

31

7

a) Cho biết các nhóm số liệu và tần số tương ứng.

b) Tính số trung bình, trung vị và giải thích ý nghĩa của các giá trị thu được.

Hướng dẫn giải:

a) Có 3 nhóm số liệu gồm 90 – 93, 94 – 96, 97 – 99 với tần số tương ứng là 12, 31, 7.

b) Trước hết, ta hiệu chỉnh các nhóm số liệu và thu được bảng tần số ghép nhóm gồm giá trị đại diện như sau:

SpO2 (%)

[89,5; 93,5)

[93,5; 96,5)

[96,5; 99,5)

Giá trị đại diện

91,5

95

98

Số bệnh nhân

12

31

7

Cỡ mẫu n = 12 + 31 + 7 = 50 . Do đó, số trung bình là

x¯=1291,5+3195+79850=94,58.

Do có n2=25 giá trị nhỏ hơn trung vị nên trung vị thuộc nhóm [93,5; 96,5). Ta có, ap = 93,5; ap + 1 = 96,5; m1 + … + mp – 1 = 12, mp = 31.

Do đó, trung vị là  Me=93,5+251231394,76.

Như vậy, chỉ số SpO2 trung bình của 50 bệnh nhân là 94,58; có 25 bệnh nhân có chỉ số SpO2 nhỏ hơn 94,76 và 25 bệnh nhân có chỉ số SpO2 lớn hơn 94,76.

Ví dụ 2. Một nhóm gồm 45 học sinh làm một bài kiểm tra trắc nghiệm gồm 40 câu hỏi. Số câu trả lời đúng của mỗi bạn được ghi lại ở bảng sau:

24

35

37

24

30

23

21

39

28

20

32

37

17

40

34

27

34

30

21

26

26

38

37

16

35

19

20

22

25

38

34

29

39

40

36

18

31

24

36

33

24

24

36

26

37

a) Tìm các tứ phân vị của dãy số liệu trên.

b) Tổng hợp lại dãy số liệu trên vào bảng tần số ghép nhóm theo mẫu sau:

Số câu trả lời đúng

[16; 20]

[21; 25]

[26; 30]

[31; 35]

[36; 40]

Số học sinh

?

?

?

?

?

c) Hãy ước lượng các tứ phân vị của mẫu số liệu ghép nhóm trên.

Hướng dẫn giải:

a) Mẫu số liệu đã cho được sắp xếp theo thứ tự không giảm như sau:

16; 17; 18; 19; 20; 20; 21; 21; 22; 23; 24; 24; 24; 24; 24;
25; 26; 26; 26; 27; 28; 29; 30; 30; 31; 32; 33; 34; 34; 34;
35;    35;    36;    36;     36;     37;    37;     37;    37;     38;     38;    39;     39;     40;     40.

Cỡ mẫu là n = 45 là số lẻ nên trung vị của mẫu số liệu là Q2 = x23 = 30.

Tứ phân vị thứ nhất là Q1=12x11+x12=1224+24=24.

Tứ phân vị thứ ba là  Q3=12x34+x35=1236+36=36.

b) Bảng tần số ghép nhóm của mẫu số liệu trên như sau:

Số câu trả lời đúng

[16; 20]

[21; 25]

[26; 30]

[31; 35]

[36; 40]

Số học sinh

6

10

8

8

13

c) Do số câu trả lời đúng của học sinh là số nguyên nên ta hiệu chỉnh lại bảng số liệu như sau:

Số câu trả lời đúng

[15,5; 20,5)

[20,5; 25,5)

[25,5; 30,5)

[30,5; 35,5)

[35,5; 40,5)

Số học sinh

6

10

8

8

13

Gọi x1; x2; …; x45 là số câu trả lời đúng của 45 học sinh được sắp xếp theo thứ tự không giảm.

Ta có: x1, …, x6 Î [15,5; 20,5); x7, …, x16 Î [20,5; 25,5); x17, …, x24 Î [25,5; 30,5); x25, …, x32 Î [30,5; 35,5); x33, …, x45 Î [35,5; 40,5).

Tứ phân vị thứ hai của mẫu số liệu x1; x2; …; x45 là x23 Î [25,5; 30,5).

Do đó, tứ phân vị thứ hai của mẫu số liệu ghép nhóm là

Q2=25,5+4526+10830,525,5=29,5625. 

Tứ phân vị thứ nhất của mẫu số liệu x1; x2; …; x45 là 12x11+x12.

Do x11 và x12 thuộc nhóm [20,5; 25,5) nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là Q1=20,5+454610.25,520,5=23,125.

Tứ phân vị thứ ba của mẫu số liệu x1; x2; …; x4512x34+x35.

Do x34 và x­35 thuộc nhóm [35,5; 40,5) nên tứ phân vị thứ ba của mẫu số liệu ghép nhóm là Q3=35,5+3.4546+10+8+813.40,535,536,173.

Ví dụ 3. Một công ty cung cấp nước sạch thống kê lượng nước các hộ gia đình trong một khu vực tiêu thụ trong một tháng ở bảng sau:

Lượng nước tiêu thụ (m3)

[3; 6)

[6; 9)

[9; 12)

[12; 15)

[15; 18)

Số hộ gia đình

24

57

42

29

8

a) Hãy ước lượng số trung bình, mốt và trung vị của mẫu số liệu ghép nhóm trên.

b) Công ty muốn gửi một thông báo khuyến nghị tiết kiệm nước đến 25% các hộ gia đình có lượng nước tiêu thụ cao nhất. Hỏi công ty nên gửi đến các hộ tiêu thụ từ bao nhiêu mét khối nước trở lên?

Hướng dẫn giải:

a) Cỡ mẫu n = 160.

Bảng tần số ghép nhóm của mẫu số liệu trên như sau:

Lượng nước tiêu thụ (m3)

[3; 6)

[6; 9)

[9; 12)

[12; 15)

[15; 18)

Giá trị đại diện

4,5

7,5

10,5

13,5

16,5

Số hộ gia đình

24

57

42

29

8

Số trung bình của mẫu số liệu ghép nhóm đã cho là

x¯=24.4,5+57.7,5+42.10,5+29.13,5+8.16,5160=9,375.

Nhóm chứa mốt của mẫu số liệu ghép nhóm trên là nhóm [6; 9).

Do đó: um = 6; nm = 57; nm – 1 = 24; nm+1 = 42.

Mốt của mẫu số liệu là MO=6+57245724+574296=8,0625.

Gọi x1; x2; …; x160 là mẫu số liệu được xếp theo thứ tự không giảm.

Ta có: x1, …, x24 Î [3; 6); x25, …, x81 Î [6; 9); x82, …,  x123 Î [9; 12); x124, …, x152 Î [12; 15); x153, …, x160 Î [15; 18).

Cỡ mẫu n = 160 là số chẵn nên trung vị là Me=12x80+x81.

Do x80 và x81 thuộc nhóm [6; 9) nên trung vị của mẫu s liệu là

Me=6+16022457.968,95.

Vậy công ty nên gửi thông báo tiết kiệm nước đến các hộ gia đình có lượng nước tiêu thụ từ 8,95 m3 nước trở lên.

Ví dụ 4. Bảng sau thống kê khối lượng một số quả măng cụt được lựa chọn ngẫu nhiên trong một thùng hàng.

Khối lượng (gam)

[80; 82)

[82; 84)

[84; 86)

[86; 88)

[88; 90)

Số quả

18

20

24

15

13

a) Hãy tính số trung bình, mốt và trung vị của mẫu số liệu ghép nhóm trên.

b) Người ta muốn chia măng cụt trong thùng ra làm ba loại theo cân nặng, bao gồm: loại nhỏ, loại vừa và loại to. Các loại này lần lượt chiếm khoảng 25%, 50% và 25% số măng cụt trong thùng. Hãy xác định ngưỡng cân nặng để phân loại quả.

Hướng dẫn giải:

a) Cỡ mẫu n = 90.

Bảng tần số ghép nhóm của mẫu số liệu trên như sau:

Khối lượng (gam)

[80; 82)

[82; 84)

[84; 86)

[86; 88)

[88; 90)

Khối lượng đại diện

81

83

85

87

89

Số quả

18

20

24

15

13

Số trung bình của mẫu số liệu ghép nhóm trên là

x¯=18.81+20.83+24.85+15.87+13.8990=254384,67.

Nhóm chứa mốt của mẫu số liệu là nhóm [84; 86).

Do đó: um = 84; nm = 24; nm–1 = 20; nm+1 = 15; um+1 = 86.

Mốt của mẫu số liệu là MO=84+24202420+2415.868484,62.

Gọi x1; x2; …; x90 là mẫu số liệu được xếp theo thứ tự không giảm.

Ta có: x1, …, x18 Î [80; 82); x19, …, x38 Î [82; 84); x39, …, x62 Î [84; 86); x63, …, x77 Î [86; 88); x78, …, x90 Î [88; 90).

Cỡ mẫu n = 90 là số chẵn nên trung vị là Me=12x45+x46

Do x45 và x46 thuộc nhóm [84; 86) nên trung vị của mẫu số liệu là

Me=84+90218+2024.868484,58.

b) Gọi Q1, Q3 lần lượt là tứ phân vị thứ nhất và thứ ba của mẫu số liệu. Theo đề bài, ta có:

Măng cụt loại nhỏ có cân nặng nhỏ hơn Q1.

Măng cụt loại vừa có cân nặng trong [Q1; Q3).

Măng cụt loại to có cân nặng không nhỏ hơn Q3.

Tứ phân vị thứ nhất của dãy số liệu x1; x2; …; x90 là x23 Î [82; 84).

Tứ phân vị thứ ba của dãy số liệu x1; x2; …; x90 là x68 Î [86; 88).

Do đó, tứ phân vị thứ nhất là Q1=82+9041820.8482=82,45;

tứ phân vị thứ ba là Q3=86+90.3418+20+2415.888686,73.

Vậy măng cụt loại nhỏ có khối lượng (tính theo gam) thuộc [80; 82,45).

Măng cụt loại vừa có khối lượng (tính theo gam) thuộc [82,45; 86,73).

Măng cụt loại to có khối lượng (tính theo gam) thuộc [86,73; 90).

1 199 lượt xem