Lý thuyết Phân loại dữ liệu

Lý thuyết Phân loại dữ liệu

1 101 lượt xem


Sơ đồ phân loại dữ liệu:

Để phân loại dữ liệu ta làm như sau:

Bước 1: Xem xét dữ liệu thu được có ở dạng số hay không.

- Nếu ở dạng số: đó là số liệu (dữ liệu định lượng),

- Nếu không ở dạng số: đó là dữ liệu không là số (dữ liệu định tính).

Bước 2: Xác định loại của số liệu/dữ liệu không là số.

- Với số liệu:

+ Nếu số liệu có thể nhận giá trị tùy ý trong một khoảng nào đó, đó là số liệu liên tục.

Ví dụ: số liệu thu được từ các phép đo như chiều cao, cân nặng, nhiệt độ,…

+ Nếu không phải loại trên, đó là số liệu rời rạc.

Ví dụ: số học sinh trong lớp học, số sản phẩm một công nhân làm được trong ngày (là số liệu đếm số phần tử của một tập nào đó),…

- Với dữ liệu không là số:

+ Nếu dữ liệu có thể sắp xếp theo thứ tự các mức độ, đó là dữ liệu không là số, có thể sắp thứ tự.

Ví dụ: Dữ liệu về đánh giá chất lượng dịch vụ theo các mức độ Rất tốt – Tốt – Trung bình – Tệ –  Rất tệ.

+ Nếu dữ liệu không phải các mức độ để sắp xếp theo thứ tự, đó là dữ liệu không là số, không thể sắp thứ tự.

Ví dụ: Dữ liệu về tên các tỉnh của nước ta: Khánh Hòa, Lâm Đồng, Nghệ An, Long An,…

Ví dụ 1. Dữ liệu thu được cho mỗi câu hỏi sau thuộc loại nào?

a) Cân nặng của bạn là bao nhiêu?

b) Số sản phẩm nhà máy sản xuất được trong tháng là bao nhiêu?

c) Vị kem yêu thích nhất của bạn là gì?

d) Bạn đánh giá đề thi học kì 1 như thế nào trong các mức độ sau: rất khó, khó, trung bình, dễ, rất dễ?

Hướng dẫn giải:

a) Số liệu liên tục.

b) Số liệu rời rạc.

c) Dữ liệu không là số, không thể sắp thứ tự.

d) Dữ liệu không là số, có thể sắp thứ tự.

Ví dụ 2. Trong các số liệu sau đây, số liệu nào là số liệu liên tục, số liệu nào là số liệu rời rạc?

(A) Số quyển sách các bạn trong nhóm đọc được trong tháng vừa qua: 1, 2, 0, 3.

(B) Nhiệt độ trung bình (°C) của các ngày trong tháng 5 năm 2023 tại một thành phố: 24,1; 24,3; 23,5;…; 25,7.

(C) Cân nặng của 5 bạn học sinh lớp 8A (đơn vị là kg): 38,5; 39; 42; 40,2; 37.

Hướng dẫn giải:

(A) là số liệu rời rạc.

(B) và (C) là số liệu liên tục.

1 101 lượt xem