Cách so sánh 2 tỷ lệ trong spss

Kiểm định khác biệt giữa 2 tỉ lệ (one sample binomial test) cho phép chúng ta kiểm tra xem tỉ lệ các giá trị của biến phân loại 2 mức có khác ý nghĩa thống kê với nhau hay không. Chẳng hạn, chúng ta muốn biết sự khác nhau trong tỉ lệ học sinh nam và nữ trong bộ dữ liệu có ý nghĩa thống kê hay không. Kiểm định khác biệt giữa hai tỉ lệ có thể được phát biểu dưới dạng giả thuyết thống kê như sau:

\({H_0}:\begin{array}{ccccccccccccccc}{}&{p = 0.5}\end{array}\)

Và các giả thuyết thay thế có thể là:

\(\begin{array}{l}{H_1}:\begin{array}{ccccccccccccccc}{}&{p \ne 0.5}\end{array}\\{H_1}:\begin{array}{ccccccccccccccc}{}&{p > 0.5}\end{array}\\{H_1}:\begin{array}{ccccccccccccccc}{}&{p < 0.5}\end{array}\end{array}\)

Xem thêm

Trang 2 sẽ trình bày cách tiến hành và đọc kết quả kiểm định khác biệt giữa 2 tỉ lệ trên SPSS.

II. Thực hành kiểm định khác biệt giữa 2 tỉ lệ trên SPSS

Sử dụng bộ dữ liệu hsb2.sav. Đối tượng khảo sát của bộ dữ liệu này là 200 học sinh từ trung học trở xuống. Các biến chính trong bộ dữ liệu bao gồm điểm số các môn toán (math), đọc (read), viết (write), chương trình học (prog), giới tính (female)… Giả sử chúng ta muốn kiểm tra tỉ lệ học sinh nam/nữ có bằng nhau hay không? Để kiểm chứng điều này, chúng ta thực hiện kiểm định khác biệt giữa 2 tỉ lệ như sau:

Trong phần này ta sẽ kiểm tra xem tỷ lệ nữ giữa khu vực 1 và khu vực 2 có bằng nhau tại mức ý nghĩa 5% hay không?

Trước hết ta phải tại biến GTF dựa trên biến GT, xem tại đây

Phát biểu giả thuyết thống kê

Cách so sánh 2 tỷ lệ trong spss
với
Cách so sánh 2 tỷ lệ trong spss
lần lượt là tỷ lệ nữ ở khu vực 1 và khu vực 2.

Bước 1: Trên thanh công cụ chọn Analyze > Compare Means > Independent-Samples T Test

Bước 2: Sau khi cửa sổ Independent-Samples T Test hiện lên, đưa biến GTF vào ô Test Variable(s), đưa biến KV vào ô Grouping Variable, và chỉnh độ tin cậy trong Options

Bước 3: Nhấn Define Groups để phân nhóm dữ liệu biến GTF theo biến KV như sau:

(Biến KV có 3 giá trị là : 1, 2 và 2NT, do ta đang kiểm định tỷ lệ nữ giữa khu vực 1 và 2 nên ta điền 1 vào Group1 và 2 vào Group2). Sau đó nhấn Continue để trở về cửa sổ trước, và bấm Ok để nhận kết quả

Ta thấy:

* Nếu giả sử phương sai 2 tổng thể bằng nhau: p-value = 0.031 < 0.05 nên ta bác bỏ giả thuyết

Cách so sánh 2 tỷ lệ trong spss
tại mức ý nghĩa 5%.

* Nếu không giả sử phương sai 2 tổng thể bằng nhau: p-value = 0.032 < 0.05 nên ta bác bỏ giả thuyết

Cách so sánh 2 tỷ lệ trong spss
tại mức ý nghĩa 5%.

Hơn nữa, ta nhận thấy khoảng tin cậy cho sai khác giữa hai tổng thể là khoảng chỉ chứa các giá trị âm, nên ta suy luận rằng tỷ lệ nữ của khu vực 1 ít hơn khu vực 2 là hợp lý. (Xem lại cách kiểm định giả thuyết 1 phía tại đây)

Bây giờ ta sẽ kiểm định giả thuyết tỷ lệ nữ của khu vực 1 ít hơn khu vực 2:

Cách so sánh 2 tỷ lệ trong spss

* Nếu giả sử phương sai của 2 tổng thể bằng nhau: df= 77

Ta có

Cách so sánh 2 tỷ lệ trong spss
\= -1.664885 > t = -2.202 nên ta sẽ bác bỏ giả thuyết
Cách so sánh 2 tỷ lệ trong spss
và chấp nhận giả thuyết
Cách so sánh 2 tỷ lệ trong spss
tại mức ý nghĩa 5%

(Ta tính giá trị

Cách so sánh 2 tỷ lệ trong spss
bằng cách tra bảng hoặc dùng lệnh qt(df=77,0.95) trong phần mềm R)

* Nếu không giả sử phương sai 2 tổng thể bằng nhau: df=31.175

Ta có -

Cách so sánh 2 tỷ lệ trong spss
\= -1.695226 > t = -2.242 nên ta sẽ bác bỏ giả thuyết
Cách so sánh 2 tỷ lệ trong spss
và chấp nhận giả thuyết
Cách so sánh 2 tỷ lệ trong spss
tại mức ý nghĩa 5%.

(Ta cũng có thể tính

Cách so sánh 2 tỷ lệ trong spss
\= 1.695519 nếu dùng bảng tra)