Ước lượng trung bình của tổng thể năm 2024

Trong ước lượng điểm, chúng ta gán cho thông số cần ước lượng một giá trị trên cơ sở khảo sát, tính toán số thống kê của một hay nhiều mẫu. Trong phần này ta sẽ xem xét phương pháp ước lượng cho trung bình, tỷ lệ và phương sai (hay độ lệch chuẩn).

Ước lượng giá trị trung bình

Để ước lượng trị trung bình, ta thường sử dụng định lý giới hạn trung tâm có nội dung như sau:

Một tổng thể có trung bình là `mu` và phương sai là `sigma^2`. Ta thu thập nhiều mẫu có cùng kích thước `n`, thì ta thu được nhiều trị trung bình `bar x`. Khi số lượng mẫu thu thập đủ lớn thì các giá trị `bar x` này có phân phối chuẩn với trị trung bình là `mu` và độ lệch chuẩn là `sigma//sqrt(n)`.

Vì vậy trung bình của mẫu `bar x` có thể dùng để làm ước lượng không chệch cho trung bình của tổng thể `mu`.

Khi trình bày giá trị của ước lượng điểm, ta có thể đưa vào giá trị của sai số chuẩn. Đối với trung bình, sai số chuẩn được tính theo công thức:

trong đó `s` là độ lệch chuẩn của mẫu, `n` là số phần tử của mẫu.

Thí dụ

Trong một phân xưởng, sau khi cân trọng lượng 30 hộp thịt, ta thu được kết quả trung bình là 365,20 g, Ta dùng giá trị này để làm trọng lượng trung bình cho tất cả các hộp thịt cùng cỡ do phân xưởng sản xuất.

Cũng từ số liệu của 30 hộp thịt trên, ta tính được độ lệch chuẩn là 12,40 g.

Do đó sai số chuẩn là : `SE=s/sqrt(n)=(12,4)/sqrt(30)=2,26`

Vậy ta có thể ghi : `M_(tb)=365,20+-2,26` g

Ước lượng tỷ lệ

Ta có thể dùng tỷ lệ `p` của mẫu để ước lượng cho tổng thể. Sai số chuẩn của ước lượng tỷ lệ là:

trong đó `p` là tỷ lệ các phần tử có tính chất khảo sát của mẫu.

Thí dụ : Để đánh giá mức độ sử dụng máy điều hòa tại quận Q, người ta điều tra một mẫu gồm 150 gia đình. Kết quả điều tra cho thấy có 48 gia đình sử dụng máy điều hòa.

Vậy tỷ lệ gia đình sử dụng máy điều hòa của mẫu là `48//150=0,320` (hay 32%) và ta có thể sử dụng giá trị này để ước lượng cho tỷ lệ gia đình của quận Q sử dụng máy điều hòa.

Sai số chuẩn của ước lượng này là : `SE=sqrt((0,32xx0,68)/150)=0,038`

Vậy tỷ lệ gia đình ở quận Q sử dụng máy điều hòa được ước lượng là `0,320+-0,038` (hay `32,0+-3,8` %)

Ước lượng phương sai

Khi ta đã có toàn bộ số liệu của một tổng thể, thì phương sai của tổng thể được tính bằng công thức:

`sigma^2=(sum_(i=1)^N (x_i-mu)^2)/N`(4)

Tuy nhiên khi ta có số liệu của một mẫu, thì phương sai của mẫu lại được tính bằng công thức:

`s^2=(sum_(i=1)^n (x_i-bar x)^2)/(n-1)`(5)

Ta thấy có sự khác biệt giữa hai công thức (4) và (5). Lý do là để có thể ước lượng cho phương sai của tổng thể thì ta phải dùng công thức (5) thì ước lượng mới không chệch.

Khi biến ngẫu nhiên có phân phối chuẩn thì sai số chuẩn cho ước lượng phương sai được tính bằng công thức :

`SE=sqrt(2/(n-1))\ s^2`(6)

Ước lượng cho độ lệch chuẩn

Về mặt lý thuyết, khi ta sử dụng độ lệch chuẩn `s` tính từ công thức (5) để ước lượng cho độ lệch chuẩn `sigma` của tổng thể thì đó là ước lượng chệch. Tuy nhiên do mức độ chênh lệch không lớn nên trong thực tế ta vẫn dùng `s` để ước lượng cho `sigma`.

Mặc dù độ lệch chuẩn `s` là căn bậc hai của phương sai `s^2`, nhưng sai số chuẩn của `s` không phải là căn bậc hai của sai số chuẩn của `s^2`. Xác định chính xác sai số chuẩn cho `s` rất phức tạp. Tuy vậy ta có thể sử dụng công thức gần đúng sau:

Dữ liệu lấy tại đây

Trong phần này trình bày cách xây dựng khoảng tin cậy cho trung bình của một tổng thể bằng SPSS.


Cách 1-Dùng chức năng Explore trong Descriptive Statistic


Bước 1: Trên thanh công cụ, chọn Analyze > Descriptive Statistics > Explore...

Bước 2: Trong cửa sổ Explore, ta đưa biến mong muốn vào ô Dependent List, trong phần Display ta chọn Statistics (nếu chỉ muốn nhận thông tin về khoảng tin cậy), sau đó nhấn nút Statistics ở cột bên phải kế ô Dependent List.

Bước 3: Sau khi bấm vào nút Statistics cửa sổ Explore: Statistic hiện lên, ta click chọn ô Descriptive sau đó nhập độ tin cậy vào ô Confidence Interval for Mean.

Bước 4: Sau đó bấm Continue để trở lại cửa sổ Explore, cuối cùng bấm Ok để nhận kết quả.


Cách 2-Dùng chức năng Compare Means


Bước 1: Trên thanh công cụ chọn Analyze > Compare Means > One-Sample T Test...

Bước 2: Cửa sổ One-Sample T Test hiện lên, ta đưa biến mong muốn vào ô Test Variable(s) (ta có thể đưa nhiều biến cùng lúc)

Bước 3: Bấm vào nút Options để điều chỉnh độ tin cậy là 90 sau đó bấm Continue để trở về cửa sổ trước

Ước lượng trung bình tổng thể là gì?

Ước lượng điểm của một tham số tổng thể là cách thức tính toán một giá trị đơn lẽ của tham số tổng thể dựa trên dữ liệu mẫu. Ước lượng khoảng của một tham số tổng thể là cách thức tính toán 2 giá trị dựa trên dữ liệu mẫu, từ đó tạo nên một khoảng được kỳ vọng chứa tham số thống kê của tổng thể.

Hệ số đó tin cậy là gì?

Hệ số tin cậy (confidence coefficient): Xác suất mà khoảng tin cậy bao quanh tham số được ước lượng. Giả sử chúng ta có một ước lượng không chệch với tham số tổng thể mà phân phối mẫu của nó tuân theo phân phối chuẩn hoặc xấp xỉ chuẩn.

Giá trị ước lượng là gì?

Một ước lượng là một giá trị x (x nhỏ) được tính toán trên một mẫu được lấy một cách ngẫu nhiên, do đó giá trị của x là một biến ngẫu nhiên với kì vọng E(x) và phương sai V(x). Nghĩa là giá trị x có thể dao động tùy theo mẫu thử, nó có ít cơ hội để có thể bằng đúng chính xác giá trị X (X lớn) mà nó đang ước lượng.

Ước lượng không chênh lệch là gì?

Trong lý thuyết thống kê, một ước lượng được gọi là không chênh lệch nếu giá trị kỳ vọng của nó bằng chính giá trị thực sự của tham số mà nó ước lượng. Điều này có nghĩa là trung bình của ước lượng phải xấp xỉ bằng giá trị thực sự của tham số cần ước lượng.