Sai số của ước lượng là gì

Độ lệch chuẩn của một phân phối mẫu được gọi là sai số chuẩn (Standard Error). Trong quá trình lấy mẫu, ba đặc trưng quan trọng nhất bao gồm: tính đúng đắn, sai số và độ chính xác. Có thể nói rằng:

  • Ước lượng thu được từ bất kỳ mẫu nào cũng chính xác xét theo khía cạnh rằng nó khác với các tham số chung. Vì tham số chung chỉ có thể xác định bởi một khảo sát mẫu, nên chúng thường có giá trị không xác định và sai lệch thực sự giữa ước lượng mẫu và tham số chung không thể được đo đạc.
  • Hàm ước lượng không bị sai số nếu giá trị trung bình của phép ước lượng có được từ các mẫu thử ngang bằng với tham số chung.
  • Dù cho hàm ước lượng không bị sai số, một mẫu độc lập vẫn thường có ước lượng không chính xác như đã nêu ra trước đó, sự không chính xác đó không thể được đo lường. Tuy nhiên hoàn toàn có thể đo sự chính xác, nghĩa là phạm vi mà giá trị thực sự của tham số chung sẽ bị sai lệch, sử dụng định nghĩa về sai số chuẩn.

Công thức

\(SE_\bar{x} = \frac{s}{\sqrt{n}}\)

Với –

  • \({s} \)= Độ lệch chuẩn
  • \({n}\) = Số quan trắc

Ví dụ

Câu hỏi:

Tính sai số chuẩn của dữ liệu riêng lẻ sau:

Items

14

36

45

70

105

Lời giải:

Đầu tiên, chúng ta tìm trung bình số học \( \bar{x}\)

\(\bar{x} = \frac{14 + 36 + 45 + 70 + 105}{5} \\[7pt] \, = \frac{270}{5} \\[7pt] \, = {54}\)

Sau đó, tính độ lệch chuẩn \({s}\)

\(s = \sqrt{\frac{1}{n-1}((x_{1}-\bar{x})^{2}+(x_{2}-\bar{x})^{2}+...+(x_{n}-\bar{x})^{2})} \\[7pt] \, = \sqrt{\frac{1}{5-1}((14-54)^{2}+(36-54)^{2}+(45-54)^{2}+(70-54)^{2}+(105-54)^{2})} \\[7pt] \, = \sqrt{\frac{1}{4}(1600+324+81+256+2601)} \\[7pt] \, = {34.86}\)

Cuối cùng là sai số chuẩn \( SE_\bar{x}\)

\(SE_\bar{x} = \frac{s}{\sqrt{n}} \\[7pt] \, = \frac{34.86}{\sqrt{5}} \\[7pt] \, = \frac{34.86}{2.23} \\[7pt] \, = {15.63}\)

Sai số chuẩn của các số đã cho là 15.63.

Tỉ lệ tập tổng thể bị lấy mẫu càng nhỏ, nghĩa là ảnh hưởng của tích này càng thấp vì tích hữu hạn sẽ tiến lại gần 1 và ảnh hưởng tới độ tầm thường của sai số chuẩn. Vì vậy nếu kích thước mẫu nhỏ hơn 5% tập tổng thể, tích hữu hạn bị bỏ qua.

xDuLieu ⮞Thống kê ⮞Ước lượng ⮞Ước lượng điểm

Trong ước lượng điểm, chúng ta gán cho thông số cần ước lượng một giá trị trên cơ sở khảo sát, tính toán số thống kê của một hay nhiều mẫu. Trong phần này ta sẽ xem xét phương pháp ước lượng cho trung bình, tỷ lệ và phương sai (hay độ lệch chuẩn).

Ước lượng giá trị trung bình

Để ước lượng trị trung bình, ta thường sử dụng định lý giới hạn trung tâm có nội dung như sau:

Một tổng thể có trung bình là `mu` và phương sai là `sigma^2`. Ta thu thập nhiều mẫu có cùng kích thước `n`, thì ta thu được nhiều trị trung bình `bar x`. Khi số lượng mẫu thu thập đủ lớn thì các giá trị `bar x` này có phân phối chuẩn với trị trung bình là `mu` và độ lệch chuẩn là `sigma//sqrt(n)`.

Vì vậy trung bình của mẫu `bar x` có thể dùng để làm ước lượng không chệch cho trung bình của tổng thể `mu`.

Khi trình bày giá trị của ước lượng điểm, ta có thể đưa vào giá trị của sai số chuẩn. Đối với trung bình, sai số chuẩn được tính theo công thức:

trong đó `s` là độ lệch chuẩn của mẫu, `n` là số phần tử của mẫu.

Thí dụ

Trong một phân xưởng, sau khi cân trọng lượng 30 hộp thịt, ta thu được kết quả trung bình là 365,20 g, Ta dùng giá trị này để làm trọng lượng trung bình cho tất cả các hộp thịt cùng cỡ do phân xưởng sản xuất.

Cũng từ số liệu của 30 hộp thịt trên, ta tính được độ lệch chuẩn là 12,40 g.

Do đó sai số chuẩn là : `SE=s/sqrt(n)=(12,4)/sqrt(30)=2,26`

Vậy ta có thể ghi : `M_(tb)=365,20+-2,26` g


Ước lượng tỷ lệ

Ta có thể dùng tỷ lệ `p` của mẫu để ước lượng cho tổng thể. Sai số chuẩn của ước lượng tỷ lệ là:

trong đó `p` là tỷ lệ các phần tử có tính chất khảo sát của mẫu.

Thí dụ : Để đánh giá mức độ sử dụng máy điều hòa tại quận Q, người ta điều tra một mẫu gồm 150 gia đình. Kết quả điều tra cho thấy có 48 gia đình sử dụng máy điều hòa.

Vậy tỷ lệ gia đình sử dụng máy điều hòa của mẫu là `48//150=0,320` (hay 32%) và ta có thể sử dụng giá trị này để ước lượng cho tỷ lệ gia đình của quận Q sử dụng máy điều hòa.

Sai số chuẩn của ước lượng này là : `SE=sqrt((0,32xx0,68)/150)=0,038`

Vậy tỷ lệ gia đình ở quận Q sử dụng máy điều hòa được ước lượng là `0,320+-0,038` (hay `32,0+-3,8` %)


Ước lượng phương sai

Khi ta đã có toàn bộ số liệu của một tổng thể, thì phương sai của tổng thể được tính bằng công thức:

`sigma^2=(sum_(i=1)^N (x_i-mu)^2)/N` (4)

Tuy nhiên khi ta có số liệu của một mẫu, thì phương sai của mẫu lại được tính bằng công thức:

`s^2=(sum_(i=1)^n (x_i-bar x)^2)/(n-1)` (5)

Ta thấy có sự khác biệt giữa hai công thức (4) và (5). Lý do là để có thể ước lượng cho phương sai của tổng thể thì ta phải dùng công thức (5) thì ước lượng mới không chệch.

Khi biến ngẫu nhiên có phân phối chuẩn thì sai số chuẩn cho ước lượng phương sai được tính bằng công thức :

`SE=sqrt(2/(n-1))\ s^2` (6)

Ước lượng cho độ lệch chuẩn

Về mặt lý thuyết, khi ta sử dụng độ lệch chuẩn `s` tính từ công thức (5) để ước lượng cho độ lệch chuẩn `sigma` của tổng thể thì đó là ước lượng chệch. Tuy nhiên do mức độ chênh lệch không lớn nên trong thực tế ta vẫn dùng `s` để ước lượng cho `sigma`.

Mặc dù độ lệch chuẩn `s` là căn bậc hai của phương sai `s^2`, nhưng sai số chuẩn của `s` không phải là căn bậc hai của sai số chuẩn của `s^2`. Xác định chính xác sai số chuẩn cho `s` rất phức tạp. Tuy vậy ta có thể sử dụng công thức gần đúng sau:

Sai số của ước lượng là gì
Sai số của ước lượng là gì
Sai số của ước lượng là gì