Chuỗi thời gian là gì

                                           I.                        KHÁI NIỆM

                                                                  1.                        Dự báo theo thời gian

                                                                  2.                        nh hưởng chu kỳ sống của sản phẩm

                                                                  3.                        Các loại dự báo

                                        II.                        CÁC CÁCH TIẾP CẬN DỰ BÁO

                                                      1.            Các phương pháp định tính

                                                      2.            Các phương pháp định lượng

                                                      3.            Tám bước tiến hành dự báo

                                     III.                        DỰ BÁO THEO CHUỔI THỜI GIAN

                                     IV.                        CÁC PHƯƠNG PHÁP LÀM TRƠN

                                                                  1.                        Phương pháp làm trơn với trung bình động

                                                                  2.                        Phương pháp làm trơn với đa thức

                                                                  3.                        Phương pháp làm trơn với hàm mũ

                                                                  4.                        Dự báo theo phương pháp san bằng số mũ

                                                                  5.                        Phương pháp làm trơn với số mũ hiệu chỉnh

                            V.            PHƯƠNG PHÁP PHÂN RÃ

                                                      1.            Phân tích xu thế

                                                      2.            Đánh giá sự biến đổi theo mùa

                         VI.            PP BOX-RENKINS

                                                      1.            Tính ổn định của một chuỗi

                                                      2.            Hàm số tự tương quan đơn và tự tương quan riêng phần

                                                      3.            Kiểm định nhiễu trắng

                                                      4.            Mô hình AR (p)(Auto Regressif)

                                                      5.            Mô hình MA (q)(Moving Average)

                                                      6.            Mô hình ARMA (p, q)

                                                      7.            Mô hình ARMA mở rộng: ARIMA, SARIMA

MÔ HÌNH CHUỖI THỜI GIAN  

I. KHÁI NIỆM

Dự báo là nghệ thuật và khoa học tiên đoán các sự kiện xảy ra trong tương lai.

Những dữ liệu quan sát liên tục cho một hiện tượng (vật lý, kinh tế ...) trong một khoảng thời gian sẽ tạo nên một chuỗi thời gian. Ví dụ, doanh số của công ty trong 20 năm gần đây, hoặc nhiệt độ ghi nhận tại một trạm quan trắc khí tượng, hoặc công suất điện năng tiêu thụ trong một nhà máy, đó là các ví dụ điển hình cho một chuỗi thời gian. Với chuỗi thời gian ta thường biểu thị trong một mặt phẳng với trục hoành biểu thị thời gian và trục tung biểu thị giá trị biến quan sát. Phân tích chuỗi thời gian có mục đích nhận đang và tập hợp lại các yếu tố, những biến đổi theo thời gian mà nó có ảnh hưởng đến giá trị của biến quan sát.

Dự báo dựa trên cơ sở của các sự kiện trong quá khứ hoặc sử dụng một số mô hình toán học để dự đoán kết quả trong tương lai  

1 Dự báo theo thời gian

TOP

Người ta chia ra làm 3 loại dự báo  

·         Dự báo ngắn hạn

·         Dự báo trung hạn: thời gian dự báo từ 3 tháng đến 3 năm

·         Dự báo dài hạn: thời gian dự báo lớn hơn 3 năm

2 Chu kỳ sống của sản phẩm

TOP

    Doanh số    

Chuỗi thời gian là gì

            H. 1     Chu kỳ sống của một sản phẩm

Một cách tổng quát ta có thể có 4 yếu tố cần nghiên cứu như sau:  

Có ba loại dự báo chính: dự báo kinh tế, dự báo công nghệ và dự báo nhu cẦu. Trong phạm vi của bài giảng ta chỉ đề cập đến dự báo về nhu cầu.  

II. CÁC CÁCH TIẾP CẬN DỰ BÁO

1 Các phương pháp định tính

TOP

    1.1 Lấy ý kiến ban giám khảo thuộc ban điều hành

    1.2 Lẩy ý kiến hỗn hợp của ll bán hàng

    1.3 Phương pháp Delphi

    1.4 Nghiên cứu thị trường người tiêu dùng

2 Các phương pháp định lượng

TOP

Có hai mô hình :

·         Mô hình chuỗi thời gian

·         Mô hình nhân quả

    2.1 Mô hình chuỗi thời gian

Các phương pháp dự báo nầy trên cơ sở sau tương lai là hàm số của quá khứ, bao gồm các phương pháp :

            1. phương pháp bình quân đơn gián

            2. phương pháp bình quân di động

            3. phương pháp san bằng số mũ

            4. phương pháp hoạch định theo xu hướng

  2.2 Mô hình nhân quả  

Trong mô hình nhân quả  giá trị dự báo được xem là hàm số của các yếu tố hoặc các biến số có liên quan, ta có :

            5. phương pháp tương quan (xem phần B )

3 Tám bước tiến hành dự báo

TOP

Bao gồm

            1. Xác định mục tiêu cần dự báo

            2. Chọn lựa loại hàng cần được dự báo

            3. Xác định thời đoạn dự báo

            4. Chọn mô hình dự báo

            5. Tập hợp các số liệu cần thiết để tính dự báo

            6. Phê chuẩn mô hình dự báo

            7. Tiến hành dự báo

            8. Áp dụng kết quả dự báo  

III. DỰ BÁO THEO CHUỔI THỜI GIAN  

    Phân tích chuỗi thời gian có nghĩa là chia nhỏ các dữ liệu đã qua thành các thời kỳ nhỏ hơn để dễ dàng phân tích, bốn thành phần đặc trưng của chuỗi thời gian là : xu hướng; theo mùa, chu kỳ và biến đổi ngẫu nhiên, xem H. 2 .

Một cách tổng quát ta có thể có 4 yếu tố cần nghiên cứu như sau:  

a. Xu thế (T): Đó là sự thay đổi của biến quan trắc Y xét trên một thời gian dài.  

b. Chu kỳ của hiện tượng (C): Đó là thời gian mà hiện tượng sẽ lặp lại nó phối hợp với xu thế T trong chu kỳ nhiều năm.

c. Biến đổi theo mùa (S): Xét đến sự biến đổi có tính tuần hoàn trong một chu kỳ. -

d. Dao động ngẫu nhiên (I): Xét đến sự dao động ngẫu nhiên xung quanh xu thế, điều này có thể làm ảnh hưởng đến chu kỳ và biến đổi theo mùa của chuỗi quan sát.

 

      H.2            Các đặc trưng của chuỗi thời gian [25]

Để phân tích một chuỗi thời gian ta có nhiều phương pháp và ta sẽ giới thiệu sau. Trong chương này ta sẽ đề cập đến các nội dung chính sau đây:

* Các phương pháp làm trơn 1 đường cong bậc cao;

* Các phương pháp cơ bản nghiên cứu chuỗi thời gian

IV        CÁC PHƯƠNG PHÁP LÀM TRƠN  

Để có thể giới thiệu lại giá trị tất cả các quan trắc cho một đại lượng khảo sát theo thời gian, về nguyên tắc ta có thể sử dụng một đa thức có bậc n đủ lớn thích hợp. Tuy vậy, sự ước lượng các hệ số của đa thức này có thể không chính xác khi n lớn. Trong trường hợp này để có thể giảm bậc n ta sẽ <làm trơn> đường cong đi qua các số liệu. Nói một cách khác, thay vì đường cong sẽ đi qua toàn bộ giá trị quan trắc ban đầu, đường cong làm trơn này chỉ đi qua các giá trị có tính << đại biểu>> được tính từ các giá trị ban đầu Quá trình thực hiện để nhận được các giá trị đại biểu này ta gọi là quá trình <<làm trơn>> Sau đây ta sẽ giới thiệu các phương pháp làm trơn hay sử dụng trong thực hành.

  • Phương pháp làm trơn với trung bình động
  • Phương pháp làm trơn đa thức
  • Phương pháp làm trơn với hàm mũ
  • Phương pháp làm trơn với hàm mũ hiệu chỉnh

1          Phương pháp làm trơn với trung bình động

TOP

Ta gọi chuồi yt là chuỗi nhận được từ chuối quan trắc xt bởi phương pháp trung bình động được định nghĩa bởi biểu thức sau.  

yt=    với  m+l t n-m

trong đó n chỉ sổ lượng quan trắc và  là hệ số thỏa mãn tính chất sau

chuổi được bỉến đổi được gọi là trung bình động bậc (2m+1) từ chuổi ban đầu. Ta lưu ý với dạng đối xứng khi biến đổi trên sẽ không mất tính tổng quát của bài toán vì chúng ta có thể giả sử 1 vài hệ số trong phép biến đổi bằng 0.  

Chú ý:

Phương pháp nầy có khuyết điểm trong trường hợp chúng ta muốn áp dụng để làm dự báo.  Thật vậy m quan trắc gần nhất  xn-m-1; …; xn  không thể được làm trơn, do đó nó không giữ vai trò trong việc ước lượng xu thế của chuổi số liệu. Trong khi đó đây là yếu tố quan trọng nhất để ước lượng các giá trị trong tương lai  

Để xác định các hệ số  ak tối ưu người ta chứng minh được rằng bài toán sẽ tưong đương với việc giải phương trình sau.

min  với  diều kiện ràng buộc

Ghi chú: Điều kiện trên bắt nguồn từ điều kiện cực tiểu cho phương sai của chuỗi thặng dư   trong mô hình  Với  

Để tìm lời giải cho bài toán trên ta sẽ áp dụng phương pháp nhân tố Lagrange  bằng cách cực tiểu phương trình R sau:

R =  

Đạo hàm riêng phần bậc 1 cho hàm R và cho triệt tiêu ta có:

Kể đến điều kiện ràng buộc ta có:

Do đó :

 

Tóm lại, sự làm tròn tối ưu là sự làm trơn có các hệ số  là hằng số

  Ví dụ 1

Cho một chuỗi (x1, x2 x3 x4) xác định chuỗi Xi bằng phương pháp trung bình động bậc 3.

Giải:                                            X2=( x1+ x2+ x3)/3

    X3=( x1+ x2+ x3)/3

Chú ý    

  • Theo đinh nghĩa, bậc của phương pháp) trung bình động luôn luôn lẽ (2m+l)
  • ( Trong thực hành đôi khi ta cũng dùng bậc chẵn, tuy nhiên trong những trường hợp) như vậy bắt buộc ta phải áp dụng phương pháp trung bình động (o bậc chẵn 2 lần liên tiếp (vi dụ bậc 4 và sau đó là bộc 2). Điều này đế đảm bảo cho ta không có vấn đề lệch về thời điếm khi chuyển đói từ chuỗi nguyên thủy in chuỗi được làm trơn
  • Áp dụng phương pháp trung bình đẳng liên tiếp hai hoặc nhiều lần hơn lên một chuỗi quan trắc khi chuỗi quan trắc có quá nhiều nhiễu. Trong trường hợp phải áp dụng hai lần phương pháp trung bình động lên chuỗi quan trắc ta nên áp dụng trung bình động bậc cao và sau đrl là bậc thấp.
  • Phương pháp trung bình động sẽ không làm biến dạng chuỗi xu thê có dạng

       xt = at+b.  

THÍ DỤ 1 : Cửa hàng 815 Trần Hưng Ðạo bán máy D9 theo báng dưới đây , họ dùng bình quân di động ba tháng để dự đoán mức bán cho 3 tháng tới :  

Tháng

Số máy bán

BÌNH QUÂN di động 3 Tháng

1

10

2

12

3

13

4

16

(10 +12 +13) /3 =

11.67

5

19

(12 +13 +16) /3 =

13.67

6

23

(13 +16 +19) /3 =

16.00

7

26

(16 +19 +23) /3 =

19.33

8

30

(19 +23 +26) /3 =

22.67

9

28

(23 +26 +30) /3 =

26.33

10

18

(26 +30 +28) /3 =

28.00

11

16

(30 +28 +18) /3 =

25.33

12

14

(28 +18 +16) /3 =

20.67

  Ví dụ 2

Doanh số (CA) của một công ty Z trong vòng 5.5 năm gần đây được ghi lại trong bảng số liệu sau. Kết quả làm trơn số liệu (CA) bằng phương pháp trung bình động bậc 3 (M3) và trung bình động kép M2 (bậc 4 sau đó bậc 2) được trình bày trong bảng sau:  

Bàng 1

Quí

CA

M3

M2

(tỷ VNĐ)

(tỷ VNĐ)

(tỷ VNĐ)

1

20

2

30

3

35

28,33

4

50

38,33

34,13

5

23

36,00

35,25

6

36

36,33

36,63

7

40

33,00

39,75

8

70

48,67

43,13

9

30

46,67

44,50

10

40

46,67

46,25

11

50

40,00

48,13

12

75

55,00

49,00

13

32

52,33

49,25

14

40

49,00

49,88

15

55

42,33

50,88

16

78

57,67

51,63

17

35

56,00

52,38

18

43

52,00

53,38

19

60

46,00

54,25

20

80

61,00

55,75

21

45

61,67

57,88

22

50

58,33

  Kết quả trên trình bày dưới dạng đồ thị như sau:

  Hình  Làm trơn số liệu bằng phương pháp trung bình động

  Ghi chú:

M1: số liệu quan trắc ban đầu.

M3: trung bình động bậc 3.

M2: trung bình động 2 lần (bậc 4 sau đó là bậc 2).

  a nhận xét, với áp dụng phương pháp trung bình động hai lần cho ta chuỗi số liệu << trơn >> hơn nhiều so với chỉ áp dụng trung bình động một lần duy nhất.  

2          Phương pháp làm trơn đa thức

TOP

Về nguyên tắc, sự làm trơn được xem như sự ước lượng xu thế tại một điểm bởi trung bình các giá trị kế cận điểm xét. Ngoài ra xu thế f(t) còn có thể xấp xi bởi một đa thức bằng cách tiến hành khai triển Taylor của hàm f chung quanh giá trị i. Gọi p là bậc của đa thức ta có :

 

Để đơn giản ta chọn gốc tọa độ tại trung tâm của các quan trắc. Các hệ số của đa thức f sẽ được xác định bởi phương pháp bình phương tối thiểu, đó chính là lời giải của phương trình sau:  

min  

Lời giải; tương ứng cũa phương trình trên chính là hệ (p+1) phương trình có được từ đạo hàm riêng phần theo a, và cho triệt tiêu của hàm số

 

 

hay

với    0  i  p cho ta hệ (p+1) phương trình cần tìm Về nguyên tắc. hệ phương trình uày cho phép xác đmh các hê số a.  

Chú ý: Do cách chọn gốc tọa độ như trên ẩn số cần thiết của bài toán chỉ cần xác đinh a0 vì ta biết xu thế ước lượng y0=f(o)=ao  

3          Phương pháp làm trơn với hàm mũ

TOP

Đây là phương pháp iàm trơn tuyến tính. đươc đinh nghĩa bới biểu thức hồi quy như sau:

S(t)=S(t-1)+ *[xt -S(t-1)]

hay

S(t)= *xt+(1- )*S(t-1)

với      µ ]0;1[ đươc gọi là hằng số làm trơn  

Khai t~iển biểu thức trên ta có:

và cho n tiế~ về vô cùng. blc~u ~hức trên cho ta:  

Biếu thực này cho thấy đây là tổ hợp tuyến tính có giới hạn vô cùng của các quan trắc trong quá khứ với trọng số cho số hạng thử k là   Đây là một cấp số nhân có công bội nhỏ hơn 1 (các trọng số sẽ giảm dần khi ta tiến càng xa về hướng các số liệu trong quá khứ) Nói một cách khác đi khi ta tính giá trị làm trơn tại thời điểm i. giá trị này sè phụ thuộc càng lúc càng giảm dần theo các giá tri xt, xt-1. xt-2; xt-3  

Ta có thể kiểm tra dễ dàng tính chất sau đây củ a các trọng số.

Xét cho một chuổi số liệu cần làm trơn không có tinh xu thế và các quan trắc độc lập có:

E(xt)=m và V(xt)=s2  

Chuỗi  làm trơn yt = St có các tính chất sau

chúng ta nhận thấy đây là toán tử ước lượng không lệch và có phương sai nhỏ hơn phương sai của chuỗi ban đầu xt

Thật vây:

Chúng ta cũng lưu ý thông số m là giá trị trung bình của chuỗi. Và hoàn toàn hợp lý, khi chúng ta tính giá trị ước lượng tại thời điểm t là giá trị trung bình của các số liệu ban đầu tính cho đến thời điểm t. Đơn giản đó là giá trị trung bình.có trọng số, theo quy luật là ảnh hưởng của giá trị càng xa trong quá khứ lên giá trị cần ước lượng sẽ càng bé. .

Trong trường hợp chuỗi ban đầu có chứa một xu thế, ví dụ có dạng sau đây:

E(xt)= at + b

chúng ta sẽ có:

Ta thấy, toán tử ước lượng bị lệch với giá trị là: a *

Để loại bỏ độ lệch này, ta phải tiến hành làm trơn chuỗi S(t) một lần nữa; điều này có nghĩa ta sẽ áp dụng vào chuỗi ban đầu x' một t(lán tứ làm trơn lũy thừa bậc 2. Nó sẽ được định nghĩa từ phương pháp làm trơn đơn, ký hiệu Sl(t) bởi biểu thức hồi quy sau:

S2 (t) = sS1(t) + (l - s)S2 (t - l)  

Một Cách tổng quát, nếu trong chuỗi ban đầu có một thế bậc (p-1) chúng ta phải áp dụng toán tử làm trơn lũy thừa bậc p, Sp, định nghĩa bởi công thức hồi quy như sau:

Sp (t) =aS1(t) + (l - a)S2 (t - l)  

Ví dụ 3

Doanh số (CA) của một công ty Z trong vòng 5.5 năm gần đây được ghi lại trong bảng số liệu sau. Kết quả làm trơn số liệu CA bằng phương pháp số mũ với lần lượt 1=0.3 và =0.6 được trình bày trong bảng sau:  

247

Bảng 6.2

Quí

CA       

(tỷ VNĐ)

làm trơn với

a=0.6

làm trơn với

a=0.3

1

20

20

20

2

30

23,00

26,00

3

35

26,60

31,40

4

50

33,62

42,56

5

23

30,43

30,82

6

36

32,10

33,93

7

40

34,47

37,57

8

70

45,13

57,03

9

30

40,59

40,81

10

40

40,41

40,32

11

50

43,29

46,13

12

75

52,80

63,45

13

32

46,56

44,58

14

40

44,59

41,83

15

55

47,72

49,73

16

78

56,80

66,69

17

35

50,26

47,68

18

43

48,08

44,87

19

60

51,66

53,95

20

80

60,16

69,58

21

45

55,61

54,83

22

50

53,93

51,93

  Kết quả dưới dạng đồ thị như sau. Ta thấy, với a càng bé, mức độ lâm trơn đường cong ban đầu sẽ càng nhiều.

Ghi chú:

M1:quan trắcban đầu

M2: làm trơn vớiµ=o.3

M3: làm trơn vớiµ=o.6

Hình    Làm trơn số liệu bầng phương pháp số mũ

chọn hằng số san bằng

Sai số dự báo = nhu cầu - dự báo  

Thông số dùng để đánh gía hắng số san bằng = là độ lệch tuyệt đối trung bình MAD [Mean Absolute Deviation]  

MAD=  

Một phương pháp dự báo được chọn khi nó cho gía trị  MAD nhỏ hơn các phương pháp  khác

VÍ DỤ 4

Dùng phương pháp san bằng số mú để  dự báo với a = 0.1 và a = 0.5  

Quí

Số tấn được bốc dở thực tế

Số dự báo báo với a =0.1

dự báo với a=0.1

sai số

dự báo với (=0.5

Sai số

1

180

175

175

5.0

175

5.0

2

168

175+(180-175)*0.1

175.5

7.5

177.5

9.5

3

159

175.5+(168-175.5)*0.1

174.8

15.8

172.8

13.8

4

175

174.8+(159-174.8)*0.1

173.2

1.8

165.9

9.1

5

190

173.2+(175-173.2)*0.1

173.4

16.6

170.4

19.6

6

205

173.4+(190-173.4)*0.1

175.0

30.0

180.2

24.8

7

180

175.0+(205-175.0)*0.1

178.0

2.0

192.6

12.6

8

182

178.0+(180-178.0)*0.1

178.2

3.8

186.3

4.3

9

82.5

98.6

MAD

10.3

12.3

  Theo kết quả phân tích trên thì chọn ( bằng 0.1 thì tốt hơn là 0.5 vì nó cho tri MAD nhỏ hơn.  

4 Dự báo theo phương pháp san bằng số mũ có điều chỉnh xu hướng

TOP

  THÍ DỤ 5 = Nhà máy SINCO dùng mô hình san bằng số mũ để dự báo nhu cấu chà bóng gạo, người ta thấycó ảnh hưởng của xu hướng. Các hằng số san bằng được cho (=0.1 và (=0.4 . Giả sử Tháng 1 phỏng đoán bán được 11 đơn vị

Tháng

Nhu cầu

Ft [không có xu hướng]

Xu hướng

dự báo điều chỉnh FITt

1

12

11

0

11

2

17

11.20

0.08

11.28

3

20

12.36

0.54

12.90

4

19

13.89

1.16

15.04

5

24

14.91

1.56

16.47

6

26

16.73

2.29

19.02

7

31

18.58

3.03

21.62

8

32

21.07

4.03

25.09

9

36

23.25

4.90

28.15

5          Phương pháp làm trơn với hàm mũ hiệu chỉnh

TOP

CƠ sở của phương pháp cũng giống như phương pháp trình bày trong mục 6.2.3, tuy nhiên trong phương pháp này ta có kể thêm vào một đại lượng liên quan đến sự sai biệt của dự báo tại thời điểm i và đại lượng hiệu chỉnh vào thời điểm (t-1). Gọi xi là chuỗi quan trắc, F(t) là giá trị cho bởi phương pháp làm trơn hàm mũ có hiệu chỉnh, S(t) là chuỗi cho bởi phương pháp làm trơn hàm mũ và T(t) là đại lượng hiệu chỉnh, phương pháp được định nghĩa bởi phương trình sau:

F(t) = S(t) + T(t)  

trong đó :

T(t) = T(t – 1)+ b*[S(t)-S(t- 1)]

với Îb]0;1[  

Ví dụ 4

Sử dụng lại số liệu chi ví dụ trên và sử dụng phương pháp làm trơn hàm mũ hiệu chỉnh với các giá trị của a=0,7 và b=0.2.

Bảng sau đây trình bày kết quả với giá trị b=0.2.  

  V        PHƯƠNG PHÁP PHÂN RÃ  

MÔ hình giới thiệu chuỗi thời gian, được thiết lập trên giả thiết cho tất cả các chu kỳ đã cho, biểu thị sự quan hệ của 4 yếu tố trên. Ta có các loại mô hình cơ bản sau:

Mô hình loại 1: Y = T + C + S + 1  mô hình tổng

Mô hình loại 2: Y = T x C x S x I   mô hình tích

Mô hình loại 3: Y = T x C x S + I   mô hình hỗn hợp

Trong đó mô hình loại 2 là mô hình phổ biến nhất và ta sẽ giới thiệu chi tiết.  

Đây là một phân tích liên quan đến chuỗi nhiều năm, do đó ta sẽ sử dụng số liệu hàng năm để phân tích. Một cách tổng quát ta cần phải có một chuỗi dài ít ra là 15 năm

Để đánh giá yếu tố xu thế, phương pháp sử dụng phổ biến là phương pháp bình phương tối thiểu. Đây là phương pháp cho phép xác định được đường cong (thảng) hoặc mặt phầng (siêu mặt phẳng), đi qua <<gần>> các số liệu quan trắc nhất. Trong trường hợp cá biệt khi nhận thấy xu thế của biến khảo sát trong thời gian dài là tuyến tính, phương trình sẽ xác định bởi:

y = a + bx

Với x: biểu thị thời gian (năm)

a, b: các thông số được xác định đường thẳng tính được từ phương pháp bình phương tối thiểu.  

Hình 6.3

Gọi Dyi là khoảng cách thẳng đứng từ điểm quan sát (xi,yi)đến đường thẳng cần xác đinh. (xem Hình 6.3)  

Ta định nghĩa:

D =

Đường thẳng cần xác định là đường thẳng sao cho giá trị D là nhỏ nhất (bình phương tối thiểu).

Ta có:

D =

  Đây là một hàm hai biến a và b, để cho D cực trị (với ý nghĩa vật lý của bài toán ta biết đó là cực tiểu) ta phải có:

 

Từ đó : S2[yt - (a+bx,)l  =0

S2[yt - (a + bx]*xt = 0

Giải h~ phương trình trên ta có:

 Trong trường hợp xu thế không phải là tuyến tính, ta có thể xét đến dạng đường cong hàm mũ y = a*b*x hoặc dạng parabol y = a + b*x + c*x2. các thông số a, b, c vẫn xác định dựa vào khái niệm bình phương tối thiểu mà ta vừa nghiên cứu trên. ờ đây ta

không đi vào chi tiết.  

2          Đánh giá sự biến đổi theo mùa

TOP

Để nhận biết ảnh hường của thành phần mùa lên chuỗi thời gian khảo sát ta dùng thông số gọi là chỉ số mùa. Nó liên kết từng tháng hay từng quý trong một năm của chuỗi số liệu. Các chỉ số này sẽ được xác định và hiệu chỉnh sao cho tổng giá trị của nó trong một năm sẽ bầng 12 nếu số liệu phân tích theo tháng và sẽ bằng 4 nếu là theo mùa (4 mùa trong 1 năm). Đối với sản xuất, đánh giá ảnh hưởng mùa có tác dụng làm gia tăng hay làm giảm lên xu thế thường được quan tâm khảo sát. Phương pháp sử dụng phổ biến để đánh giá chỉ số mùa là thiết lập tỷ số giữa giá trị quan trắc và giá trị tương ứng cho bởi đường xu thế. Đường xu thế có thể có từ các phương pháp khác nhau như: trung bình động, bình phương tối thiểu...

Từ đó, chỉ số mùa được tính như sau:  

is=giá tri quan trắc / giá trị trung bình động

hoặc                 is=giá tri quan trắc / giá tri cho bởi y=a+bx  

sau khi có is cho từng tháng (quý) cho cả chuỗi số liệu, bước kế tiếp trong vấn đề này là loại bỏ các thành phần không bình thường. Để được như vậy, ta sẽ thiết lập danh sách các tỷ số này ở cùng thời điểm cho nhiều năm và sau đó là tính giá trị trung bình của nó. Như vậy ta sẽ nhận được 12 giá trị trung bình nếu là tính theo tháng hoặc là 4 giá trị nếu là tính theo quý. Cuối cùng là ta phải hiệu chỉnh lại các giá trị trung bình này sao cho tổng số của nó phải là 12 nếu tính theo tháng hoặc bằng 4 nếu tính theo quý, được ký hiệu là

   = 4 : nếu tính theo quý

= 12 : nếu tính theo tháng  

Sau khi các chỉ số mùa được xác định, vấn đề tiếp theo là ta sẽ sừ dụng nó vào việc loại bỏ thành phần mùa trong chuỗi thời gian khảo sát. Số liệu mới được nhận gọi là số liệu hiệu chỉnh biến đổi mùa (conigés des variations saisonnières, CVS). Sự hiệu chỉnh mùa này cho phép chúng ta muốn so sánh kết quả của các tháng khác nhau trong một mùa nhằm để biết nếu có sự tăng hay giảm đã xảy ra so với giá trị <bình thường>.

Và giá trị hiệu chỉnh mùa sẽ được tính như sau:

CVS =
橢橢ᙕᙕЉ뤳.簷簷슧Çȕ???lӴӴӴӴڬڬڬ.ૢ킎킎킎8탆Ƅܬɔ�׾�(���ᄆ&ᅲ.→
[1][1]揩揩揩揩揩揩$ȠPȥڬ?ﯭτᄆ??tối thiểu, để có được kết quả dự báo dài hạn cho giá trị hàng năm. Về dự báo ngắn hạn, ta bắt đầu bằng phép ngoại suy từ xu thế, và sau đó là hiệu chỉnh bởi sự

biến đổi mùa.  

Lưu ý trong trường hợp đơn vị của biến thời gian x là tính bầng năm khi xác định a và b bằng phương pháp bình phương tối thiểu để áp dụng cho trường hợp dự báo tháng phải thay đốt như sau:

Nếu là mùa:

2 Phân tích sự biến đổi theo chu kỳ và sự biến đổi ngẫu nhiên

Những giá trị năm của chuỗi thời gian chỉ có thể cho nhận thấy ảnh hưởng của xu thế và tính chu kỳ vì thành phần mùa và thành phần ngẫu nhiên đã bị loại vì nó được xem như ảnh hưởng ngắn hạn. Sự biến đổi của chu kỳ được đánh giá bởi tỷ lệ sau:

Sự giải thích ý nghĩa ác là tương đối đơn giản, nó cho ta thấy sự tăng hay giâm theo thời gian của giá trị quan trắc thực so với dự báo. Về giá trị của thành phần ngẫu nhiên R (còn gọi là thặng dư) nỏ được xác định từ tỷ số của chuỗi CVS và giá trị trung bình động

(trường hợp mô hình ưch).

  R = CVS /giá trị trung bình động

  Vi dụ

Một công ty kinh doanh đồ chơi trẻ em ghi nhận doanh thu (CA) cho 6 năm từ 1992 đến 1997 như sau (tính theo tỷ đồng):

  Bang 64  

Qui

Năm

1

2

2

1

1992

21

30

35

55

1993

24

36

40

75

1994

31

40

50

80

1995

33

40

55

83

1996

36

43

60

85

1997

46

50

a.      Hãy loại bỏ ảnh hưởng mùa bằng cách áp dụng hai lần liên tiếp trung bình động bậc 4 và bậc 2

b.      Xác định xu thế biểu diễn bởi đường thẳng bằng phương pháp bình phương tối thiểu. Từ đó xác định hệ số biến đổi theo mùa.

c.       Xác định chuổi CVS và xác định thành phần ngẩu nhiên tương ứng. Hãy dự báo doanh thu cho quý 3 và 4 năm 1997

Hướng dẫn

Bảng sau đây trình bày kết quả tính của phương pháp trung bình động (đầu tiên cho trung bình động bậc 4, sau đó là bậc 2). Hệsố biến đổi mùa và chuỗi CVS cũng như là thặng dư cho 2 loại mô hình tổng và tích cùng được giới thiệu:

Ghi chú:

Trim: Hệ số biến đổi mùa (cột đẩu là giá trị chưa hiệu chlnh, cột kế là giá trị đã hiệu chlnh)

  Bảng sau đây trình bày kết quả xác định đường thẳng xu thế cho bởi phương pháp bình phương tối thiểu. Hệ số biến đổi mùa và chuỗi CVS cũng như là thặng dư cho 2 loại mô hình tổng và tích cũng được giới thiệu. Và sau cùng là phần dự báo cho quý 3 và 4

năm l997

Bảng 6.5 Chuổi CVS với phương pháp bình phương tối thiểu - Dự báo  

Nam

Chu ky

t

CA

TB dong 4

TB dong 2

Ti so 3/5

Trim

CVS

Res (ad)

Res (mul)

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)=(3)/(7)

(9)=(8)-(5)

(10)=(8)/(5)

1

0

20

0.650

1992

2

1

30

0.836

3

2

35

33.75

34.125

1.026

1.030

33.985

-0.140

0.996

4

3

50

34.5

35.25

1.418

1.484

33.692

-1.558

0.956

1

4

23

36

36.625

0.628

0.650

35.366

-1.259

0.966

1993

2

5

36

37.25

39.75

0.906

0.836

43.074

3.324

1.084

3

6

40

42.25

43.125

0.928

1.030

38.839

-4.286

0.901

4

7

70

44

44.5

1.573

1.484

47.169

2.669

1.060

1

8

30

45

46.25

0.649

0.650

46.130

-0.120

0.997

1994

2

9

40

47.5

48.125

0.831

0.836

47.860

-0.265

0.994

3

10

50

48.75

49

1.020

1.030

48.549

-0.451

0.991

4

11

75

49.25

49.25

1.523

1.484

50.539

1.289

1.026

1

12

32

49.25

49.875

0.642

0.650

49.205

-0.670

0.987

1995

2

13

40

50.5

50.875

0.786

0.836

47.860

-3.015

0.941

3

14

55

51.25

51.625

1.065

1.030

53.404

1.779

1.034

4

15

78

52

52.375

1.489

1.484

52.560

0.185

1.004

1

16

35

52.75

53.375

0.656

0.650

53.818

0.443

1.008

1996

2

17

43

54

54.25

0.793

0.836

51.450

-2.800

0.948

3

18

60

54.5

55.75

1.076

1.030

58.259

2.509

1.045

4

19

80

57

57.875

1.382

1.484

53.908

-3.967

0.931

1

20

45

58.75

51.25

0.650

1997

2

21

50

43.75

0.836

3

22

1.030

4

23

1.484

  Ghi chú:

Dr. MC: Giá trị cho bởi phương trình đường thẳng được xác định từ phương  pháp bình phương tối thiểu vói a,b là các hệ số của đường thẳng  CA = bt + a

Res.(ad)      Thặng dư trường hợp mô hình tống.

Res. (mul)  Thang dư trường hợp mô hình tích  

He so bien doi theo mua

chua hieu chinh

da hieu chinh

Qui 1

0.643

0.650

Qui 2

0.829

0.836

Qui 3

1.023

1.030

Qui 4

1.477

1.484

Total

3.973

4.000

  b. Phương trình đường thẳng xu thế có dạng  y = 1.07*x + 36.05

  c.

Nam

Chu ky

t

CA

Dr MC

Trim chua hieu chinh

Trim

CVS

Du Bao

Res (ad)

Res (mul)

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

(10)

(3)/(4)

(3)/(6)

(7)-(3)

(5)/(6)

1

0

20

36.04

0.555

0.655

1992

2

1

30

37.12

0.808

0.840

3

2

35

38.19

0.916

1.025

34.158

-4.032

0.894

4

3

50

39.26

1.274

1.480

33.788

-5.472

0.861

1

4

23

40.33

0.570

0.655

35.091

-5.239

0.870

1993

2

5

36

41.4

0.870

0.840

42.853

1.453

1.035

3

6

40

42.47

0.942

1.025

39.037

-3.433

0.919

4

7

70

43.54

1.608

1.480

47.303

3.763

1.086

1

8

30

44.61

0.672

0.655

45.771

1.161

1.026

1994

2

9

40

45.68

0.876

0.840

47.615

1.935

1.042

3

10

50

46.75

1.070

1.025

48.797

2.047

1.044

4

11

75

47.82

1.568

1.480

50.682

2.862

1.060

1

12

32

48.89

0.655

0.655

48.822

-0.068

0.999

1995

2

13

40

49.96

0.801

0.840

47.615

-2.345

0.953

3

14

55

51.03

1.078

1.025

53.676

2.646

1.052

4

15

78

52.1

1.497

1.480

52.709

0.609

1.012

1

16

35

53.17

0.658

0.655

53.399

0.229

1.004

1996

2

17

43

54.24

0.793

0.840

51.186

-3.054

0.944

3

18

60

55.31

1.085

1.025

58.556

3.246

1.059

4

19

80

56.38

1.419

1.480

54.061

-2.319

0.959

1

20

45

57.45

0.783

0.655

68.656

11.206

1.195

1997

2

21

50

58.52

0.854

0.840

59.518

0.998

1.017

3

22

59.59

1.025

61.060

4

23

60.66

1.480

89.766

  Hiệu chỉnh hệ số biến đổi theo mùa theo bảng dưới đây và đưa giá trị hiệu chỉnh vào cột 6 của bảng bên trên

He so bien doi theo mua

chua hieu chinh

da hieu chinh

Qui 1

0.6490

0.6555

Qui 2

0.8335

0.8401

Qui 3

1.0181

1.0247

Qui 4

1.4731

1.4797

Total

3.9737

4.0000

  VI.     PHƯƠNG PHÁP BOX-JENKINS

1          Tính ổn định của một chuỗi

TOP

Trước khi xử lý một chuỗi thời gian nghiền cưu cặc tính ngẫu nhiên của nó là bước cần thiết cho phép ta đánh giá một cách tổng quát về số liệu nghiên cứu. Nếu kỳ vọng toán vô phương sai của nó thay đổi theo thời gian, chuỗi được xem như là không ổn định. Trong trường hợp ngược lại ta nói chuỗi ổn định. Xét chuỗi yt, về mặt toán học một chuỗi ổn định phải thỏa các điều kiện sau:

E(yt) = E(yt+m) = cte     m  

Var(yt) <     

Cov(yt ;yt+k) = E ((yt - )( yt+k- ) =  =hằng số

Với tính chất như vậy ta có thể thấy một nhiễu trắng (giới thiệu sau) là một chuỗi ổn định vì nó thỏa mãn tính chất nêu trên. Một chuỗi thời gian là ổn định khi nó là đại diện của một quá trình nghiên cứu ổn định. Nói một cách cụ thể hơn đó là chuối không có tính xu thế, không có tính chu kỳ

2          Hàm số tự tương quan đơn và tự tương quan riêng phần

TOP

Hệ số tương quan riêng phần hệ số dùng để đánh giá quan hệ giữa hai biến khi ảnh hưởng của biến thứ ba được loại trừ   

Hàm số tự tương quan rk nhằm xác định sự tương quan của chuỗi và chính nó nhưng lệch đi một chu kỳ k bất kỳ (xem bảng sau). Công thức xác định hàm số tương quan rk như sau:  

Với n số quan trắc,    giá trị trung bình của chuỗi tính trên (n-k) chu kỳ. Ta định nghĩa

  Tính chất:

r 1=  àv rk = r-k

  Bảng sau đây giới thiệu cách tính hàm tự tương quan  

Khảo sát chuỗi quan trắc yt. Các chuỗi lệch yt-k tương ứng cũng được giới thiệu:

Bảng 6.6          Xác định các chuổi lệch yt-k  

k

0

1

2

3

4

t

yt

yt-1

yt

yt

yt-2

1

123

2

130

123

3

125

130

123

4

138

125

130

123

5

145

138

125

130

123

6

142

145

138

125

130

7

141

142

145

138

125

8

146

141

142

145

138

9

147

146

141

142

145

10

157

147

146

141

142

11

150

157

147

146

141

12

145

150

157

147

146

Kết quả tính giá trị trung bình vô phương sai của các chuỗi và hàm số tự tương quan rk

được trình bày trong bảng sau:

Bảng 6.7   

trung bình yt

140.7

142.3

143.6

145.6

146.6

trung bình yt-k

140.7

140.3

139.4

137.4

136.2

phương sai yt

95

72.4

62.8

27.1

22.2

phương sai yt-k

95

101.8

101.8

74.9

71.4

rk

1

0.77

0.62

0.59

0.55

  Với định nghĩa của hàm số tự tương quan trên ta thấy không tiện lợi trong việc tính toán vì nó đòi hỏi phải lùi lại khi tính mỗi số hạng rk Do đó trong thực tế áp dụng ta thường tính hàm tự tương quan cho mẫu bằng một công thức đơn giản hơn như sau:

với  giá trị trung bình của chuỗi tính trên n chu kỳ.  

Khi số lượng quan trắc đủ lớn, hai cách tính giá trị hàm tự tương quan trên cho kết quả rất gần nhau (rk ~ rk ) Hàm số tự tương quan riêng phần bắt nguồn từ khái niệm tương quan riêng phần. Với khái niệm này cho phép ta đánh giá, ví dụ, ảnh hưởng của x1 lên x2 trong bối cảnh loại hết các ảnh hưởng của các biến khác x3 x4…xk

Tương tự như vậy ta định nghĩa hàm tự tương quan riêng phần có mức độ trễ k như là hệ số tương quan riêng phần giữa yt và yt-k; có nghĩa là trong đó các ảnh hưởng của các biến yt-l, yt-2… yk+l được loại bỏ (xem chương 4).  

3          Kiểm đinh nhiễu trắng

TOP

Phân tích hàm tự tương quan

Mục đích của phân tích hàm tự tương quan nhằm xác định khả năng có tính tự tương quan trong chuỗi khảo sát (thường là chuỗi sai số) hay không. Khi chúng ta phân tích hàm tự tương quan của một chuỗi thời gian, một câu hỏi luôn luôn đặt ra là các hệ số

rk nào khác 0. Thật vậy, nếu ta hoàn toàn không có giá trị nào của rk khác 0 ta nói quá trình nghiên cứu không có << bộ nhớ >>. Nó hoàn toàn không có tính xu thế cũng như không có tính chu kỳ. Ví dụ trong trường hợp nếu chuỗi có tính chu kỳ theo tháng ta sẽ thấy giá trị của r12 sẽ lớn (tương quan giữa yt và yt-12) Chuỗi chắc chắncó tính chu kỳ. Kiểm định cho rk có giá trị khác 0 được thực hiện dựa vâo nguyên tắc kiểm định giả thiết như sau:

H0: rk = 0

H1: rk 0  

Trong thực hành, tác giả Quenouille đã chứng minh được rằng với một mẫu có kích thước tương đối lớn, hệ số rk tiến một cách tiệm cận về một phân phối chuẩn có giá trị trung bình bằng 0 và độ lệch chuẩn là  

Khoảng tin cậy   của hệ số rknhư sau:

 với n là số lượng quan trắc.  

Nếu hệ số rk tính được nằm ngoài khoảng trên ta kết luận rk khác 0 với rủi ro % (thường ta lấy =5%).  

Tham số thống kê của Box-Pierce và Ljung-box

Kiểm định của Box-pierce cho phép nhận biết đó là nhiễu trắng hay không. Chúng ta phải kiểm định Cov(yt,yt-k)=o Và rk=0 với  . Một quá trình nhiễu trắng bắt buộc phải có: r1=r2=r3=…=rh

chúng ta có thể kiểm định riêng lẻ các giá trị của p, tuy nhiên thường ta hay sử dụng giá trị thống kê Q định nghĩa bởi Box-Pierce như sau: Q=n

với h số lượng của sự trễ, rk giá tri tự tương quan kinh nghiệm bậc k và n chỉ số quan trắc.Giá trị thống kê Q tuân theo gần như một phân phối c2 có bậc tự do h. Với mức độ rủi ro a% và bậc tự do h ta có giá trị co cho từ bảng tra. Nếu c2 >c2  a sẽ .chấp nhận giả thiết H1: đó không phải là một nhiễu trắng. Và ngược lại ta sẽ kết luận đó là một nhiễu trắng.

Đồ thị sau đây cho ta thấy biến đổi của một nhiễu trắng. H.64

 

Biểu đồ tương quan đơn và biểu đồ tương quan riêng phần tương ứng của chuỗi này như sau: Hình 6.5

Trong thực hành để khảo sát đó lâ một nhiễu trắng hay không ta sẽ sử dụng các kiểm định Bartleu vâ Quenouille. Kiểm định liên quan đến độ lớn của các giá trị hệ số tương quan và tương quan riêng phần. 

Khi ta thấy cường độ của nhiễu toàn bộ nằm trong giới hạn cho phép, ta kết luận đó là một nhiễu trắng. Đối với trường hợp hình trên, ta nhận thấy ở kiểm định Quenouílle còn có giá trị vượt quá giới hạn, đây chưa phải là một nhiễu trắng hoàn toàn.  

4          Mô hình AR(P) (Auto Regressif)

TOP

Trong một quá trình tự hồi quy bậc p, số liệu quan trắc tại thời điểm hiện tại yt được tạo ra bởi một tổng trung bình có trọng số của các giá trị quan trắc trong quá khứ tính cho đến giá trị quan trắc quá khứ thứ p Công thức định nghĩa như sau:

AR(1): yt = q1*yt-l + et

AR(2): yt = q1*yt-l +q2*yt-2 + et

--------------------------------------------------------

AR(P): yt = q1*yt-l +q2*yt-2 +… +qp*yt-p +et  

Trong đó q1; q2; …; qp là các thông số cần phải xác định. et là một nhiễu trắng ngẫu nhiên có dạng Gaussien. Chúng ta cũng có thể thêm vào quá trình này một hằng số mà nó vẫn không ảnh hường đến ưnh chất ngẫu nhiên của chuỗi. Phương trình trên có thể viết dưới dạng đơn giản hơn nhờ vào định nghĩa toán tử lệch pha D như sau:

( 1- q1*D - q2D2 - . . .- qpDp)*yt = et  

Tính chất:

  • Người ta đã chứng minh biểu đồ tương quan đơn của một quá trình AR(P) được mô tả bởi một cấp số nhân có công bội nhô hơn 1 (chuỗi giảm) có dạng:

rk = rk

  • Biểu đồ tương quan riêng phần chi có p số hạng đầu tiên là khác 0.  

Các ví dụ sau đây cho phép chúng ta nhận biết mô hình dạng AR dựa trên phân tích biểu đồ tương quan đơn vâ tương quan riêng phần. Xét một mô hình AR(L) có dạng:

yt = 1 + 0 9*yt-l+ et

với et là giá trị thặng dư.  

Các biểu đồ tương quan của mô hình trên có dạng sau:

262 Hình 6.7

Ta thấy giá trị đầu tiên của biểu đồ tương quan riêng phần rất lôn so với các giá trị còn lại và biểu đồ tương quan đơn có giá trị giảm đần. Đó là biểu thị đặc thù cho phép chúng ta nhận dạng đó là một mô hình AR(L).

Xét một mô hình AR(2) có dạng:

yt = 0 9*yt-2+1+ et  

Các biểu đồ tương quan của mô hình trên có dạng sau:  

so với trường hợp trước ta thấy có sự khác nhau. Thay vì giá trị thứ 1 như ví dụ trước, trường hợp này ta thấy giá trị thứ 2 trong biểu đồ tương quan riêng phần lớn trồi hơn hẳn so với các giá trị còn lại. Trong khi đó tính chất của biểu đồ tương quan đơn cũng giống như trước. Điều này cho phép ta biết đây là một mô hình AR(2). Ta cũng lưu ý thêm với số hạng AR(1) là không đáng kể.

5          Mô hình MA(q) (Moving Average)

TOP

Trong một quá trình trung bình động bậc q, số liệu quan trắc tại thời điểm hiện tại yt được ưnh bởi tổng trung bình có trọng số giá trị của các nhiễu ngẫu nhiên cho đến nhiễu thứ q. Công thức định nghĩa như sau: .

MA(1):          yt = et - a1*et-1

MA(2):          yt =  et - a1*et-1- a2*et-2

--------------------------------------------------------------------

MA(q):          yt = et - a1*et-1- a2*et-2-…- aq*et-q

Trong đó a1, a3, , ap là các thông số cần phải xác định et là một nhiễu trắng ngẫu nhiên có dạng Gaussien. Phương trình trên có thể viết dưới dạng đơn giản hơn nhờ vào định nghĩa một toán tử lệch pha D như sau:

(l -a1D- a2D2 -...- apDp) et = yt  

Trong quá trình dạng nây cũng như tất cả các mô hình tự hồi quy các nhiễu ngẫu nhiên được giả thiết là được tạo ra bởi một <<nhiễu trắng>> Chúng ta có thể hiểu quá trình trung bình động là một chuỗi thời gian dao động ngẫu nhiên chung quanh giá trị trung

bình của chúng.

Tính chất:

  • Chuỗi trung bình động bậc 1 chính là một quá trình tự hồi quy bậc p vô hạn.
  • Biểu đồ tương quan đơn của một quá trình trung bình động bậc q, MA(q), được xác định bởi:

      rk =   khi    

rk = 0  khi      k>q

  Điều này có nghĩa là chỉ có q số hạng đầu tiên của biểu đồ tương quan là khác 0. Đối với biểu đồ tương quan riêng phần sẽ được mô tả bởi một chuỗi cấp số giảm theo hướng các chậm pha trong quá khứ. Các ví dụ sau đây cho phép chúng ta nhận biết theo kinh nghiệm, hình dạng MA dựa trên cơ sở phân tích biểu đồ tương quan đơn và tương quan riêng phần. Xét một mô hình MA(L) có dạng:

yt = 5 + et + 0.9*et-1

  với et là giá trị thặng dư ở thời điểm t

  Các biểu đồ tương quan của mô hình trên có dạng sau:

  Ta thấy giá trị đầu tiên của biểu đồ tương quan đơn vượt trội so với các giá trị còn lại và biểu đồ tương quan riêng phần giảm dần dần. Đó là dạng đặc thù của một mô hình MA có bậc là 1.

Xét trường hợp cho một mô hình MA(2) có dạng:  

yl = 5 +et + 1 . 1 et-2  

Các biểu đồ tương quan của mô hình trên có dạng sau:

  Trong trường hợp này, thay vì giá trị đầu tiên trên biểu đồ tương quan có giá trị lớn trội như trước, ta thấy giá trị thứ 2 trên biểu đồ này lớn trội hơn so với các giá trị còn lại và giá trị của biểu đồ tương quan riêng phần giảm dần dần; đó là biểu thị đặc thù của một mô hình MA(2).  

Mô hình ARMA(p,q) là một quá trình được tạo ra bởi từ tổ hợp giữa các giá trị của chuỗi trong quá khứ và các giá trị của nhiễu trong quá khứ. Nó được xác định bởi phương trình sau đây:  

Ta cỏ thể nói đây lâ một mô hình có được từ sự tổng hợp của 2 loại mô hình AR và MA.  

266  

Tính chất:

ARMA( 1 ,0)=AR( 1 )  ; ARMA(0, 1 )=MA( 1 )

Ta chú ý trong trường hợp này, biểu đồ tương quan đơn và biểu đồ tương quan riêng phần sẽ phức tạp hơn so với 2 trường hợp trên. Do vậy chúng ta phải lưu ý khi xác định các thông số p,q của mô hình ARMA từ các biểu đồ này.

Ví dụ 5 

Xét mô hình ARMA(L,l) sau đây:

y = 5 + 0.8yt-l + 1 . l +

Các biểu đồ tương quan của mô hình trên có dạng sau:

Hình 6.11

Với biểu đồ trên ta thấy đây là một sự pha lẫn giữa hai loại mô hình AR và MA. Ta thấy đều có giá trị đầu tiên vượt trội trong các biểu đồ tương quan. Cường độ trong các biểu đồ cũng tắt dần.

Dự đoán bậc của mô hình đòi hỏi phải có một kinh nghiệm nhất định.

7          Mô hình ARMA mở rộng: ARIMA, SARIMA

TOP

Trong trường hợp chuỗi quan trắc có xu thế không ổn định (có xu thế tăng hoặc giảm theo thời gian), ta định nghĩa một mô hình có dạng ARMA(p,d,q) với d là bậc của đường xu thế. Nói một cách khác đi, d biểu thị cho số lần lấy << sai biệt > cần thiết lên chuỗi quan trắc để ta có thể nhận được một chuỗi nghiên cứu có tính ổn định theo xu thế. Ví dụ trong trường hợp chuỗi có xu thế tuyến tính ta có d=l; trong trường hợp đường xu thế là một hàm bậc 2 ta có d=2.

Thật vậy giả sừ chuỗi có một xu thế tuyến tính biểu thị bởi phương trình sau đây:

y =a+bt

Định nghĩa sai biệt bậc 1 Dyt ta có:

Dyt =yt-yt-1 =(a+bt)-(a+b[t—1])=b=cte  

Ta thấy chuỗi sai biệt bậc 1 có xu thế ổn định.  

Trong trường hợp có xu thế bậc 2 phương trình có dạng:

yt =a+bt+ct2  

Tính sai biệt bậc 1 ta có:

Dyt =yt-yt-1 = (a+bt+ct2)-(a+b[t-l]+c*[t-1]2)=b-c+2tc  

Ta thấy chuỗi Dyt có xu thế bậc 1 . Để có xu thế ổn định ta chỉ cần tính thêm một lần nữa cho sự khác biệt như trường hợp ta đã có trong trường hợp xu thế là tuyến tính ở trên.  

Như vậy ta có hai lần lấy sai biệt cho trường hợp bậc 2 này để chuỗi quan trắc trở nên ổn định về xu thế. Tóm lại ta có thể viết chuỗi (l-D)d *yt là một ARMA(p,q) khi yt lâ một ARIMA(p,d,q); với D được định nghĩa là toán tử sai biệt:

D(yt)=yt- yt-l  

Mô hình SARIMA cho phép giải quyết vấn đề sai biệt liên quan đến biến đổi mùa. Sự biến đổi được định nghĩa như sau:

(1 - Ds)*yt = yt - yt-s  

với s biểu thị tính chu kỳ của số liệu (s=4 cho một chuỗi biến đổi theo quý, s=12 cho chuỗi biến đổi theo tháng).  

Chú ý: Chúng ta chi áp dụng mô hình ARMA để nghiên cưu cho các chuổi không có xu thê.  

 PHƯƠNG PHÁP BOX-JENKINS

Hài tác giả nây đề nghị một phương pháp cho phép nghiên cứu một cách có hệ thống các dạng khác nhau của chuỗi thời gian dựa vào các tính chất của nó. Mục tiêu là tìm trong số tất cả các mô hình ARIMA (AR: tự hồi quy, MA: trung bình động, I: thông số cho biết bậc cần thiết để có thể tạo một chuỗi ổn định) 1 mô hình thích hợp nhất với số liệu của hiện tượng nghiên cứu.

Phương pháp bao gồm 3 bước chính sau đây:  

Bước 1: Tìm các mô hình thích hợp nhất

Đây là bước quan trọng và khó nhất. Nó cho phép nhận biết được trong họ tất cả các mô hình ARLMA mô hình nào là có khả năng thích hợp nhất. Phương pháp dựa vào nghiên cứu các biểu đồ tương quan đơn và các biểu đồ tương quan riêng phần. Một vài nguyên tắc sau đây cho phép tìm các thông số p,d,q của mô hình ARIMA.  

Khử tính chu kỳ  

Để đơn giản trong trường hợp chuỗi nghiên cứu có chứa yếu tố biến đổi có tính chu kỳ ta nên << khử >> yếu tố này trước khi đi vào các xử lý thống kê nhằm đơn giản hóa cho các bước tính sau.  

Khảo sát và xác định bậc của xu thế nếu có

Trong trường hợp biểu đồ tương quan đơn giảm chậm hoặc hoàn toàn không giảm, chuỗi có chứa một xu thế. Trong trường hợp này ta sẽ loại tính xu thế nó nhờ vào áp dụng của toán tử sai biệt lên chuỗi. Trong thực tế ta có thể gặp trường hợp d=l hoặc 2. Giá trị thích hợp của d sẽ cho ta một biểu đồ tương quan đơn có xu thế giảm nhanh.  

Xác định p,q của mô hình ARMA nhờ vào biểu đổ tương quan

  • Nếu biểu đồ tương quan đơn chỉ có q giá trị đầu tiên là khác 0 (q=3 là lớn nhất) và các giá trị của biểu đồ tương quan riêng phần giảm từ từ ta có thể tiên đoán có một MA(q).
  • Nếu biểu đồ tương quan riêng phần chỉ có p giá trị đầu tiên là khác 0 (p=3 là lớn nhất) và các giá trị của biểu đồ tương quan đớn giảm từ từ ta có thể tiên đoán có một AR(P).
  • Nếu biểu đồ tương quan đơn và biểu đồ tương quan riêng phần không có sự cắt ngắn như hai trường hợp trên, ta sẽ có một quá trình ARMA và các thông số của nó tùy thuộc vào dạng cụ thể của cấc biểu đồ tương quan.  

Trong thực hành, phương pháp phân tích đồ thị chỉ cho ta tìm được p q trong các trường hợp đơn giản mà thôi. Trong trường hợp tổng quát, ta có thể áp dụng các tiêu chuẩn sau đây để xác định các thông số p, q trong một mô hình ARMA. Thực chất chung của các tiêu chuẩn này là dựa vào sự khảo sát các giá trị liên quan đến phương sai của chuỗi sai số cho bởi mô hình với thông số đề nghị.

Có 3 tiêu chuẩn thông dụng được sử dụng như sau:

Tiêu chuẩn Akaike:

Akaike = Log(%rss) + 2  

Tiêu chuẩn BIC:  

BIC = Log(%rss) + (p + q) *

Tiêu chuẩn HQ:  

HQ = Log(%rss) + 2(p + q) *  

270

với:      %rss : tổng các thặng dư bình phương của mô hình đề nghị

%nobs : số lượng quan trắc.  

Trong trường hợp lý tưởng, giá trị chọn của p,q tương ứng với trường hợp cho ta các giá trị Akaike, BIC, HQ cực tiểu. Trong áp dụng ta có thể có trường hợp ở đó giá trị p,q đề nghị không làm cho 3 tiêu chuẩn này đồng thời cực tiểu. Tuy vậy thường các tiêu chuẩn này cho giá trị p,q tối ưu không khác nhau lớn. Trong trường hợp này ta sẽ khảo sát từng tổ hợp (p,q) cụ thể để quyết định chọn mô hình hợp lý nhất.  

Bước 2: Ước lượng các hệ số của mô hình

Trong trường hợp mô hình AR(P), tác giả áp dụng phương pháp bình phương tối thiểu hay sử dụng quan hệ giữa tính tự tương quan và các hệ số của mô hình (phương trình Yule Walker). ước lượng các hệ số cho mô hình MA(Q) tương đối phức tạp hơn. Các tác giả đề nghị sử dụng một phương pháp lặp dưới dạng quét mà chúng ta có thể hiểu một cách đơn giản như sau.  

Giả sử ta có 1 mô hình ARMA(2,2) xác định bởi:

(l-q1D-q2D2)yt = (l-aD1-a2D2)*et

và Chúng ta có thể viết dưới dạng:

yt =

Ta đặt:

  

Do đó:    

Từ đó chúng ta có thể khởi đầu bằng cách tính quét với 2 khoảng giá trị chấp nhận được cho a1a2 và với một gia số cho trước. Tiếp theo, cho mỗi cặp giá trị của a1a2 ta đặt no = o Và n1 =o và Chúng ta sẽ ước lượng giá trị của vl theo các bước sau:

n2 = y2

 n3  = y3 + a2 n2

n4  = y4 + a1 n1+a2 n2

etc....  

sau khi tính tất cả các giá trị của nt ta sẽ ước lượng các thông số q1q2 bởi phương pháp bình phương tối thiểu áp dụng vào phương trình sau:

nt  = q1nt-1 + q2nt-2 +  et  

và chúng ta sẽ lấy giá trị al, a2  sao cho các tổng bình phương của các thặng dư từ phương trình hồi quy trên tối thiểu. Chú ý phương pháp này chỉ có giá trị trong trường hợp số lượng các thông số cần xác định không nhiều lắm. Ngoài phương pháp bình phương tối thiểu ta còn có thể áp dụng phương pháp cực đại hóa các hàm tương thích.  

Bước 3: Kiểm tra giá trị của mô hình và dự báo

Sau khi các thông số của mô hình được xác định, chúng ta sẽ kiểm định các kết quả của ước lượng này.

Các hệ số của mô hình phải khác 0 (kiểm định Student cổ điển).

Nếu có một hay nhiều hệ số không thỏa mãn, ta sẽ loại bỏ nó ra khỏi mô hình AR hoặc MA đang xét.

Phân tích các giá trị thặng dư được thực hiện từ 2 tiêu chuẩn sau:

-          Giá trị trung bình số học triệt tiêu, trong trường hợp ngược lại ta nên thêm một hằng số vào mô hình.

-          Chuỗi giá trị thặng dư là một nhiễu trắng. Các giá trị th.ống kê của Box-pierce và của Ljung-box cho phép kiểm định tính chất này. Nếu nó không phải là một nhiễu trắng ta kết luận mô hình là không hoàn chỉnh và ta phải thêm vào mô hình các bậc bổ sung cần thiết.  

Bước kiểm định mô hình rất quan trọng? và có thể ta phải trở lại bước thứ 1 nếu mô hình đề nghị không thích hợp. Một khi mô hình đã được kiểm định, ta có thể tiến hành dự báo giới hạn trong một vài chu kỳ. Phân tích chuỗi thời gian với mô hình SARLMA chỉ cho phép tiến hành các dự báo ngần hạn. Nó không cho phép

một dự báo trung hạn và dài hạn với độ chính xác cần có, vì biến độ của sai số gia tăng rất nhanh trong trường hợp này.  

                                                         

Chúng ta co thể tóm tắt các bước cơ bản của phương pháp Box-Jenkins như sau: Vi dụ 6

Áp dụng phương pháp BoxỊjenkins Doanh thu của một công ty trong chu kỳ 01/82 đến 09/90 được trình bày bởi đồ thị sau đây:  

  Hãy phân tích chuỗi trên bằng phương pháp Box-jenkins và dự báo cho doanh số trong 6 tháng tiếp theo (lo/90 - 3/91).

  Hướng dẫn (Kết quả tính toán được thực hiện với logiciel RATS)

  Biểu đồ tương quan đơn và biểu đồ tương quan riêng phần của chuỗi trên như sau:  

Ta thấy trên các biểu đồ tương quan xuất hiện 1 << pic >> rất rõ khi k=12. Nhận xét này cho ta kết luận số liệu có tính chu kỳ (T=12 tháng). Để khử tính chu kỳ trong chuỗi, ta sẽ định nghĩa chuỗi Yt nhờ vào một biến đổi như sau:  

Yt = yt - yt-12 ;  t  

Biểu đồ tương quan đơn và biểu đồ tương quan riêng phần của chuỗi Yt trên như sau:  

Ta thấy biểu đồ tương quan có cường độ giảm đần rất chậm, điều này có nghĩa là ta có một xu thế trong số liệu. Để khử xu thế ta áp dụng biến đổi sau:(D)Yt = Yt - Yt-1 ;     

Biểu đồ tương quan của D(YT) như sau:

                                 

Ta thấy giá trị đầu tiên của biểu đồ tương quan đơn lớn hơn hẳn sơ với các giá trị tiếp theo, trong khi đó giá trị của biểu đồ tương quan riêng phần giảm từ từ; ta có thể dự đoán đây là một mô hình có dạng MA(1). Tóm lại mô hình đề nghị cho chuỗi số liệu trên như sau SARIMA(0,1,1) với s=12. Kết quả cho từ logiciel RATS như sau:

Biến nghiên cứu VENTE -Úớc lượg bởi Box-Jenkins

Số lần lập 21

Chuỗi số liệu 83:02 đền 90:09

Số quan trắc hiệu dụng 92 Bộc tự do 90

Hệ số xác định R**2  0.921215  Hệ số xác định hiệu chỉnh 0.920340

Giá trị biến nghiên cứu                                     646. 71640217 Ú

Độ lệch chuẩn của/ biên nghiên cứu                365.92740ố4í

Sai số chuẩn hóa của ước lượng                      103.28000630

Tổng cá c thặng dư bình phương               960008.37314

Giá trị thông kê Durbin-watson                          1.751202

Giá trị thống kê của Ljung-box Q(23-2)         29.883511

a tương ứng của Q                                           0.09435394

Biến                      Hệ số                    Độ lệch chuẩn                     T-student         a

****** ******************************************************************

1 AR(12)         1.058169                    0.032803                            32.25804        0.000

2. Ma(1)         0.820817                    0.060968                           -13.46307        0.000

Biểu đồ tương quan đơn và biểu đồ tương quan riêng phần của thặng dư cho bởi mô hình được chọn từ phương pháp

Box Jenkins như sau:

                    

  Để đánh giá chất lượng của mô hình ta phải kiểm tra xem giá trị thặng dư trên có phải là một nhiễu trắng hay không. Sau đây là kết quả của kiểm định Bartlett và Quenouille:

Ta thấy cường độ cửa hệ số tương quan đơn và tương quan riêng phần hoàn toàn nằm trong giới hạn cho phép trong cả 2 loại kiểm định. Do đó chuỗi giá trị thặng dư cho bởi mô hình chọn là một nhiễu trắng như mong đợi.  

  Dự báo ngắn hạn:

Tiến hành dự báo ngắn hạn về doanh số của công ty cho bởi mô hình Box-jenkins được trình bày trong bảng sau:

Thòi gian

Dự báo

90:10

1055.3

90:11

1480.7

90:12

1901.4

91:01

676.1

91:02

561.8

91:03

561.8

91:04

714.6

Đỗ thị sau biểu diễn tổng hợp giữa doanh thu trong quá khứ và dự báo ngắn hạn của công ty như sau: