EViews – Cách chạy hồi quy đa biến và giải thích ý nghĩa kết quả

Giới thiệu

Nhóm MBA ĐH Bách Khoa hotrospss@gmail.com giới thiệu cách chạy hồi quy với EViews. Bài này chỉ đơn thuần chạy hồi quy, không liên quan đến các khái niệm fixed effect và random effect nhé.

Cách thao tác

Trước tiên bật EViews lên, bật file dữ liệu lên và chọn vào menu Quick – Estimate Equation

regression1

Lúc đó màn hình hiện lên bảng sau:

regression2

Đây là màn hình để nhập các thông số cần ước lượng vào. Ở bài này, chúng ta có

  • 1 biến phụ thuộc là HL
  • 6 biến độc lập là: TC DU DB CT HH MB

Chúng ta cần tính toán xem 6 biến này có tác động đến biến phụ thuộc hay không, mức độ tác động là bao nhiêu, các chỉ số như R bình phương, kiểm định F… là bao nhiêu thì chúng ta sẽ chạy hồi quy, ta sẽ nhập dòng sau vào ô trống :

regression3

Đứng đầu là chữ HL( gạch dưới màu xanh), tiếp theo là biến C( gạch dưới màu vàng), tiếp theo là các biến độc lập( gạch dưới màu đỏ). Lưu ý biến C lúc nào cũng cần , vì nó là viết tắt cho hằng số Constant. Biến C có thể đứng trước, hoặc sau biến độc lập. Nhưng biến phụ thuộc bắt buộc phải đứng đầu.

Về phương thức ước lượng, có nhiều phương thức như sau:

LS – least squares (nls and arma)
TSLS – two-stage least squares (tsnls and arma)
GMM – generalized method of moments
LIML – limited information maximum likelihood and k-class
COINTREG – cointegrating regression
ARCH – autoregressive conditional heteroskedasticity
BINARY – binary choice (logit, probit, extreme value)
ORDERED – ordered choice
CENSORED – censored or truncated data (include tobit)
COUNT – interger count data
QREG – quantile regession (including lad)
GLM – generalized linear models
STEPLS – robust least squares
HECKIT – heckman selection (generalized tobit)
BREAKLS – least squares with beakpoints
SWITCHREG – switching regression

regression4

Ở đây ta chọn phương thức mặc định là LS – least squares (nls and arma), sau đó nhấn OK sẽ ra kết quả như sau:

Dependent Variable: HL

Method: Least Squares

Date: 11/21/16 Time: 14:00

Sample: 1 200

Included observations: 200

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-0.986961

0.232071

-4.252845

0.0000

TC

0.161892

0.035779

4.524742

0.0000

DU

0.171275

0.032314

5.300333

0.0000

DB

0.223926

0.052222

4.287924

0.0000

CT

0.305198

0.053724

5.680838

0.0000

HH

0.221121

0.045545

4.854949

0.0000

MB

0.217231

0.044356

4.897470

0.0000

R-squared

0.671442

Mean dependent var

3.286250

Adjusted R-squared

0.661228

S.D. dependent var

0.755797

S.E. of regression

0.439905

Akaike info criterion

1.229858

Sum squared resid

37.34872

Schwarz criterion

1.345300

Log likelihood

-115.9858

Hannan-Quinn criter.

1.276576

F-statistic

65.73589

Durbin-Watson stat

2.145830

Prob(F-statistic)

0.000000

 

Cách đọc ý nghĩa các chỉ số như sau:

  • R-squared = 0.67 : Hệ số R bình phương, thể hiện các biến độc lập giải thích được bao nhiêu % biến thiên của biến phụ thuộc.
  • Adjusted R-squared = 0.66 : Hệ số R bình phương hiệu chỉnh, thể hiện các biến độc lập giải thích được bao nhiêu % biến thiên của biến phụ thuộc.
  • F-statistic = 65.74 : kiểm định F, dùng để kiểm tra mô hình hồi quy tuyến tính xây dựng được là phù hợp với tổng thể hay không, với giả thiết là R2 của tổng thể bằng =0.
  • Prob(F-statistic) = 0.00 : xác suất của kiểm định F, nếu < 5% chứng tỏ mô hình giả thiết R2 của tổng thể khác 0 được chấp nhận
  • Durbin-Watson stat = 2.15 : giá trị kiểm định dùng kiểm tra hiện tượng tự tương quan.
  • Cột Prob. nếu < 5% chứng tỏ biến đó có tác động có ý nghĩa thống kê đến biến phụ thuộc, ở đây ta có 6 biến độc lập và đều có tác động có ý nghĩa thống kê đến biến phụ thuộc
  • Cột Coefficient là hệ số hồi quy chưa chuẩn hóa, từ cột này có thể viết phương trình hồi quy như sau: HL = -0.99 + 0.16*TC + 0.17*DU + 0.22*DB + 0.31*CT + 0.22*HH + 0.22*MB
  • Muốn tìm hệ số hồi quy đã chuẩn hóa cần phải thực hiện thêm bước nữa là: Vào menu View – Coefficient Diagnostics – Scale Coefficients, bảng sau sẽ hiện ra thể hiện giá trị hồi quy chuẩn hóa như cột tô vàng trong hình.

Standardized

Elasticity

Variable

Coefficient

Coefficient

at Means

C

-0.986961

NA

-0.300330

TC

0.161892

0.217286

0.177472

DU

0.171275

0.239621

0.180374

DB

0.223926

0.194710

0.209787

CT

0.305198

0.280586

0.312047

HH

0.221121

0.219396

0.251428

MB

0.217231

0.218403

0.169224

Ngoài ra, muốn kiểm tra hiện tượng đa cộng tuyến VIF cần vào menu View – Coefficient Diagnostics – Variance Inflation Factor,kết quả ra như sau, cột cần nhìn là cột cuối màu đỏ, ta thấy các VIF đều <2 nên không xảy ra hiện tượng đa cộng tuyến.

Variable

Coefficient Variance

Uncentered VIF

Centered VIF

C

0.053857

55.66117

NA

TC

0.001280

18.52518

1.354629

DU

0.001044

14.12625

1.200576

DB

0.002727

27.92747

1.211234

CT

0.002886

35.10955

1.433018

HH

0.002074

31.13389

1.199596

MB

0.001967

14.49393

1.168207

Liên hệ nhóm để được hỗ trợ tư vấn làm luận văn, khảo sát thu thập số liệu: so-alo hoặc facebook.com/hotroeviews, hoặc email hotrospss@gmail.com