Mẹo Hướng dẫn Kiểm định giả thuyết thông số hồi quy Mới Nhất

Quý khách đang tìm kiếm từ khóa Kiểm định giả thuyết thông số hồi quy được Update vào lúc : 2022-11-29 05:15:13 . Với phương châm chia sẻ Mẹo về trong nội dung bài viết một cách Chi Tiết 2022. Nếu sau khi đọc nội dung bài viết vẫn ko hiểu thì hoàn toàn có thể lại Comment ở cuối bài để Ad lý giải và hướng dẫn lại nha.

96

Nội dung chính Show

  • 1. Lý thuyết hồi quy tuyến tính
  • 3.1 Bảng ANOVA
  • 3.2 Bảng Model Summary
  • 3.3 Bảng Coefficients
  • 4. Đánh giá giả định hồi quy qua 3 biểu đồ
  • 4.1 Biểu đồ tần số phần dư chuẩn hóa Histogram
  • 4.2 Biểu đồ phần dư chuẩn hóa Normal P-P Plot
  • 4.3 Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến tính

Hồi quy tuyến tính là phép hồi quy xem xét quan hệ tuyến tính – dạng quan hệ đường thẳng giữa biến độc lập với biến phụ thuộc. 

1. Lý thuyết hồi quy tuyến tính

Trong nghiên cứu và phân tích, toàn bộ chúng ta thường phải kiểm định
những giả thuyết về quan hệ giữa hai hay nhiều biến, trong số đó có một biến phụ
thuộc và một hay nhiều biến độc lập. Nếu chỉ có một biến độc lập, quy mô được
gọi là quy mô hồi quy đơn biến SLR (Simple Linear Regression). Trường hợp có từ
hai biến độc lập trở lên, quy mô được gọi là hồi quy bội MLR (Multiple Linear
Regression). Những nội dung tiếp theo ở tài liệu này chỉ đề cập đến hồi quy bội,
hồi quy đơn biến tính chất tương tự với hồi quy bội

– Phương trình hồi quy đơn biến: Y
= β0 + β1X + e

– Phương trình hồi quy bội: Y = β0 + β1X1 + β2X2 + … + βnXn
+ e

Trong số đó:

  • Y: biến
    phụ thuộc, là biến chịu tác động của biến khác.
  • X, X1, X2,
    Xn: biến độc lập, là biến tác động lên biến
    khác.
  • β0: hằng số hồi quy, hay còn được gọi là thông số chặn. Đây là chỉ số
    nói lên giá trị của Y sẽ là bao nhiêu nếu toàn bộ X cùng bằng 0. Nói cách khác,
    chỉ số này cho toàn bộ chúng ta biết giá trị của Y là bao nhiêu nếu không còn những X. Khi
    màn biểu diễn trên đồ thị Oxy, β0 là yếu tố trên trục Oy mà đường hồi
    quy cắt qua.
  • β1, β2, βn: thông số hồi quy, hay còn được gọi là thông số
    góc. Chỉ số này cho toàn bộ chúng ta biết về mức thay đổi của Y gây ra bởi X tương ứng.
    Nói cách khác, chỉ số này nói lên có bao nhiêu cty Y sẽ thay đổi nếu X tăng
    hoặc giảm một cty.
  • e: sai
    số. Chỉ số này càng lớn càng làm cho kĩ năng Dự kiến của hồi quy trở nên kém
    đúng chuẩn hơn hoặc sai lệch nhiều hơn nữa so với thực tiễn. Sai số trong hồi quy tổng
    thể hay phần dư trong hồi quy mẫu đại diện thay mặt thay mặt cho hai giá trị, một là những biến độc
    lập ngoài quy mô, hai là những sai số ngẫu nhiên.

Trong thống
kê, yếu tố toàn bộ chúng ta muốn nhìn nhận là những thông tin của tổng thể. Tuy nhiên vì tổng
thể quá rộng, toàn bộ chúng ta không thể đã có được những thông tin này. Vì vậy, toàn bộ chúng ta
dùng thông tin của mẫu nghiên cứu và phân tích để ước lượng hoặc kiểm định thông tin của tổng
thể. Với hồi quy tuyến tính cũng thế, những thông số hồi quy tổng thể như β1, β2 … hay hằng số hồi
quy β0
là những tham số toàn bộ chúng ta muốn biết nhưng không thể đo
lường được. Do đó, toàn bộ chúng ta sẽ sử dụng tham số tương ứng từ mẫu để ước lượng và
từ đó suy trình làng tổng thể. Phương trình hồi quy trên mẫu nghiên cứu và phân tích:

Y = B0 + B1X1 + B2X2 + … + BnXn
+ ε

Trong số đó:

  • Y: biến
    phụ thuộc
  • X, X1, X2,
    Xn: biến độc lập
  • B0: hằng số hồi quy
  •  B1, B2, Bn: thông số hồi quy
  • ε: phần dư

Tất cả những nội dung hồi quy tiếp theo này chỉ
nói về hồi quy trên tập tài liệu mẫu. Do vậy, thuật ngữ sai số sẽ không còn được đề
cập mà chỉ nói về phần dư.

://.youtube/watch?v=XUoenT4Go4A

Một trong những phương pháp ước lượng hồi quy tuyến tính phổ cập là bình phương nhỏ nhất OLS (Ordinary Least Squares). 

Với tổng thể, sai số (error) ký hiệu là e, còn trong mẫu nghiên cứu và phân tích sai số thời gian hiện nay được gọi là phần dư (residual) và được ký hiệu là ε. Biến thiên phần dư được xem bằng tổng bình phương toàn bộ những phần dư cộng lại. 

Nguyên tắc của phương pháp hồi quy OLS là làm cho biến thiên phần dư này trong phép hồi quy là nhỏ nhất. Khi màn biểu diễn trên mặt phẳng Oxy, đường hồi quy OLS là một đường thẳng trải qua đám đông những điểm tài liệu mà ở đó, khoảng chừng cách từ những điểm tài liệu (trị tuyệt đối của ε) đến đường hồi quy là ngắn nhất.

Từ đồ thị scatter màn biểu diễn quan hệ Một trong những biến độc lập và biến phụ thuộc, những điểm tài liệu sẽ nằm phân tán nhưng có Xu thế chung tạo thành dạng một đường thẳng. Chúng ta hoàn toàn có thể có thật nhiều đường đường thẳng hồi quy trải qua đám đông những điểm tài liệu này chứ không phải chỉ một đường duy nhất, yếu tố là ta phải lựa chọn ra đường thẳng nào mô tả sát nhất Xu thế tài liệu. Bình phương nhỏ nhất OLS sẽ tìm ra đường thẳng đó nhờ vào nguyên tắc cực tiểu hóa khoảng chừng cách từ những điểm tài liệu đến đường thẳng. Trong hình ở trên đường red color là đường hồi quy OLS.

 Xem thêm: Sự khác lạ giữa Tương quan và Hồi quy

Thực hiện phân tích hồi quy tuyến tính bội để xem nhận sự tác động của những biến độc lập này lên biến phụ thuộc. Chúng ta vào Analyze > Regression > Linear…

Đưa biến tùy từng ô Dependent, những biến độc lập vào ô Independents.

Vào mục Statistics, tích chọn những mục như trong ảnh và chọn Continue.

Vào mục Plots, tích chọn vào Histogram và Normal probability plot, kéo biến ZRESID thả vào ô Y, kéo biến ZPRED thả vào ô X như hình phía dưới. Tiếp tục chọn Continue.

Các mục còn sót lại toàn bộ chúng ta sẽ để mặc định. Quay lại giao diện ban đầu, mục Method là những phương pháp đưa biến vào, tùy vào dạng nghiên cứu và phân tích mà toàn bộ chúng ta sẽ chọn Enter hoặc Stepwise. Tính chất đề tài thực hành thực tiễn là nghiên cứu và phân tích xác lập, do vậy tác giả sẽ chọn phương pháp Enter đưa biến vào một trong những lượt. Tiếp tục nhấp vào OK. 

SPSS sẽ xuất ra thật nhiều bảng, toàn bộ chúng ta sẽ triệu tập vào những bảng ANOVA, Model Summary, Coefficients và ba biểu đồ Histogram, Normal P-P Plot, Scatter Plot.

3.1 Bảng ANOVA

Chúng ta cần nhìn nhận độ thích hợp quy mô một cách đúng chuẩn qua kiểm định giả thuyết. Để kiểm định độ thích hợp quy mô hồi quy, toàn bộ chúng ta đặt giả thuyết H0: R2 = 0. Phép kiểm định F được sử dụng để kiểm định giả thuyết này. Kết quả kiểm định:

  • Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là R2 ≠ 0 một cách có ý nghĩa thống kê, quy mô hồi quy là thích hợp.
  • Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là R2 = 0 một cách có ý nghĩa thống kê, quy mô hồi quy không thích hợp.

Trong SPSS, những số liệu của kiểm định F được lấy từ bảng phân tích phương sai ANOVA.

Bảng ANOVA cho toàn bộ chúng ta kết quả kiểm định F để xem nhận giả thuyết sự thích hợp của quy mô hồi quy. Giá trị sig kiểm định F bằng 0.000 < 0.05, do đó, quy mô hồi quy là thích hợp.

3.2 Bảng Model Summary

Các điểm tài liệu luôn phân tán và có Xu thế tạo thành dạng một đường thẳng chứ không phải là một đường thẳng hoàn toàn. Do đó, hầu như không còn đường thẳng nào hoàn toàn có thể trải qua toàn bộ toàn bộ những điểm tài liệu, luôn có sự sai lệch Một trong những giá trị ước tính và những giá trị thực tiễn. Chúng ta sẽ cần tính toán được mức độ sai lệch này cũng như mức độ thích hợp của quy mô hồi quy tuyến tính với tập tài liệu. 

(Bên trái là độ thích hợp quy mô cao, bên phải là độ thích hợp quy mô thấp)

Một thước đo sự thích hợp của quy mô hồi quy tuyến tính thường dùng là thông số xác lập R2 (R square). Khi phần lớn những điểm tài liệu triệu tập sát vào đường hồi quy, giá trị R2 sẽ cao, ngược lại, nếu những điểm tài liệu phân loại rải rác cách xa đường hồi quy, R2 sẽ thấp. Chỉ số R2 nằm trong bảng Model Summary.

Khi toàn bộ chúng ta đưa thêm biến độc lập vào phân tích hồi quy, R2 có Xu thế tăng thêm. Điều này dẫn đến một số trong những trường hợp mức độ thích hợp của quy mô hồi quy bị thổi phồng khi toàn bộ chúng ta đưa vào những biến độc lập lý giải rất yếu hoặc không lý giải cho biến phụ thuộc. Trong SPSS, cạnh bên chỉ số R2, toàn bộ chúng ta còn tồn tại thêm chỉ số R2 Adjusted (R2 hiệu chỉnh). Chỉ số R2 hiệu chỉnh không nhất thiết tăng thêm khi nhiều biến độc lập được thêm vào hồi quy, do đó R2 hiệu chỉnh phản ánh độ thích hợp của quy mô đúng chuẩn hơn thông số R2. 

R2 hay R2 hiệu chỉnh đều phải có mức xấp xỉ trong đoạn từ 0 đến 1. Nếu R2 càng tiến về 1, những biến độc lập lý giải càng nhiều cho biến phụ thuộc, và ngược lại, R2 càng tiến về 0, những biến độc lập lý giải càng ít cho biến phụ thuộc. 

Không có tiêu chuẩn đúng chuẩn R2 ở tại mức bao nhiêu thì quy mô mới đạt yêu cầu. Cần lưu ý rằng, không phải luôn luôn một quy mô hồi quy có R2 cao thì nghiên cứu và phân tích có mức giá trị cao, quy mô có R2 thấp thì nghiên cứu và phân tích đó có mức giá trị thấp, độ thích hợp quy mô hồi quy không còn quan hệ nhân quả với giá trị của bài nghiên cứu và phân tích. Trong nghiên cứu và phân tích lặp lại, toàn bộ chúng ta thường chọn mức trung gian là 0.5 để phân ra 2 nhánh ý nghĩa mạnh/ý nghĩa yếu và kỳ vọng từ 0.5 đến 1 thì quy mô là tốt, bé nhiều hơn nữa 0.5 là quy mô chưa tốt. Tuy nhiên, điều này sẽ không còn thực sự đúng chuẩn bởi việc nhìn nhận giá trị R2 sẽ phụ thuộc thật nhiều vào những yếu tố như nghành nghiên cứu và phân tích, tính chất nghiên cứu và phân tích, cỡ mẫu, số lượng biến tham gia hồi quy, kết quả những chỉ số khác của phép hồi quy,… 

Trong ví dụ ở trên, bảng Model Summary cho toàn bộ chúng ta kết quả R bình phương (R Square) và R bình phương hiệu chỉnh (Adjusted R Square) để xem nhận mức độ thích hợp của quy mô. Giá trị R bình phương hiệu chỉnh bằng 0.695 đã cho toàn bộ chúng ta biết những biến độc lập đưa vào phân tích hồi quy ảnh hưởng 69.5% sự biến thiên của biến phụ thuộc, còn sót lại 31.4% là vì những biến ngoài quy mô và sai số ngẫu nhiên. 

Kết quả bảng này cũng đưa ra giá trị Durbin–Watson để xem nhận hiện tượng kỳ lạ tự tương quan chuỗi số 1. Giá trị DW = 1.849, nằm trong mức chừng 1.5 đến 2.5 nên kết quả không vi phạm giả định tự tương quan chuỗi số 1 (Yahua Qiao, 2011).

3.3 Bảng Coefficients

Chúng ta sẽ nhìn nhận thông số hồi quy của mỗi biến độc lập có ý nghĩa trong quy mô hay là không nhờ vào kiểm định t (student) với giả thuyết H0: Hệ số hồi quy của biến độc lập Xi bằng 0. Mô hình hồi quy có bao nhiêu biến độc lập, toàn bộ chúng ta sẽ đi kiểm tra bấy nhiêu giả thuyết H0. Kết quả kiểm định:

  • Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là thông số hồi quy của biến Xi khác 0 một cách có ý nghĩa thống kê, biến X1 có tác động lên biến phụ thuộc.
  • Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là thông số hồi quy của biến Xi bằng 0 một cách có ý nghĩa thống kê, biến Xi không tác động lên biến phụ thuộc.

Trong hồi quy, thường toàn bộ chúng ta sẽ có được hai thông số hồi quy: chưa chuẩn hóa (trong SPSS gọi là B) và đã chuẩn hóa (trong SPSS gọi là Beta). Mỗi thông số hồi quy này còn có vai trò rất khác nhau trong việc diễn giải hàm ý quản trị của quy mô hồi quy. Để hiểu lúc nào dùng phương trình hồi quy nào, bạn hoàn toàn có thể xem nội dung bài viết Sự rất khác nhau giữa thông số hồi quy chuẩn hóa và chưa chuẩn hóa. 

Nếu thông số hồi quy (B hoặc Beta) mang dấu âm, nghĩa là biến độc lập đó tác động nghịch chiều lên biến phụ thuộc. trái lại nếu B hoặc Beta không còn dấu (dấu dương), nghĩa là biến độc lập tác động thuận chiều lên biến phụ thuộc. Khi xem xét mức độ tác động Một trong những biến độc lập lên biến phụ thuộc, toàn bộ chúng ta sẽ nhờ vào trị tuyệt đối thông số Beta, trị tuyệt đối Beta càng lớn, biến độc lập tác động càng mạnh lên biến phụ thuộc. Xem rõ ràng hơn tại nội dung bài viết Hệ số hồi quy B, Beta âm trong phân tích SPSS.

Trong SPSS, những số liệu của kiểm định t được lấy từ bảng thông số hồi quy Coefficients. Cũng lưu ý rằng, nếu một biến độc lập không còn ý nghĩa thống kê trong kết quả hồi quy, toàn bộ chúng ta sẽ kết luận biến độc lập đó không còn sự tác động lên biến phụ thuộc mà không cần thực thi loại biến và phân tích lại hồi quy.

Trong ví dụ ở trên, bảng Coefficients cho toàn bộ chúng ta kết quả kiểm định t để xem nhận giả thuyết ý nghĩa thông số hồi quy, chỉ số VIF nhìn nhận đa cộng tuyến và những thông số hồi quy. 

Biến F_DN có mức giá trị sig kiểm định t bằng 0.777 > 0.05 , do đó biến này sẽ không còn còn ý nghĩa trong quy mô hồi quy, hay nói cách khác, biến này sẽ không còn còn sự tác động lên biến phụ thuộc F_HL. Các biến còn sót lại gồm F_LD, F_CV, F_TL, F_DT, F_DK đều phải có sig kiểm định t nhỏ hơn 0.05, do đó những biến này đều phải có ý nghĩa thống kê, đều tác động lên biến phụ thuộc F_HL. Hệ số hồi quy những biến độc lập này đều mang dấu dương, như vậy những biến độc lập có tác động thuận chiều lên biến phụ thuộc.

Lưu ý rằng, biến không còn ý nghĩa trong hồi quy thì không loại biến đó và chạy lại phân tích, nguyên do vì sao bạn xem rõ ràng tại nội dung bài viết Biến không còn ý nghĩa ở hồi quy, SEM có cần loại chạy lại không?.

 Xem thêm: Sai lầm khi nhận xét Beta mạnh thì Mean cao trong hồi quy!

Hệ số phóng đại phương sai (VIF) là một chỉ số nhìn nhận hiện tượng kỳ lạ cộng tuyến trong quy mô hồi quy. VIF càng nhỏ, càng ít kĩ năng xẩy ra đa cộng tuyến. Hair và tập sự (2009) nhận định rằng, ngưỡng VIF từ 10 trở lên sẽ xẩy ra đa cộng tuyến mạnh. Nhà nghiên cứu và phân tích nên nỗ lực để VIF ở tại mức thấp nhất hoàn toàn có thể, bởi thậm chí còn ở tại mức VIF bằng 5, bằng 3 đã hoàn toàn có thể xẩy ra đa cộng tuyến nghiêm trọng. Theo Nguyễn Đình Thọ (2010) , trên thực tiễn, nếu VIF > 2, toàn bộ chúng ta cần thận trọng chính bới đã hoàn toàn có thể xẩy ra sự đa cộng tuyến gây sai lệch những ước lượng hồi quy. Xem thêm nội dung bài viết Đa cộng tuyến: Nguyên nhân, tín hiệu nhận ra và cách khắc phục.

Cụ thể trong ví dụ ở bảng trên, Hệ số VIF của những biến độc lập đều nhỏ hơn 10, trong trường hợp này thậm chí còn nhỏ hơn 2, do vậy tài liệu không vi phạm giả định đa cộng tuyến.

Từ những thông số hồi quy, toàn bộ chúng ta xây dựng được hai phương trình hồi quy chuẩn hóa và chưa chuẩn hóa theo thứ tự như sau:

Khi viết phương trình hồi quy, lưu ý rằng: 

  • Không đưa biến độc lập không còn ý nghĩa thống kê vào phương trình.
  • Nếu biến độc lập có thông số hồi quy âm, toàn bộ chúng ta sẽ viết dấu trừ trước thông số hồi quy trong phương trình. 
  • Nhìn vào phương trình toàn bộ chúng ta sẽ hoàn toàn có thể xác lập ngay được biến độc lập nào tác động mạnh nhất, mạnh thứ hai,…, yếu nhất lên biến phụ thuộc.
  • Luôn có phần dư ε cuối phương trình hồi quy dù là phương trình chuẩn hóa hay chưa chuẩn hóa.

4. Đánh giá giả định hồi quy qua 3 biểu đồ

4.1 Biểu đồ tần số phần dư chuẩn hóa Histogram

Phần dư hoàn toàn có thể không tuân theo phân phối chuẩn vì những nguyên do như: sử dụng sai quy mô, phương sai không phải là hằng số, số lượng những phần dư không đủ nhiều để phân tích… Vì vậy, toàn bộ chúng ta cần thực thi nhiều cách thức khảo sát rất khác nhau. Một cách khảo sát đơn thuần và giản dị nhất là xây dựng biểu đồ tần số của những phần dư Histogram ngay dưới đây. Một cách khác nữa là vị trí căn cứ vào biểu đồ P-P Plot ở mục sau.

Đối với biểu đồ Histogram, nếu giá trị trung bình Mean gần bằng 0, độ lệch chuẩn Std. Dev gần bằng 1, những cột giá trị phần dư phân loại theo như hình thức hình chuông, ta hoàn toàn có thể xác lập phân phối là xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không biến thành vi phạm. Cụ thể trong ảnh trên, Mean = 5.74E-15 = 5.74 * 10-15 = 0.00000… gần bằng 0, độ lệch chuẩn là 0.991 gần bằng 1. Như vậy hoàn toàn có thể nói rằng, phân phối phần dư xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không biến thành vi phạm.

4.2 Biểu đồ phần dư chuẩn hóa Normal P-P Plot

Ngoài cách kiểm tra bằng biểu đồ Histogram, thì P-P Plot cũng là một dạng biểu đồ được sử dụng phổ cập giúp nhận diện sự vi phạm giả định phần dư chuẩn hóa.

Đối với biểu đồ Normal P-P Plot, nếu những điểm tài liệu trong phân phối của phần dư bám sát vào đường chéo, phần dư càng có phân phối chuẩn. Nếu những điểm tài liệu phân loại xa đường chéo, phân phối càng “ít chuẩn”.

Cụ thể với vị dụ trên, những điểm tài liệu phần dư triệu tập khá sát với đường chéo, như vậy, phần dư có phân phối xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không biến thành vi phạm.

4.3 Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến tính

Một giả định trong hồi quy là phải có mối liên hệ tuyến tính giữa biến phụ thuộc với những biến độc lập. Biểu đồ phân tán Scatter Plot Một trong những phần dư chuẩn hóa và giá trị Dự kiến chuẩn hóa giúp toàn bộ chúng ta dò tìm xem tài liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay là không. 

Nếu những điểm tài liệu phân loại triệu tập xung quanh đường tung độ 0 và có Xu thế tạo thành một đường thẳng, giả định liên hệ tuyến tính không biến thành vi phạm. Cách sắp xếp của điểm tài liệu trên đồ thị scatter sẽ tùy thuộc vào bản chất biến phụ thuộc, khi nhìn nhận, toàn bộ chúng ta cần nhìn tổng quát xu vị trí hướng của đám mây điểm tài liệu.

Cụ thể với tập tài liệu mẫu, phần dư chuẩn hóa phân loại triệu tập xunh quanh đường tung độ 0, do vậy giả định quan hệ tuyến tính không biến thành vi phạm.

Nếu bạn gặp trở ngại vất vả khi thực thi phân tích hồi quy bội giá trị R2 hiệu chỉnh quá thấp, tác nhân độc bị loại không như ý muốn, xẩy ra tự tương quan hoặc đa cộng tuyến,… bạn hoàn toàn có thể tìm hiểu thêm dịch vụ chạy thuê SPSS của Phạm Lộc Blog hoặc liên hệ trực tiếp email . 

Tải thêm tài liệu liên quan đến nội dung bài viết Kiểm định giả thuyết thông số hồi quy

Reply
2
0
Chia sẻ

Video Kiểm định giả thuyết thông số hồi quy ?

You vừa tìm hiểu thêm tài liệu Với Một số hướng dẫn một cách rõ ràng hơn về Review Kiểm định giả thuyết thông số hồi quy tiên tiến và phát triển nhất

Share Link Download Kiểm định giả thuyết thông số hồi quy miễn phí

Pro đang tìm một số trong những ShareLink Tải Kiểm định giả thuyết thông số hồi quy Free.

Hỏi đáp vướng mắc về Kiểm định giả thuyết thông số hồi quy

Nếu sau khi đọc nội dung bài viết Kiểm định giả thuyết thông số hồi quy vẫn chưa hiểu thì hoàn toàn có thể lại phản hồi ở cuối bài để Mình lý giải và hướng dẫn lại nha
#Kiểm #định #giả #thuyết #hệ #số #hồi #quy