Властивості регресійних залишків
Відповідно до другого умові Гаусса-Маркова для результативного застосування МНК потрібно, щоб дисперсія залишків - різниці значень вихідних даних і даних, отриманих по рівнянню регресії, була гомоскедастичність, тобто однорідною. Це означає, що для кожного значення фактора залишки мають однакову дисперсію. При малому обсязі вибірки для оцінки гетероскедастичності (порушення гомоскедастичність) може використовуватися метод Гольдфельда-Квандта (Goldfeld-Quandt). Основна ідея тесту Гольдфельда-Квандта полягає в наступному:
§ виключення з розгляду C центральних спостережень; при цьому . де - число оцінюваних параметрів;
§ поділ сукупності з (n-C) спостережень на дві групи (відповідно з малими і великими значеннями Х) і визначення по кожній групі рівнянь регресії;
При виконанні нульової гіпотези про гомоскедастичність відношення F буде задовольняти F-критерієм з числом ступенів свободи для кожної залишкової суми квадратів. Чим більше величина F перевищує табличне значення. тим сильніше порушена передумова про рівність дисперсій залишкових величин. Якщо обчислене значення більше. то слід врахувати наступне:
§ середні квадратичні помилки коефіцієнтів регресії будуть занижені, що може привести до помилкового висновку про значимість параметрів рівняння регресії;
§ отримані оцінки параметрів є незміщеними оцінками bi. тому їх можна використовувати в рівнянні;
§ на практиці стандартні помилки перераховуються за допомогою відомих методів (White, Newey-West).
Згідно з третім умові Гаусса-Маркова для коректного використання рівняння регресії потрібно, відсутність систематичної зв'язку (кореляції) між залишками. Для дослідження поведінки залишків, їх впорядковують за зростанням фактора. Залишки індексуються величиною t. Найменшим значенням фактора відповідає t = 1 і залишок e1. наступного значенням фактора соответствуетt = 2 і залишок e2. і т.д. до значення t = n. Індекс t можна розглядати як час і говорити про поточний і попередніх моментах часу.
Автокорреляция в залишках - кореляційний залежність між значеннями залишків et за поточний і попередній моменти часу. Для визначення автокореляції залишків використовують критерій Дарбіна-Уотсона (Durbin-Watson). Для цього обчислюють величину за такою формулою:
де - залишок попереднього рівня.
Для значення виконується співвідношення. За таблицями знаходять два критичних значення: нижній рівень - і верхній -. значення яких залежить від кількості спостережень. складності моделі (кількості параметрів) і обраного рівня значущості. Якщо перевищує 2. то це свідчить про негативну кореляцію і перед порівнянням його величину треба перетворити:.
Якщо - модель неадекватна, залишки сильно автокорреліровани.
Якщо - залишки некорреліровани, модель адекватна.
Якщо - однозначного висновку зробити не можна і необхідно застосовувати інші критерії.
Якщо в залишках повна позитивна автокорреляция, то. якщо повна негативна, то. якщо автокорреляция залишків відсутня, то.
Якщо виявлена автокорреляция, то, як і в випадку з гетероскедастичності, слід пам'ятати: стандартні помилки будуть занижені, що може привести до помилкового висновку про значимість коефіцієнтів рівняння регресії. При порушенні гомоскедастичність і наявності автокореляції помилок рекомендується традиційний МНК замінювати узагальненим методом (ОМНК), який застосовується до перетвореним даними.
Вельми вірогідна позитивна автокорреляция залишків. Н0 відхиляється.
Немає підстав відхиляти Н0. Автокорреляция залишків відсутня.