коефіцієнт детермінації
2 - величина розкиду спостережуваних значень y щодо середнього.
2 = 2 + 2 + 2 + 2 ()
Вектор y в векторній формі:
e 'вектори залишків ортогональні.
Де - загальна сума квадратів, загальна сума розкиду y щодо
де-сума квадратів залишків регресії (чи не пояснюються з пом. регресії), - фактичні і розрахункові значення пояснюється змінної.
де - пояснений сума квадратів, міра розкиду, пояснюється за допомогою регресії.
R 2 - коефіцієнт детермінації, показують якусь частину дисперсії розкиду ендогенної змінної щодо свого середнього вдається пояснити коливаннями екзогенних змінних.
R 2 =. R 2 [0,1].
Коефіцієнт детермінації для моделі з константою приймає значення від 0 до 1. Чим ближче значення коефіцієнта до 1, тим сильніше залежність. При оцінці регресійних моделей це інтерпретується як відповідність моделі даних. Для прийнятних моделей передбачається, що коефіцієнт детермінації повинен бути хоча б не менше 50% (в цьому випадку коефіцієнт множинної кореляції перевищує по модулю 70%). Моделі з коефіцієнтом детермінації вище 80% можна визнати досить хорошими (коефіцієнт кореляції перевищує 90%). Значення коефіцієнта детермінації 1 означає функціональну залежність між змінними.
1. R 2 зростає при додаванні ще одного регресорів
2. R 2 змінюється при простому перетворенні залежних змінних.
Основна проблема застосування R 2 полягає в тому, що його значення збільшується від додавання в модель нових змінних, навіть якщо ці змінні ніякого відношення до пояснюється змінної не мають. Тому порівняння моделей з різною кількістю чинників за допомогою коефіцієнта детермінації некоректно. Для цих цілей можна використовувати альтернативні показники.
Для того, щоб була можливість порівнювати моделі з різним числом факторів так, щоб число регресорів не впливало на статистику R 2 зазвичай використовується скоригований коефіцієнт детермінації. в якому використовуються несмещённие оцінки дисперсій:
де n - кількість спостережень, а k - кількість параметрів.
Даний показник завжди менше одиниці, але теоретично може бути і менше нуля (тільки при дуже маленькому значенні звичайного коефіцієнта детермінації і великій кількості факторів). Тому втрачається інтерпретація показника як "частки".
Перевірка загальної якості коефіцієнта регресії. Перевірка гіпотези: H0. .
Статистика має розподіл Фішера з ступенями свободи, -Статистика завжди позитивна.
Гіпотеза H0 відхиляється на заданому рівні значущості, якщо виконується c. Це означає, що пояснена дисперсія істотно більше залишкової, тобто рівняння регресії досить якісно визначає динаміку зміни залежної змінної y.
Перевірка гіпотези: H0. .