Парна нелінійна регресія і кореляція
завдання
1. Знайдіть параметри рівняння.
2. Оцініть тісноту зв'язку за допомогою індексу кореляції.
3. Охарактеризуйте еластичність зміни матеріаломісткості продукції.
4. Зробіть висновок про значущість рівняння регресії.
Подивіться як швидко було вирішено це приклад.
Рішення знаходимо за допомогою сервісу нелінійна регресія.
Для оцінки параметрів # 945; і # 946; - використовують МНК (метод найменших квадратів). Метод найменших квадратів дає найкращі (заможні, ефективні і незсунені) оцінки параметрів рівняння регресії.
Але тільки в тому випадку, якщо виконуються певні передумови щодо випадкового члена (# 949;) і незалежної змінної (x).
Формально критерій МНК можна записати так:
S = Σ (yi - y * i) 2 → min
Система нормальних рівнянь.
a • n + bΣx = Σy
aΣx + bΣx 2 = Σy • x
Для наших даних система рівнянь має вигляд
10a + 0.0449 b = 51.3
0.0449 a + 0.0003 b = 0.28
З першого рівняння висловлюємо а й підставимо в друге рівняння:
Отримуємо емпіричні коефіцієнти регресії: b = 592.31, a = 2.47
Рівняння регресії (емпіричне рівняння регресії):
y = 592.31 / x + 2.47
Емпіричні коефіцієнти регресії a і b є лише оцінками теоретичних коефіцієнтів # 946; i. а саме рівняння відображає лише загальну тенденцію в поведінці розглянутих змінних.
Коефіцієнт еластичності.
Коефіцієнти регресії (в прикладі b) небажано використовувати для безпосередньої оцінки впливу факторів на результативний ознака в тому випадку, якщо існує різниця одиниць виміру результативного показника у і факторної ознаки х.
Для цих цілей обчислюються коефіцієнти еластичності і бета - коефіцієнти.
Середній коефіцієнт еластичності E показує, на скільки відсотків в середньому по сукупності зміниться результат у від своєї середньої величини при зміні фактора x на 1% від свого середнього значення.
Коефіцієнт еластичності знаходиться за формулою:
Коефіцієнт еластичності менше 1. Отже, при зміні Х на 1%, Y зміниться менш ніж на 1%. Іншими словами - вплив Х на Y не суттєво.
Емпіричне кореляційне відношення.
Емпіричне кореляційне відношення обчислюється для всіх форм зв'язку і служить для вимірювання тісноти залежності. Змінюється в межах [0; 1].
Зв'язки між ознаками можуть бути слабкими і сильними (тісними). Їх критерії оцінюються за шкалою Чеддока:
0.1 <η <0.3: слабая;
0.3 <η <0.5: умеренная;
0.5 <η <0.7: заметная;
0.7 <η <0.9: высокая;
0.9 <η <1: весьма высокая;
Індекс кореляції.
Величина індексу кореляції R знаходиться в межах від 0 до 1. Чим ближче вона до одиниці, тим тісніше зв'язок розглянутих ознак, тим надійніше рівняння регресії.
Отримана величина свідчить про те, що фактор x суттєво впливає на y
Для будь-якої форми залежності тіснота зв'язку визначається за допомогою множинного коефіцієнта кореляції.
Даний коефіцієнт є універсальним, так як відображає тісноту зв'язку і точність моделі, а також може використовуватися при будь-якій формі зв'язку змінних. При побудові однофакторной кореляційної моделі коефіцієнт множинної кореляції рівний коефіцієнту парної кореляції rxy.
На відміну від лінійного коефіцієнта кореляції він характеризує тісноту нелінійної зв'язку і не характеризує її напрямок. Змінюється в межах [0; 1].
1.6. Індекс детермінації.
Величину R 2 (рівну відношенню поясненої рівнянням регресії дисперсії результату у до загальної дисперсії у) для нелінійних зв'язків називають індексом детермінації.
Найчастіше, даючи інтерпретацію індексу детермінації, його виражають у відсотках.
тобто в 89.7% випадків зміни х призводять до зміни y. Іншими словами - точність підбору рівняння регресії - висока. Решта 10.3% зміни Y пояснюються чинниками, які не врахованими в моделі.
Завдання № 2
За даними, отриманим від 20 фермерських господарств, виявлено залежність обсягу випуску продукції рослинництва (млн. Руб.) У від чотирьох чинників: а) чисельності працівників (чол.) L; б) кількості мінеральних добрив на 1 га посіву (кг.) М; в) кількості опадів в період вегетації (мл.) R; г) якості грунту (балів) Q. Отримані наступні варіанти рівнянь регресії і довірчі інтервали коефіцієнтів регресії (таблиці 1 і 2):
1) y = 2 + 0,5L + 1,7M - 2R, R 2 = 0,77.
Таблиця 1
Довірчі інтервали для коефіцієнтів регресії при факторі
Примітка. Довірчі інтервали побудовані з ймовірністю P = 0,95.
2) y = 6,4 + 0,7L + 1,5L + 1,5M - 2R + 0,8Q, R 2 = 0,81.
Таблиця 2
Довірчі інтервали для коефіцієнтів регресії при факторі
Примітка. Довірчі інтервали побудовані з ймовірністю P = 0,95.
завдання
1. Відновіть пропущені кордону довірчих інтервалів.
2. Виберіть оптимальний тип рівняння регресії. Дайте інтерпретацію його параметрів і довірчих інтервалів для коефіцієнтів регресії на прикладі одного з факторних ознак.
3. Оцініть доцільність включення в модель y фактора Q.
Правила введення даних
Поставити свої запитання або залишити побажання або зауваження можна внизу сторінки в розділі Disqus.
Можна також залишити заявку на допомогу в розв'язанні контрольних робіт у наших перевірених партнерів (тут або тут).