Правило трьох сигм - це
Правило трьох сигм
Стандартне відхилення (іноді середньоквадратичне відхилення) - в теорії ймовірності та статистики найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. Вимірюється в одиницях виміру самої випадкової величини. Дорівнює кореню квадратному з дисперсії випадкової величини. Стандартне відхилення використовують при розрахунку стандартної помилки середнього арифметичного. при побудові довірчих інтервалів, при статистичній перевірці гіпотез, при вимірюванні лінійного взаємозв'язку між випадковими величинами.
де - стандарт, стандартне відхилення, несмещенная оцінка середньоквадратичного відхилення випадкової величини X відносно її математичного очікування; - дисперсія; - i-й елемент вибірки; - середнє арифметичне вибірки; - обсяг вибірки.
Слід зазначити відмінність стандарту (в знаменнику n - 1) від кореня з дисперсії (середнє відхилення) (в знаменнику n), при малому обсязі вибірки оцінка дисперсії через останню величину є кілька зміщеною, при нескінченно великому обсязі вибірки різниця між зазначеними величинами зникає. Вибірка - лише частина генеральної сукупності. Генеральна сукупність - абсолютно всі можливі результати. Отримати результат, який не входить в генеральну сукупність абсолютно неможливо в принципі. Для випадку з киданням монетки генеральною сукупністю є. решка, ребро, Прилуки. а ось пара Прилуки-решка вже лише вибірка. Для генеральної сукупності математичне очікування збігаються з істинним значенням оцінюваного параметра. А ось для вибірки не факт. Математичне сподівання вибірки має зсув щодо істинного значення параметра. В силу цього, середньоквадратична помилка більше ніж дисперсія, так як дисперсія - математичне очікування квадрата відхилення від середнього значення, а середньоквадратичне відхилення - математичне очікування відхилення від істинного значення. Різниця в тому, від чого шукаємо відхилення, коли дисперсія, то від середнього і не важливо справжнє це середнє або помилково, а коли середньоквадратичне відхилення, то шукаємо відхилення від істинного значення.
Правило 3-х сигм () - практично всі значення нормально розподіленої випадкової величини лежать в інтервалі. Більш строго - не менше ніж з 99,7% достовірністю, значення нормально розподіленої випадкової величини лежить в зазначеному інтервалі. За умови що величина справжня, а не отримана в результаті обробки вибірки. Якщо ж справжня величина невідома, то слід користуватися не σ. а s. Таким чином, правило 3-х сигм перетвориться в правило трьох s