Як скласти рівняння регресії


 

Як лікар встановлює діагноз? Він розглядає сукупність ознак (симптомів), а потім приймає рішення про хворобу. Насправді, він усього лише робить певний прогноз, спираючись на деяку сукупність ознак. Це завдання легко формалізувати. Очевидно, що як встановлені симптоми, так і діагнози в якійсь мірі випадкові. Саме з такого роду первинних прикладів починається побудова регресійного аналізу.


Інструкція

  1. Основна задача регресійного аналізу — встановлення прогнозів про значення якої-небудь випадкової величини, на основі даних про іншу величині. Нехай безліч факторів, що впливають на прогноз випадкова величина — Х, а безліч прогнозів — випадкова величина Y. Прогноз повинен бути конкретним, тобто необхідно вибрати значення випадкової величини Y = y. Це значення (оцінка Y = y *) вибирається на основі критерію якості оцінки (мінімуму дисперсії).
  2. За оцінку в регресійному аналізі беруть апостеріорного математичне сподівання. Якщо щільність ймовірності випадкової величини Y позначити p (y), то апостеріорна щільність позначається як p (y | X = x) або p (y | x). Тоді y * = M {Y | = x} = ∫ yp (y | x) dy (мається увазі інтеграл по Вcем значенням). Дана оптимальна оцінка y *, розглянута як функція х, називається регресією Y на X.
  3. Будь прогноз може залежати від безлічі факторів, виникає багатофакторна регресія. Проте в даному випадку слід обмежитися однофакторной регресією, пам’ятаючи, що в деяких випадках набір прогнозів традиційний і може бути розглянуто як єдиний у всій своїй сукупності (скажімо ранок — це схід сонця, закінчення ночі, найвища точка роси, найсолодший сон …) .
  4. Найбільш широке поширення отримала лінійна регресія y = a + Rx. Число R називається коефіцієнтом регресії. Рідше зустрічається квадратична — y = с + bx + ax ^ 2.

  5. Як скласти рівняння регресії

                            Визначення параметрів лінійної та квадратичної регресії можна здійснити за допомогою методу найменших квадратів, який грунтується на вимозі мінімальної суми квадратів відхилень табличній функції від апроксимуючої величини. Його застосування для лінійної і квадратичної апроксимацій призводить до систем лінійних рівнянь щодо коефіцієнтів (див. рис. 1а і 1b):
  6. Проводити обчислення «вручну» вкрай трудомістким. Тому доведеться обмежитися самим коротким прикладом. Для практичної роботи вам буде потрібно використовувати програмне забезпечення, призначене для розрахунку мінімальної суми квадратів, якого, в принципі, досить багато.
  7. Приклад. Нехай фактори: х1 = 0, х2 = 5, х3 = 10. Прогнози: y1 = 2,5, y2 = 11, y = 23. Знайти рівняння лінійної регресії.
    Рішення. Складіть систему рівнянь (див. рис. 1а) і вирішіть його будь-яким способом.
    3a +15 R = 36,5 та 15а +125 R = 285. R = 2,23; a = 3,286. y = 3,268 +2,23.
        

Зверніть увагу

Зауваження. Для встановлення лінійної регресії можна використовувати кореляційний аналіз.