Як розрахувати коефіцієнт кореляції

Як розрахувати коефіцієнт кореляції

За визначенням, коефіцієнтом кореляції (нормованим кореляційним моментом) називається відношення кореляційного моменту системи двох випадкових величин (ССВ) до його максимального значення. Для того щоб розібратися в суті цього питання, необхідно, насамперед, познайомитися з поняттям кореляційного моменту.

Вам знадобиться

- Папір;
- Ручка.

Інструкція

  1. Визначення: Кореляційним моментом ССВ X і Y називається змішаний центральний момент другого порядку (див. рис.1)

    Тут W (x, y) — спільна щільність ймовірності ССВ

              Кореляційний момент є характеристикою: а) взаємного розкиду значень ССВ щодо точки середніх значень або математичних очікувань (mx, my), б) ступеня лінійного зв’язку між СВ Х і Y.
  2. Властивості кореляційного моменту.

    1. R (xy) = R (yx) — з визначення.

    2. Rxx = Dx (дисперсії) — з визначення.

    3. Для незалежних Х і Y R (xy) = 0.

    Дійсно, при цьому M {Xц, Yц} = M {Xц} M {Yц} = 0. В даному випадку це відсутність лінійного зв’язку, але не будь, а, скажімо, квадратичної.

    4. При наявності «жорсткої лінійного зв’язку між X і Y, Y = aX + b — | R (xy) | = бxбy = max.

    5. -Бxбy ≤ R (xy) ≤ бxбy.
  3. Тепер повернемося до розгляду коефіцієнта кореляції r (xy), сенс якого полягає в лінійного зв’язку між СВ. Його значення змінюється від -1 до 1, крім того він не володіє розмірністю. У відповідності зі сказаним, можна записати:

                                                            R (xy) = R (xy) / бxбy (1)
  4. Для пояснення сенсу нормованого кореляційного моменту, уявіть собі, що отримані дослідним шляхом значення СВ Х і Y є координатами точки на площині. При наявності «жорсткої» лінійного зв’язку ці точки в точності ляжуть на пряму лінію Y = aX + b. Возьмтіе тільки позитивні значення кореляції (при а
  5. При r (xy) = 0 всі отримані точки опиняться всередині еліпса з центром в (mx, my), величина півосей якого визначається значеннями дисперсій СВ.

    На цьому питання про розрахунок r (xy), здавалося б, можна вважати вичерпаним (див. формулу (1)). Проблема полягає в тому, що дослідник, який отримав значення СВ експериментально, не може на всі 100% знати щільність ймовірності W (x, y). Тому краще вважати, що в поставленій задачі розглядаються вибіркові значення СВ (тобто отриманими в досвіді), і використовувати оцінки потрібних величин. Тоді оцінка

    mx *= (1 / n) (x1 + x2 + … + xn) (для СВ Y аналогічно). Dx *= (1 / (n-1)) ((x1-mx *) ^ 2 + (x2-mx *) ^ 2 + …

    + (Xn-mx *) ^ 2). R * x = (1 / (n-1)) ((x1-mx *) (y1-my *) + (x2-mx *) (y2-my *) + … + (xn-mx *) (yn — my *)). бx *= sqrtDx (те ж для СВ Y).

    Тепер можна сміливо для оцінок використовувати формулу (1).