Чему равен коэффициент корреляции если cov x y 10 var x 25 vary 16

Расчет коэффициента корреляции

Методы расчета коэффициента корреляции

Размещено на www.rnz.ru

В том случае, когда причинная зависимость действует не в каждом конкретном случае, а в общем для всей наблюдаемой совокупности, среднем при значительном количестве наблюдений, то такая зависимость является стохастической. Частным случаем стохастической зависимости выступает корреляционная связь, при которой изменение средней величины результативного показателя вызвано изменением значений факторных показателей. Расчет степени тесноты и направления связи выступает значимой задачей исследования и количественной оценки взаимосвязи различных социально-экономических явлений. Определение степени тесноты связи между различными показателями требует определение уровня соотношения изменения результативного признака от изменения одного (в случае исследования парных зависимостей) либо вариации нескольких (в случае исследования множественных зависимостей) признаков-факторов. Для определения такого уровня используется коэффициент корреляции.

Линейный коэффициент корреляции был впервые введен в начале 90-х гг. XIX в. Пирсоном и показывает степень тесноты и направления связи между двумя коррелируемыми факторами в случае, если между ними имеется линейная зависимость. При интерпретации получаемого значения линейного коэффициента корреляции степень тесноты связи между признаками оценивается по шкале Чеддока, один из вариантов этой шкалы приведен в нижеследующей таблице:

Шкала Чеддока количественной оценки степени тесноты связи

Источник

Коэффициент корреляции Спирмена

Расчет коэффициента ранговой корреляции Спирмена.

by sa

Этот материал распространяется на условиях лицензии Creative Commons Attribution/Share-Alike License 3.0 (Unported). Это означает, что вы можете размещать этот контент на своем сайте или создавать на его основе собственный (в том числе и в коммерческих целях), при условии сохранения оригинального лицензионного соглашения. Кроме того, Вы должны отметить автора этой работы, путем размещения HTML ссылки на оригинал работы https://planetcalc.ru/987/. Пожалуйста оставьте без изменения все ссылки на других авторов данной работы или работы, на основе которой создана данная работа (если таковые имеются в спроводительном тексте).

Калькулятор ниже вычисляет коэффициент ранговой корреляции Спирмена между двумя случайными величинами. Теоретическая часть, чтобы не отвлекаться от калькулятора, традиционно размещается под ним.

Коэффициент корреляции Спирмена

Изменения случайных величин

Изменения случайных величин

Импортировать данные Ошибка импорта

Метод расчета коэффициента ранговой корреляции Спирмена на самом деле описывается очень просто. Это тот же самый Коэффициент корреляции Пирсона, только рассчитанный не для самих результатов измерений случайных величин, а для их ранговых значений.

Осталось только разобраться, что такое ранговые значения и для чего все это нужно.

Если элементы вариационного ряда расположить в порядке возрастания или убывания, то рангом элемента будет являться его номер в этом упорядоченном ряду.

Например, пусть у нас есть вариационный ряд <17,26,5,14,21>. Отсортируем его элементы в порядке убывания <26,21,17,14,5>. 26 имеет ранг 1, 21 — ранг 2 и т.д. Вариационный ряд ранговых значений будет выглядеть следующим образом <3,1,5,4,2>.

То есть, при расчете коэффициента Спирмена исходные вариационные ряды преобразуются в вариационные ряды ранговых значений, после чего к ним применяется формула Пирсона.

Если же повторяющихся значений нет, то есть все значения ранговых рядов — числа из диапазона от 1 до n, формулу Пирсона можно упростить до

Ну и кстати, эта формула чаще всего и приводится как формула расчета коэффицента Спирмена.

В чем же суть перехода от самих значений к их ранговым значениям?
А суть в том, что исследуя корреляцию ранговых значений можно установить насколько хорошо зависимость двух переменных описывается монотонной функцией.

То есть, в отличие от коэффициента корреляции Пирсона, который может выявить только линейную зависимость одной переменной от другой, коэффициент корреляции Спирмена может выявить монотонную зависимость, там, где непосредственная линейная связь не выявляется.

Источник

Пример вычисления ковариации, построения графика и уравнения линейной регрессии нашим сервисом:

k 1 2 3 4 5 6 7 8 9 10
xk 51.00000 50.00000 48.00000 51.00000 46.00000 47.00000 49.00000 60.00000 51.00000 52.00000
yk 13.00000 15.00000 13.00000 16.00000 12.00000 14.00000 12.00000 10.00000 18.00000 10.00000

k 11
xk 56.00000
yk 12.00000

Требуется вычислить/построить:
— коэффициент ковариации;
— коэффициент корреляции;
— проверить гипотезу зависимости случайных величин X и Y, при уровне значимости α = 0.05 ;
— коэффициенты уравнения линейной регрессии;
— диаграмму рассеяния (корреляционное поле) и график линии регрессии;

РЕШЕНИЕ:

1. Вычисляем коэффициент ковариации.

То есть, ковариация, это математическое ожидание произведения центрированных случайных величин

1.1. Вычислим оценку математического ожидания случайной величины Х.

1.1.1. Сложим последовательно все элементы выборки X

1.1.2. Разделим полученную сумму на число элементов выборки

561.00000 / 11 = 51.00000

Mx = 51.000000

1.2. Аналогичным образом вычислим оценку математического ожидания случайной величины Y.

1.2.1. Сложим последовательно все элементы выборки Y

1.2.2. Разделим полученную сумму на число элементов выборки

145.000000 / 11 = 13.18182

My = 13.181818

Таблица 1


k
xk yk ( хkMx ) ( ykMy ) ( хkMx )•( ykMy ) 1 2 3 4 5 6 1 51 13 0.00000 -0.18182 0.00000 2 50 15 -1.00000 1.81818 -1.81818 3 48 13 -3.00000 -0.18182 0.54545 4 51 16 0.00000 2.81818 0.00000 5 46 12 -5.00000 -1.18182 5.90909 6 47 14 -4.00000 0.81818 -3.27273 7 49 12 -2.00000 -1.18182 2.36364 8 60 10 9.00000 -3.18182 -28.63636 9 51 18 0.00000 4.81818 0.00000 10 52 10 1.00000 -3.18182 -3.18182 11 56 12 5.00000 -1.18182 -5.90909

1.5. Вычислим ковариацию cov(X,Y) как среднее значение элементов 6-го столбца таблицы 1.

1.5.1. Сложим последовательно все элементы 6-го столбца

1.5.2. Разделим полученную сумму на число элементов выборки

2. Вычисляем коэффициент корреляции.

Вычислить коэффициент корреляции можно по следующим формулам:

Таблица 2


k
xk yk ( хkMx ) ( хkMx ) 2 ( ykMy ) ( ykMy ) 2 1 2 3 4 5 6 7 1 51 13 0.00000 0.00000 -0.18182 0.03306 2 50 15 -1.00000 1.00000 1.81818 3.30579 3 48 13 -3.00000 9.00000 -0.18182 0.03306 4 51 16 0.00000 0.00000 2.81818 7.94215 5 46 12 -5.00000 25.00000 -1.18182 1.39669 6 47 14 -4.00000 16.00000 0.81818 0.66942 7 49 12 -2.00000 4.00000 -1.18182 1.39669 8 60 10 9.00000 81.00000 -3.18182 10.12397 9 51 18 0.00000 0.00000 4.81818 23.21488 10 52 10 1.00000 1.00000 -3.18182 10.12397 11 56 12 5.00000 25.00000 -1.18182 1.39669

2.2. Вычислим σ x 2 как среднее значение элементов 5-го столбца таблицы 2.

2.2.1. Сложим последовательно все элементы 5-го столбца

2.2.2. Разделим полученную сумму на число элементов выборки

σ x 2 = 162.00000 / 11 = 14.727273

2.3. Вычислим σ y 2 как среднее значение элементов 7-го столбца таблицы 2.

2.3.1. Сложим последовательно все элементы 7-го столбца

2.3.2. Разделим полученную сумму на число элементов выборки

σ y 2 = 59.636364 / 11 = 5.421488

σ x 2 σ y 2 = 14.727273• 5.421488 = 79.843727

2.5. Извлечем из последнего числа квадратный корень, получим значение σ x σ y .

σ x σ y = 8.935532

2.5.Вычислим коэффициент корреляции по формуле ( 2.1 ).

3. Проверяем значимость коэффициента корреляции (проверяем гипотезу зависимости).

Рассчитанный по формуле ( 4.2 ) коэффициент b называют коэффициентом линейной регрессии. В некоторых источниках a называют постоянным коэффициентом регрессии и b соответственно переменным.

Погрешности предсказания Y по заданному значению X вычисляются по формулам :

Величину σ y/x (формула 4.4 ) еще называют остаточным средним квадратическим отклонением, оно характеризует уход величины Y от линии регрессии, описываемой уравнением ( 4.1 ), при фиксированном (заданном) значении X.

4.1. Вычислим отношение
σ y 2
σ x 2
.

σ y 2 / σ x 2 = 5.42149 / 14.72727 = 0.36813

4.3 Вычислим коэффициент b по формуле ( 4.2 )

4.4 Вычислим коэффициент a по формуле ( 4.3 )

4.5 Оценим погрешности уравнения регрессии.

4.5.1 Извлечем из σy 2 квадратный корень получим:

σy =
5.42149
= 2.32841 ;

4.5.2 Возведем в квадрат R x,y получим:

4.5.3 Вычислим абсолютную погрешность (остаточное среднее квадратическое отклонение) по формуле ( 4.4 )

δ y/x = ( 2.18467 / 13.18182)100% = 16.57335%

5. Строим диаграмму рассеяния (корреляционное поле) и график линии регрессии.

5.1. Находим минимальный и максимальный элемент выборки X это 5-й и 8-й элементы соответственно, xmin = 46.00000 и xmax = 60.00000.

5.2. Находим минимальный и максимальный элемент выборки Y это 8-й и 9-й элементы соответственно, ymin = 10.00000 и ymax = 18.00000.

5.3. На оси абсцисс выбираем начальную точку чуть левее точки x 5 = 46.00000, и такой масштаб, чтобы на оси поместилась точка x 8 = 60.00000 и отчетливо различались остальные точки.

5.4. На оси ординат выбираем начальную точку чуть левее точки y 8 = 10.00000, и такой масштаб, чтобы на оси поместилась точка y 9 = 18.00000 и отчетливо различались остальные точки.

5.7. Начертим линию регрессии.

Линия регрессии показана на рисунке ниже красным цветом

Источник

Коэффициент корреляции: что нужно знать, формула, пример расчёта в Excel

koeffitsient korrelyatsii prostimi slovami

Приветствую всех читателей моего блога! Давненько я не писал статей по основам инвестирования. Сегодня хочу рассказать вам таком понятии как корреляция, которая имеет отношение к созданию качественного инвестиционного портфеля и диверсификации ваших вложений.

Если говорить о том, что такое корреляция простыми словами, то это по сути связь между двумя явлениями, выраженными в числовой форме. Например, проанализировав данные по ВВП на душу населения и продолжительности жизни в странах мира, мы невооруженным глазом заметим тенденцию:

А благодаря расчёту коэффициента корреляции мы можем узнать силу взаимосвязи в конкретном числовом выражении. Это очень удобно и полезно при анализе данных в самых разных областях науки, в том числе в экономике и инвестировании.

Сегодня я расскажу вам подробнее о том, что такое корреляция простыми словами, без сложных формул и терминов. Также я покажу вам, как правильно и легко рассчитать коэффициент корреляции в Excel и как правильно интерпретировать результаты, чтобы использовать их для составления инвестиционного портфеля.

А чтобы не пропускать следующие статьи блога, подписывайтесь на мой Телеграм-канал! Там же я выкладываю отчёты по инвестициям, сообщаю об обновлениях в моем инвест-портфеле и иногда пишу заметки на интересные темы. Даже чатик инвесторов у нас есть, присоединяйтесь 🙂

Ваши подписки помогают развивать блог и делать его более интересным как для читателей, так и для поисковых систем, так что заранее благодарен каждому подписчику 🙂

Спасибо за внимание, продолжаем!

Что такое корреляция простыми словами

Не хочу вас сразу грузить формулами и расчётами, об этом поговорим ближе к концу. Давайте сначала разберемся, что по своей сути означает цифра коэффициента корреляции, которую вы можете встретить в какой-нибудь книге или статье.

zhacheniya korrelyatsii

Если значение близко к единице или минус единице — значит два явления так или иначе сильно взаимосвязаны. Впрочем, причины этого не всегда очевидны — явление А может влиять на явление B, может быть наоборот. Нередко бывает, что существует явление C, которое приводит в движение А и В одновременно. В общем, природа корреляции — это уже второй вопрос, которым должны заниматься исследователи.

При высокой положительной корреляции вслед за графиком А растёт и график B, и чем выше значение, тем слаженнее оба движутся. Для наглядности, вот как выглядит корреляция +1:

polozhitelnaya korrelyatsiya

Движения графиков полностью повторяют друг друга, причем это как в случае простого добавления, так и с множителем.

otritsatelnaya korrelyatsiya

Движения графиков похожи на зеркальные отражения.

Коэффициент корреляции — удобный инструмент для анализа во многих сферах науки и жизни. Его легко рассчитать в Excel и применить, поэтому самая большая сложность в работе с ним — грамотно подобрать данные для расчёта. Основное правило — чем больше данных, тем лучше. Многие взаимосвязи проявляют себя лишь на длинной дистанции.

Также нужно следить за тем, чтобы найденные корреляции не были ложными.

Ложные корреляции

Дело в том, что с помощью коэффициента корреляции можно проверить на взаимосвязь любые явления, которые можно выразить в числовом выражении. То есть, реально любые — например количество свадеб в Нью-Йорке и объем импорта нефти в США из Норвегии:

Корреляция составила 86%! Действительно ли свадьбы влияют на экспорт нефти? Разумеется, нет — подобная зависимость совершенно случайна. Именно так выглядит ловушка ложной корреляции — она может показать взаимосвязь там, где её на самом деле нет.

Не хочу сильно заострять внимание на этой проблеме, так что если интересно поразбираться — нашел для вас видео, в котором найдете еще несколько примеров странных взаимосвязей и причины их появления:

В общем, на результаты корреляционного анализа есть смысл обращать внимание, когда связь между явлениями уже известна или подозревается. В противном случае это может быть всего лишь число, которое ничего не значит.

Корреляция и диверсификация

Как знания о корреляции активов могут помочь лучше вкладывать деньги? Думаю, вы все хорошо знакомы с золотым правилом инвестора — не клади все яйца в одну корзину. Речь, естественно, идёт о диверсификации инвестиционных активов в портфеле. Корреляция и диверсификация неразрывно связаны, что понятно даже из названия — английское diversify означает «разнообразить», а как коэффициент корреляции как раз показывает схожесть или различие двух явлений.

Другими словами, инвестировать в финансовые инструменты с высокой корреляцией не очень хорошо. Почему? Все просто — похожие активы плохо диверсифицируются. Вот пример портфеля двух активов с корреляцией +1:

diversifikatsiya polozhitelnaya korrelyatsiya

Как видите, график портфеля во всех деталях повторяет графики каждого из активов — рост и падение обоих активов синхронны. Диверсификация в теории должна снижать инвестиционные риски за счёт того, что убытки одного актива перекрываются за счёт прибыли другого, но здесь этого не происходит совершенно. Все показатели просто усредняются:

image 30

Портфель даёт небольшой выигрыш в снижении рисков — но только по сравнению с более доходным Активом 1. А так, никаких преимуществ по сути нет, нам лучше просто вложить все деньги в Актив 1 и не париться.

А вот пример портфеля двух активов с корреляцией близкой к 0:

diversifikatsiya nulevaya korrelyatsiya 2

Где-то графики следуют друг за другом, где-то в противоположных направлениях, какой-либо однозначной связи не наблюдается. И вот здесь диверсификация уже работает:

image 31

Мы видим заметное снижение СКО, а значит портфель будет менее волатильным и более стабильно расти. Также видим небольшое снижение максимальной просадки, особенно если сравнивать с Активом 1. Инвестиционные инструменты без корреляции достаточно часто встречаются и из них имеет смысл составлять портфель.

diversifikatsiya obratnaya korrelyatsiya

Уже знакомое вам «зеркало» позволяет довести показатели риска портфеля до минимальных:

image 28

Несмотря на то, что каждый из активов обладает определенным риском, портфель получился фактически безрисковым. Какая-то магия, не правда ли? Очень жаль, но на практике такого не бывает, иначе инвестирование было бы слишком лёгким занятием.

Коэффициент корреляции и ПАММ-счета

С расчётом корреляции я как студент экономического ВУЗа познакомился еще на втором курсе. Тем не менее, долгое время недооценивал важность расчёта корреляции именно для подбора ПАММ-портфеля. 2018 год очень четко показал, что ПАММ-счета с похожими стратегиями в случае кризиса могут вести себя очень похоже.

Случилось так, что с середины года отказала не просто одна стратегия управляющего, а большинство торговых систем, завязанных на активные движения валютной пары EUR/USD:

korrelyatsiya pamm schetov

Рынок был для каждого управляющего по-своему неблагоприятным, но присутствие их всех в портфеле привело к большой просадке. Совпадение? Не совсем, ведь это были ПАММ-счета с похожими элементами в торговых стратегиях. Без опыта торговли на рынке Форекс может быть сложно понять, как это работает, но по корреляционной таблице степень взаимосвязи видна и так:

image 34

Мы ранее рассматривали корреляцию вплоть до +1, но как видите на практике даже совпадение в районе 20-30% уже говорит о некоторой схожести ПАММ-счетов и, как следствие, результатов торговли.

Чтобы снизить шансы на повторение ситуации, как в 2018 году, я считаю в портфель стоит подбирать ПАММ-счета с низкой взаимной корреляцией. По сути, нам нужны уникальные стратегии с разными подходами и разными валютными парами для торговли. На практике, конечно, сложнее подобрать прибыльные счета с уникальными стратегиями, но если хорошо покопаться в рейтинге ПАММ-счетов, то все возможно. К тому же, низкая взаимная корреляция снижает требования для диверсификации, 5-6 счетов вполне хватит.

Пару слов о расчёте коэффициента корреляции для ПАММ-счетов. Достать сами данные относительно несложно, в Альпари прямо с сайта, для остальных площадок через сайт investflow.ru. Однако с ними нужно сделать небольшие преобразования.

Данные о прибыльности ПАММов изначально хранятся в формате накопленной доходности, нам это не подходит. Корреляция стандартных графиков доходности двух прибыльных ПАММ-счетов всегда будет очень высокой, просто потому что они все движутся в правый верхний угол:

image 35

У всех счетов положительная корреляция от 0.5 и выше за редким исключением, так мы ничего не поймем. Реальное сходство стратегий ПАММ-счетов можно увидеть только по дневным доходностям. Рассчитать их не особо сложно, если знаете нужные формулы доходности. Если прибыль или убыток двух ПАММ-счетов совпадают по дням и по процентам, высока вероятность что их стратегии имеют общие элементы — и коэффициент корреляции нам это покажет:

image 37

Как видите, некоторые корреляции стали нулевыми, а некоторые остались на высоком уровне. Мы теперь видим, какие ПАММ-счета действительно похожи между собой, а какие не имеют ничего общего.

Напоследок давайте разберёмся, что делать и как посчитать корреляцию, если у вас появилась в этом необходимость.

Коэффициент корреляции в Excel и формула расчёта

Вероятно, вас интересует, как самостоятельно рассчитать корреляцию двух инвестиционных активов. До изобретения компьютеров приходилось делать это вручную, для чего использовалась вот такая формула коэффициента корреляции:

image 38

Кстати, студентам на экзамене до сих пор компьютеров не выдают, хоть калькулятор можно и на том спасибо. Как вы понимаете, занятие все равно трудоёмкое 🙂

Профессиональному инвестору может понадобиться рассчитать сотни корреляций, так что вариант по формуле не подходит. Естественно, эта задача уже давно автоматизирована, и, как по мне, проще всего рассчитать коэффициент корреляции в Excel.

Чтобы далеко за примером не ходить, давайте рассчитаем корреляцию двух популярных ПАММ-счетов Lucky Pound и Hohla EUR. Они находятся на площадке компании Alpari, а значит мы можем скачать историю доходности прямо с сайта:

lucky hohla korrelyatsiya

Далее нам надо скопировать историю доходности в один файл, для удобства. Для точного расчета корреляции в Excel нам в принципе хватит и двух лет истории, располагаем данные так:

image 39

Теперь, как я уже писал выше, для ПАММ-счетов (и для многих других инвестиционных инструментов) надо рассчитать дневные доходности:

image 40

А дальше все просто — используется встроенная формула коэффицента корреляции в Excel =КОРРЕЛ():

image 41

Получили значение 0.12, а значит стратегии ПАММ-счетов практически не имеют ничего общего. Это хорошо для диверсификации, так что можно добавлять обоих в инвестиционный портфель.

При желании, можно сделать табличку на весь ваш портфель. Тогда если у вас появится новый вариант для инвестирования, вы сможете сразу сравнить его с каждым активом и увидеть, есть ли нежелательные корреляции.

Мне понравилось работать над этой темой и статья получилась неплохой. Если вы согласны с этим, сделайте доброе дело и поделитесь ссылочкой с друзьями и коллегами 🙂

Ну а я пошел делать следующую статью. Есть еще одна интересная тема по основам инвестирования, которую я хочу подробно обсудить… Будет обидно, если пропустите, так что подписывайтесь на обновления блога по почте или через соцсети.

Источник

Комфорт
Adblock
detector