- Корреляция случайных величин
- Содержание
- Вычисление [ править ]
- Корреляция и взаимосвязь величин [ править ]
- Свойства корреляции [ править ]
- Примеры [ править ]
- Определение корреляции по диаграмме [ править ]
- Определение корреляции по таблице [ править ]
- Коэффициент корреляции
- Что такое Коэффициент корреляции?
- Понимание коэффициента корреляции
- Краткая справка
- Ключевые моменты
- Статистика корреляции и инвестирование
- Уравнение коэффициента корреляции
- Часто задаваемые вопросы
- Что подразумевается под коэффициентом корреляции?
- Как рассчитать коэффициент корреляции?
- How is the correlation coefficient used in investing?
- Корреляция и коэффициент корреляции
- Коэффициент корреляции
- Корреляция и Ковариация
- Линейная корреляционная связь
- Ковариация
- Коэффициент линейной корреляции
- Примеры
Корреляция случайных величин
Определение: |
Среднеквадратичным отклонением (англ. standart deviation) [math]\sigma_<\eta>[/math] называется величина, равная квадратному корню из дисперсии случайной величины [math]\eta[/math] [math]\sigma_<\eta>=\sqrt |
Содержание
Вычисление [ править ]
Заметим, что [math]\sigma_ <\xi>= \sqrt
Корреляция и взаимосвязь величин [ править ]
Значительная корреляция между случайными величинами всегда означает, что присутствует некая взаимосвязь между значениями конкретной выборки, но при другой выборке связь вполне может отсутствовать. Поэтому при нахождении взаимосвязи не нужно делать поспешных выводов о причинно-следственном характере величин, а следует рассмотреть наиболее полную выборку, чтобы делать какие-либо выводы. Коэффициенты корреляции устанавливают лишь статистические взаимосвязи, но не более того.
Свойства корреляции [ править ]
Но обратное неверно:
Примеры [ править ]
В общем смысле корреляция — это зависимость между случайными величинами, когда изменение одной влечет изменение распределения другой.
Определение корреляции по диаграмме [ править ]
Определение корреляции по таблице [ править ]
Рассмотрим [math]2[/math] случайные величины: курс акций нефтедобывающей компании ( [math]X[/math] ) и цены на нефть ( [math]Y[/math] ).
X | [math]2003,6[/math] | [math]2013,2[/math] | [math]2007,6[/math] | [math]2007,4[/math] | [math]2039,9[/math] | [math]2025[/math] | [math]2007[/math] | [math]2017[/math] | [math]2015,6[/math] | [math]2011[/math] |
---|---|---|---|---|---|---|---|---|---|---|
Y | [math]108,4[/math] | [math]107,96[/math] | [math]108,88[/math] | [math]110,44[/math] | [math]110,2[/math] | [math]108,97[/math] | [math]109,15[/math] | [math]108,8[/math] | [math]111,2[/math] | [math]110,23[/math] |
Для упрощения вычислений определим [math]X[/math] и [math]Y[/math] как равновероятные случайные величины. Тогда их математическое ожидание и дисперсию легко посчитать:
Коэффициент корреляции
Что такое Коэффициент корреляции?
Статистику корреляции можно использовать в финансах и инвестировании. Например, коэффициент корреляции может быть рассчитан для определения уровня корреляции между ценой на сырую нефть и ценой акций нефтедобывающей компании, такой как Exxon Mobil Corporation. Поскольку нефтяные компании получают большую прибыль по мере роста цен на нефть, корреляция между двумя переменными очень положительная.
Понимание коэффициента корреляции
Есть несколько типов коэффициентов корреляции, но наиболее распространенным является корреляция Пирсона ( r ). Это измеряет силу и направление линейной зависимости между двумя переменными. Он не может фиксировать нелинейные отношения между двумя переменными и не может различать зависимые и независимые переменные.
Степень силы связи варьируется в зависимости от значения коэффициента корреляции. Например, значение 0,2 показывает, что между двумя переменными существует положительная корреляция, но она слабая и, вероятно, не важна. Аналитики в некоторых областях исследований не считают корреляции важными до тех пор, пока значение не превысит минимум 0,8. Однако коэффициент корреляции с абсолютным значением 0,9 или выше будет представлять очень сильную взаимосвязь.
Краткая справка
Инвесторы могут использовать изменения в статистике корреляции для выявления новых тенденций на финансовых рынках, в экономике и ценах на акции.
Ключевые моменты
Статистика корреляции и инвестирование
Другими словами, инвесторы могут использовать активы или ценные бумаги с отрицательной корреляцией для хеджирования своего портфеля и снижения рыночного риска из-за волатильности или резких колебаний цен. Многие инвесторы хеджируют ценовой риск портфеля, что эффективно снижает любой прирост капитала или убытки, потому что они хотят дивидендного дохода или доходности от акций или ценных бумаг.
Статистика корреляции также позволяет инвесторам определять, когда изменяется корреляция между двумя переменными. Например, акции банка обычно имеют очень положительную корреляцию с процентными ставками, поскольку ставки по кредитам часто рассчитываются на основе рыночных процентных ставок. Если цена акций банка падает, а процентные ставки растут, инвесторы могут понять, что что-то не так. Если цены на акции аналогичных банков в этом секторе также растут, инвесторы могут сделать вывод, что снижение акций банков не связано с процентными ставками. Вместо этого плохо работающий банк, вероятно, имеет дело с внутренней фундаментальной проблемой.
Уравнение коэффициента корреляции
Чтобы вычислить корреляцию произведения-момента Пирсона, нужно сначала определить ковариацию двух рассматриваемых переменных. Затем необходимо вычислить стандартное отклонение каждой переменной. Коэффициент корреляции определяется путем деления ковариации на произведение стандартных отклонений двух переменных.
где:
ρxy = коэффициент корреляции произведение-момент Пирсона
Cov (x, y) = ковариация переменных x и y
σx = стандартное отклонение x
σy = стандартное отклонение y
Стандартное отклонение – это мера разброса данных от среднего значения. Ковариация – это мера того, как две переменные изменяются вместе, но ее величина не ограничена, поэтому ее трудно интерпретировать. Разделив ковариацию на произведение двух стандартных отклонений, можно вычислить нормализованную версию статистики. Это коэффициент корреляции.
Часто задаваемые вопросы
Что подразумевается под коэффициентом корреляции?
Как рассчитать коэффициент корреляции?
Коэффициент корреляции рассчитывается путем определения ковариации переменных, а затем деления этой величины на произведение стандартных отклонений этих переменных. Этот расчет можно резюмировать в следующем уравнении:
ρИксузнак равноCov(Икс,у)σИксσужчере:ρИксузнак равноРеRсекOпргуплотнительногод¯uгрт-моментгруплотнительногоггелтяопсоеееясяент Cov(x,y)=covariance of variables x and yσx=standard deviation of xσy=standard deviation of y\begin
How is the correlation coefficient used in investing?
Correlation coefficients are a widely-used statistical measure in investing. They play a very important role in areas such as portfolio composition, quantitative trading, and performance evaluation. For example, some portfolio managers will monitor the correlation coefficients of individual assets in their portfolio, in order to ensure that the total volatility of their portfolios is maintained within acceptable limits. Similarly, analysts will sometimes use correlation coefficients to predict how a particular asset will be impacted by a change to an external factor, such as the price of a commodity or an interest rate.
Корреляция и коэффициент корреляции
Корреляция — степень связи между 2-мя или несколькими независимыми явлениями.
Корреляция бывает положительной и отрицательной.
Положительная корреляция (прямая) возникает при одновременном изменении 2-х переменных величин в одинаковых направлениях (в положительном или отрицательном). Например, взаимосвязь между количеством пользователей, приходящих на сайт из поисковой выдачи и нагрузкой на сервер: чем больше пользователей, тем больше нагрузка.
Корреляция отрицательна (обратная), если изменение одной величины приводит противоположному изменению другой. Например, с увеличением налоговой нагрузки на компании уменьшается их прибыль. Чем больше налогов, тем меньше денег на развитие.
Типичные виды корреляции
Эффективность корреляции как статистического инструмента заключается в возможности выражения связи между двумя переменными при помощи коэффициента корреляции.
При значении КК равным 1, следует понимать, что при каждом изменении 1-й переменной происходит эквивалентное изменение 2-й переменной в том же направлении.
Положительная корреляция концентраций этанола в синовии и крови
Отрицательная корреляция между показателями результатов в беге на 100 м с барьерами и прыжками в длину
Значение | Интерпретация |
до 0,2 | Очень слабая |
до 0,5 | Слабая |
до 0,7 | Средняя |
до 0,9 | Высокая |
свыше 0,9 | Очень высокая корреляция |
Данный метод обработки статистической информации популярен в экономических, технических, социальных и других науках в виду простоты подсчета КК, простотой интерпретации результатов и отсутствия необходимости владения математикой на высоком уровне.
Корреляционная зависимость отражает только взаимосвязь между переменными и не говорит о причинно-следственных связях: положительная или отрицательная корреляция между 2-мя переменными не обязательно означает, что изменение одной переменной вызывает изменение другой.
Например, есть положительная корреляция между увеличением зарплаты менеджеров по продажам и качеством работы с клиентами (повышения качества обслуживания, работа с возражениями, знание положительных качеств продукта в сравнении с конкурентами) при соответствующей мотивации персонала. Увеличившийся объем продаж, а следовательно и зарплата менеджеров, вовсе не означает что менеджеры улучшили качество работы с клиентами. Вполне вероятно, что случайно поступили крупные заказы и были отгружены или отдел маркетинга увеличил рекламный бюджет или произошло еще что-то.
Возможно существует некая третья переменная, влияющая на причину наличия или отсутствия корреляции.
Коэффициент корреляции не рассчитывается:
Коэффициент корреляции
Две случайные величины х и у находятся в корреляционной зависимости, если изменение одной из величин влечет за собой изменение закона распределения другой. Для характеристики зависимости между случайными величинами вводят понятие корреляционного момента или ковариации. Корреляционным моментом случайной величины х и у называется математическое ожидание произведения отклонений этих величин от их математических ожиданий
Корреляционные зависимости
,
Для дискретной случайной величины (отношение) ковариация вычисляется
(1)
(2)
(3)
Для непрерывных случайных величин
(4)
(5)
(6)
Из формулы (4) можно получить более простую формулу.
(7)
Теорема №1 Если случайные величины х и у независимы то их cov(x;y)=0
Доказательство: для непрерывной величины.
в формуле 4 заменим
центральный момент первого порядка равен нулю, следовательно и выражение равно нулю. Для независимых случайных величин необходимо чтобы cov=0, но обратно не верно.
.
Свойства коэффициента корреляции:
Как же именно коэффициент корреляции характеризует зависимость между случайными величинами?
2. Для любых величин
,
,
,
.
3. Если коэффициент корреляции положительный, то связь между переменными также положительна и значение переменной увеличивается и уменьшается одновременно.
4. Коэффициент корреляции не зависит от выбора начала отсчета и единицы измерения, то есть от любых постоянных а1 b1, а2 b2.
r(а1х+b1;a2x+b2)=r(x;y) a1,a2>0, таким образом переменные х и у можно уменьшать или увеличивать в а-раз, а также вычитать и прибавлять одно и тоже число b, в результате величина коэффициента корреляции не изменяется.
5. Если случайные величины х и у линейно зависимы, т.е. существует между ними соотношения у=ах+b, то |rху|=1
Пример: Дана таблица, закон распределения двумерной случайной величины
у\х | ||
0,12 | 0,18 | 0,1 |
0,1 | 0,11 | 0,39 |
Вывод: коэффициент корреляции есть показатель того, насколько связь между случайными величинами близка и строгой линейной зависимости.
Сильно повышается ценность коэффициента корреляции для величин, собственные случайные колебания которых подчиняются нормальному закону. Для таких величин равенство коэффициента корреляции нулю означает отсутствие всякой зависимости.
Последнее свойство особенно важно, т.к. при обработке наблюдений преимущественно сталкиваемся с нормальным распределением.
Корреляция и Ковариация
Линейная корреляционная связь
Таких статистических связей может быть очень много самых разных. Для трейдера самым важным видом статистической связи является корреляционная связь.
Корреляционная связь, это когда каждому значению одной переменной соответствует определенное математическое ожидание другой переменной. То есть при изменении значения одной переменной, математическое ожидание другой переменной меняется закономерным образом.
А если при изменении значения одной переменной, закономерным образом меняется не только матожидание второй переменной, но и другие характеристики плотности распределения второй переменной (например, дисперсия, асимметрия и т.д.), то такая связь не является корреляционной. Хотя такая связь тоже является статистической.
Корреляционная связь между случайными переменными x и y называется линейной корреляционной связью, если матожидание переменной y линейно зависит от значений переменной x, и, одновременно, матожидание переменной x тоже линейно зависит от значений переменной y. То есть такая взаимная линейность корреляционных связей. Далее здесь рассматривается только линейная корреляционная связь.
Ковариация
Для независимых случайных величин X и Y всегда матожидание произведения случайных величин равно произведению их матожиданий по отдельности:
А для зависимых случайных величин это равенство не выполняется.
Ковариация, это отклонение математического ожидания произведения двух случайных величин от произведения их математических ожиданий:
Ковариация характеризует отклонение матожидания произведения двух случайных величин от произведения матожиданий этих величин. Так как это отклонение бывает только для зависимых величин, то ковариация характеризует степень этой зависимости. Чем она больше отличается от нуля, тем больше зависимость.
Коэффициент линейной корреляции
Ковариация неудобна тем, что имеет размерность квадрата случайных величин. Кроме того, ковариация маленькой статистической зависимости двух случайных величин с большой дисперсией (у хотя бы одной из этих величин) получается такой же, как большая статистическая зависимость у двух других случайных величин с маленькими дисперсиями. Поэтому ковариацию удобно нормировать на среднеквадратичные отклонения.
Коэффициент корреляции, это ковариация, нормированная на среднеквадратичные отклонения двух случайных величин.
Примеры
Допустим, в каком-то эксперименте в равные промежутки времени измеряют две величины, X и Y. Если их значения меняются, как на этом графике, то это полностью коррелированные величины с коэффициентом корреляции, равным +1.
Этот факт говорит о том, что между величинами X и Y имеется строгая функциональная зависимость: Y=f(X).
Этот факт также говорит о том, что между величинами X и Y имеется какая-то строгая функциональная зависимость: Y=g(X).
Теперь рассмотрим реальные цены. Для примера рассмотрим коэффициенты корреляции между ценами валютной пары EURUSD и ценами валютных пар GBPUSD, USDCHF и USDJPY. Для расчета возьмем дневные графики за первую половину 2017 года.
Эти коэффициенты корреляции достаточно ожидаемые.
Достаточно сильная корреляция между EURUSD и GBPUSD объясняется достаточно сильными связями экономики ЕвроЗоны и экономики Британии. Очень сильная антикорреляция между EURUSD и USDCHF объясняется еще более сильной связью между экономиками ЕвроЗоны и Швейцарии. А знак минус получился потому что в валютной паре USDCHF швейцарский франк стоит в знаменателе, в то время как в валютной паре EURUSD евро стоит в числителе.
Интересно посмотреть не только коэффициенты корреляции разных валютных пар, но и то, как эти коэффициенты изменяются со временем. Для этого возьмем внутри полугодового периода трехмесячный период и посмотрим, как меняется коэффициент корреляции, если сдвигать этот трехмесячный период от начала полугодового периода до его конца. Всего за полгода будет 65 таких сдвижек.
В начале 2017 года корреляция между EURUSD и GBPUSD была небольшой и она даже немного уменьшалась. Но в середине полугодия корреляция между евро и фунтом усилилась. Таким образом, в определенное время фунт может не слишком хорошо коррелировать с евро.