Чем определяется порядок частного коэффициента корреляции

Частные коэффициенты корреляции для линейной модели регрессии с двумя факторными переменными

Частные коэффициенты корреляции используются для оценки зависимости между результативной переменной и одной из факторных переменных при условии постоянства всех остальных факторных переменных, включённых в модель множественной регрессии. Таким образом, частный коэффициент корреляции позволяет элиминировать влияние на результат всех факторных модельных переменных кроме одной.

Рассчитаем частные коэффициенты корреляции на основе линейной модели регрессии с двумя факторными переменными.

Общий вид модели двухфакторной регрессии:

где yi – результативная переменная, i= 1,n ;

xi – первая факторная переменная;

zi – второй факторная переменная;

β0, β1, β2– неизвестные коэффициенты модели регрессии;

εi – случайная ошибка модели регрессии.

Для определения степени зависимости между результативной переменной yiи факторной переменной xi при постоянном значении факторной переменой ziи результативной переменной yi и факторной переменной ziпри постоянном значении факторной переменной xi используются частные коэффициенты корреляции первого порядка, потому что они позволяют элиминировать влияние только одного признака. Порядок частного коэффициента корреляции характеризуется количеством признаков, влияние которых устраняется. Для модели парной регрессии рассчитывается коэффициент корреляции нулевого порядка.

Коэффициент частной корреляции между результативной переменной yi и факторной переменной xiпри постоянном значении факторной переменой zi рассчитывается по формуле:

pic 270

Коэффициент частной корреляции между результативной переменной yi и факторной переменной zi при постоянном значении факторной переменной xi рассчитывается по формуле:

pic 271

Кроме влияния на результативную переменную, частный коэффициент корреляции позволяет рассчитать степень зависимости между факторными переменными.

Коэффициент частной корреляции между факторной переменной xiи факторной переменной zi при постоянном значении результативной переменной yi рассчитывается по формуле:

pic 272

Рассмотренные коэффициенты частной корреляции изменяются в пределах от минус единицы до единицы.

Частные коэффициенты корреляции также можно рассчитать через коэффициент множественной детерминации.

Коэффициент частной корреляции между результативной переменной yi и факторной переменной xi при постоянном значении факторной переменой zi:

pic 273

R 2 y – множественный коэффициент детерминации двухфакторной модели регрессии.

Данный коэффициент корреляции изменяется в пределах от нуля до единицы.

При проверке значимости частных коэффициентов корреляции выдвигается основная гипотеза о незначимости данных коэффициентов, например:

Тогда конкурирующей или альтернативной гипотезой будет гипотеза вида:

Проверка выдвинутых гипотез осуществляется с помощью t-критерия Стьюдента. Критическое значение t-критерия tкрит(а,n-h) определяется по таблице распределения Стьюдента, где а – уровень значимости, (nh) – число степеней свободы. Для модели двухфакторной регрессии число степеней свободы равно (n-3).

Наблюдаемое значение t-критерия рассчитывается по формуле (на примере частного коэффициента корреляции между результативной переменной yi и факторной переменной xi при постоянном значении факторной переменой zi):

pic 275

Если |tнабл|≤tкрит, то основная гипотеза не отклоняется, и частный коэффициент корреляции является незначимым. Следовательно, между переменными х и у при постоянном значении переменой z корреляционная связь отсутствует.

Если |tнабл|>tкрит, то основная гипотеза отклоняется в пользу конкурирующей гипотезы с вероятностью совершения ошибки первого рода а. В этом случае можно считать, что между переменными х и у при постоянном значении переменной z существует корреляционная зависимость.

Частные коэффициенты корреляции позволяют сделать вывод об обоснованности включения переменной в модель регрессии. Если значение частного коэффициента корреляции мало или коэффициент незначим, то связь между данной факторной переменной и результативной переменной либо очень слаба, либо вовсе отсутствует, поэтому фактор можно исключить из модели без ущерба для её качества.

Источник

Частные коэффициенты корреляции

Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии.

Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.

Предположим, что зависимость y x1 характеризуется уравнением

Подставив в это уравнение фактическое значение x1, найдем теоретические величины image068и соответствующую величину остаточной дисперсии s 2 :

image070.

Включив в уравнение регрессии дополнительный фактор x2, получим уравнение регрессии вида

Для этого уравнения остаточная дисперсия, естественно, меньше. Чем большее число факторов включено в модель, тем меньше величина остаточной дисперсии, т.е. происходит ее сокращение. Чем больше доля этого сокращения в остаточной вариации до введения дополнительного фактора, тем теснее связь между y и x2 при постоянном действии фактора x1. Корень квадратный из этой величины и есть индекс частной корреляции, показывающий в «чистом» виде тесноту связи y с x2.

Следовательно, чистое влияние фактора x2 на результат y можно найти как

image072. (3.19)

Знак «точка» в выражении частного коэффициента корреляции ryx2×x1 означает элиминирование той переменной (переменных), которая стоит после знака «точка».

Аналогично определяется и чистое влияние на результат y фактора x1:

image074. (3.20)

Если выразить остаточную дисперсию через скорректированный показатель детерминации S 2 ост = S 2 y (1 – R 2 ), то формула коэффициента частной корреляции примет вид:

image076. (3.21)

image078. (3.22)

Рассмотренные показатели частной корреляции принято называть коэффициентами (индексами) частной корреляции первого порядка, ибо они фиксируют тесноту связи двух переменных при закреплении (элиминировании влияния) одного фактора.

включенных в уравнение регрессии

Сопоставление коэффициентов частной корреляции разных порядков по мере увеличения числа включаемых факторов показывает процесс «очищения» связи результативного признака с исследуемым фактором.

Хотя частная корреляция разных порядков и может представлять аналитический интерес, в практических исследованиях предпочтение отдают показателям частной корреляции самого высокого порядка, ибо именно эти показатели являются дополнением к уравнению множественной регрессии.

В общем виде при наличии р факторов для уравнения

коэффициент частной корреляции, измеряющий влияние на у фактора xi; при неизменном уровне других факторов, можно определить по формуле

image080. (3.23)

где image082– множественный коэффициент детерминации всего комплекса р факторов с результатом; image084– тот же показатель детерминации, но без введения в модель фактора xi.

Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Например, ryx1×x2 – коэффициент частной корреляции первого порядка. Соответственно коэффициенты парной корреляции называются коэффициентами нулевого порядка. Коэффициенты частной корреляции более высоких порядков можно найти через коэффициенты частной корреляции более низких порядков по рекуррентной формуле

image086. (3.25)

При двух факторах и i = 1 данная формула примет вид:

image088. (3.26)

Соответственно при i = 2 и двух факторах частный коэффициент корреляции у с фактором x2 можно определить по формуле

image090. (3.27)

В эконометрике частные коэффициенты корреляции обычно не имеют самостоятельного значения. В основном их используют на стадии формирования модели, в частности в процедуре отсева факторов. Так, при построении многофакторной модели, например, методом исключения переменных на первом шаге определяется уравнение регрессии с полным набором факторов и рассчитывается матрица частных коэффициентов корреляции. На втором шаге отбирается фактор с наименьшей и несущественной по t— критерию Стьюдента величиной показателя частной корреляции. Исключив его из модели, строят новое уравнение регрессии. Процедура продолжается до тех пор, пока не окажется, что все частные коэффициенты корреляции существенно отличаются от нуля. Если исключен несущественный фактор, то множественные коэффициенты детерминации на двух смежных шагах построения регрессионной модели почти не отличаются друг от друга, т.е. R 2 p+1 » R 2 p, где p – число факторов.

Из формул частных коэффициентов корреляции видна связь этих показателей с совокупным коэффициентом корреляции. Зная частные коэффициенты корреляции (последовательно первого, второго и более высокого порядка), можно определить совокупный коэффициент корреляции по формуле

image092. (3.31)

При полной зависимости результативного признака от исследуемых факторов коэффициент совокупного влияния их равен единице. Из единицы вычитается доля остаточной вариации признак (1 – r 2 ), обусловленная последовательно включенными в анализ факторами. В результате подкоренное выражение характеризует совокупное действие всех исследуемых факторов.

Для уравнения регрессии прибыли y = –4,874 + 0,585 x1 +0,240 x2 + e данный подход расчета коэффициента множественной корреляции приведет к следующей его величине:

image094,

т.е. получен тот де результат, что и ранее.

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

Источник

Частный коэффициент корреляции и его значения

Вы будете перенаправлены на Автор24

Понятие корреляции

Корреляция – это статистическая зависимость двух и более величин, которые выбираются случайным образом.

В переводе с латинского, корреляция дословно обозначает связь, соотношение. Если в этой зависимости происходит изменение одной из величин, то это ведет к изменению других, связанных с нею величин. Для определения степени взаимосвязи величин используется математический инструмент – коэффициент корреляции. Обычно он обозначается латинской буквой R. Корреляционная связь возникает только тогда, когда осуществляется закономерное изменение другой величины. Если этого не происходит, но имеется изменение какой-либо другой статистической характеристики, то связь между величинами будет называться статистической, но не корреляционной.

Примечательно, что термин «корреляция» был введён палеонтологом, который установил связь между различными органами доисторических животных с целью восстановления их образа. В математике и статистике этот термин стал использоваться в конце 19-го века благодаря Фрэнсису Гальтону.

Корреляционная связь не всегда имеет причинно-следственный характер. Коэффициент устанавливает лишь взаимосвязь со статистической точки зрения. Однако, наличие корреляции может говорить о том, что у двух случайных величин может быть схожая первопричина. Если корреляции между двумя величинами нет, то это не означает полного отсутствия связей между ними. В случае сложной связи, установленной между объектами, корреляция неспособна ее выявить.

Коэффициент корреляции

Готовые работы на аналогичную тему

Чем ближе значение коэффициента к +1, тем прочнее и сильнее связь между двумя исследуемыми величинами. Как правило, коэффициент выражает линейную зависимость двух объектов. Значения коэффициентов могут быть как положительными, так и отрицательными. Положительное значение показывает степень связи, а отрицательное направление этой связи между величинами.

В экономике коэффициент корреляции используется для того, чтобы отслеживать взаимное влияние колебания тех или иных величин. Примером может быть колебание доходности пенсионного фонда в зависимости от текущего индекса цен, применяемого для его расчёта. Чем ближе значение к единице, тем сильнее коррелируют показатели.

Коэффициент корреляции частный, его значения

Частные коэффициенты корреляции используются для отслеживания взаимосвязи изменения величины от множества факторов. Можно сказать, то частный коэффициент показывает степень тесноты связи в случае, когда все остальные признаки исключены из рассматриваемого множества.

Частые коэффициенты могут применяться при отборе факторов воздействия, определении степени их значимости при воздействии на изучаемый объект. Для этих целей строится уравнение репрессии, которое отслеживает факторы по размеру их коэффициента. На каждом шаге исключается частный корреляционный коэффициент с наименьшим значением.

Перед применением частных коэффициентов множество данных тестируется на установление линейных связей. Если связи отсутствуют, то далее осуществляет анализ связи исследуемого объекта и факторов. Частные коэффициенты взаимосвязей позволяют сопоставить взаимное влияние величин и факторов друг на друга для общих отношений и частных соприкосновений.

Значения частного коэффициента корреляции означают следующее:

Частный коэффициент корреляции применяется в эконометрике для того, чтобы отслеживать изменение экономического процесса или явления под воздействием внутренних и внешних факторов.

Источник

Частная корреляция. Коэффициенты частной корреляции.

dark fb.4725bc4eebdb65ca23e89e212ea8a0ea dark vk.71a586ff1b2903f7f61b0a284beb079f dark twitter.51e15b08a51bdf794f88684782916cc0 dark odnoklas.810a90026299a2be30475bf15c20af5b

caret left.c509a6ae019403bf80f96bff00cd87cd

caret right.6696d877b5de329b9afe170140b9f935

Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в модель.

Частные показатели корреляции широко используются при отборе факторов, когда необходимо оценить целесообразность включения того или иного фактора в уравнение множественной регрессии. Кроме того, они позволяют ранжировать факторы по тесноте их связи с результатом.

Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.

В общем виде частный коэффициент корреляции, измеряющий влияние на у фактора хiпри неизменном уровне других факторов, можно определить по формуле:

image175,

где image177— коэффициент множественной детерминации для модели с полным набором факторов;

image179— тот же показатель, но без введения в модель фактора xi.

При i=1 формула примет вид:

image181

Коэффициенты частной корреляции могут быть первого, второго, третьего и т.д. порядка. Это зависит от того, влияние скольких факторов элиминируется.

Частная корреляция первого порядка – когда фиксируется теснота связи двух переменных при устранении влияния одного фактора: image183(точка отделяет фактор, значение которого элиминируется (закрепляется на неизменном уровне)).

Частная корреляция второго и т.д. порядка – когда фиксируется теснота связи двух переменных при устранении влияния двух и более факторов, например:

image185— частная корреляция второго порядка при постоянном действии факторов х2 и х3;

image187— частная корреляция четвертого порядка при постоянном действии факторов х2, х3, х4, х5.

Соответственно, коэффициенты парной корреляции называются коэффициентами нулевого порядка.

Коэффициенты частной корреляции более высоких порядков можно найти через коэффициенты частной корреляции более низких порядков по рекуррентной формуле:

image189

При i=1 и двух факторах формула примет вид:

image191

При i=2 и двух факторах:

image193

Сравнение частных коэффициентов друг с другом позволяет ранжировать факторы по тесноте их связи с результатом. Обычно частные коэффициенты корреляции не имеют самостоятельного значения, они используются на стадии формирования модели, в частности в процедуре отсева факторов.

Контрольные вопросы:

1. В каких ситуациях применяется множественная регрессия?

2. Какие этапы включает в себя построение уравнения множественной регрессии?

3. Какие виды уравнений множественной регрессии различают?

4. Что означает построение модели множественной регрессии в стандартизированном масштабе?

5. Что показывают стандартизированные коэффициенты регрессии?

6. По какой формуле рассчитывается показатель множественной регрессии?

7. Что характеризуют частные коэффициенты корреляции?

Источник

Частные корреляции. Часть 1

Введение

В данном разделе мы обсуждаем чрезвычайно важное понятие корреляции и частных корреляций. Именно эти понятия лежат в основе статистических выводов, направленных на анализ зависимостей и взаимозависимостей, что является решающим для применения статистических методов на практике.

Действительно, сила статистических методов состоит в том, что они позволяют исследовать зависимость факторов. Материалы этого раздела основаны в основном на книге Кендалла и Стьюарта «Статистические выводы и связи» и снабжены нашими комментариями.

Эти материалы могут показаться техническими, однако они содержат вывод формул, позволяющих непосредственно вычислить частные коэффициенты корреляции, а также позволяют почувствовать саму идею частных корреляций. С помощью STATISTICA Вы можете вычислить частные корреляции двумя щелчками мыши.

Итак, перейдем к систематическому изложению теории частных корреляций.

1. В случае двух нормальных или почти нормальных величин коэффициент корреляции между ними может быть использован в качестве меры взаимозависимости и это подтверждено множеством практических результатов.

Однако при интерпретации «взаимозависимости» часто встречаются следующие трудности: если одна величина коррелирована с другой, то это может быть всего лишь отражением того факта, что они обе коррелированы с некоторой третьей величиной или с совокупностью величин, которые, грубо говоря, остаются за кадром и не введены в модель.

Указанная ситуация приводит к рассмотрению условных корреляций между двумя величинами при фиксированных значениях остальных величин. Это так называемые частные корреляции.

Далее имеют место следующие естественные рассуждения.

Если корреляция между двумя величинами уменьшается, если мы фиксируем некоторую другую случайную величину, то это означает, что их взаимозависимость возникает частично через воздействие этой величины; если же частная корреляция равна нулю или очень мала, то мы делаем вывод, что их взаимозависимость целиком обусловлена собственным воздействием и никак не связана с третьей величиной.

Наоборот, если частная корреляция больше первоначальной корреляции между двумя величинами, то мы заключаем, что другие величины ослабили связь, или, можно сказать, «скрыли» (замазали) корреляцию.

Еще одна тонкость состоит в том, что корреляция не есть причинность. Иными словами, следует помнить, что даже в последнем случае нашего рассуждения мы не имеем права безапелляционно говорить о наличии причинной связи: некоторая совершенно отличная от рассматриваемых в нашем анализе величина может быть источником этой корреляции.

Как при обычной корреляции, так и при частных корреляциях предположение о причинности должно всегда иметь собственные внестатистические основания.

2. В этой области статистики временами трудно достигнуть недвусмысленных и гибких обозначений без того, чтобы они были крайне громоздкими.

Основываясь на системе обозначений Юла (1907), мы будем придерживаться среднего курса, но иногда от читателя потребуется терпение к индексам.

Попутно мы будем рассматривать также линейную регрессию.

Частная корреляция трех величин

3. Вначале естественно рассмотреть три величины, имеющие трехмерное нормальное распределение и в этом простейшем случае выписать формулу для вычисления частных корреляций, т.е. корреляции пары переменных при фиксированном значении третьей.

Исключим вырожденный случай и без потери общности, поскольку мы касаемся лишь корреляций, будем считать величины нормированными.

Тогда их матрица рассеяния совпадает с матрицей их корреляций, которую назовем корреляционной матрицей и обозначим C. Таким образом, если корреляция между xi и xj есть pij, то функция плотности распределения этих трех величин имеет вид

im01, (1)

im02. (2)

im03есть элемент матрицы, обратной к C. Мы будем иногда записывать определитель или матрицу корреляций в таком виде, когда оставлено свободным место ниже главной диагонали, которое должно заполняться по симметрии.

Находим характеристическую функцию (х. ф.) этого распределения

im04. (3)

4. Рассмотрим корреляцию между x1 и x2 при фиксированном значении x3. Условное распределение x1 и x2 при заданном x3 равно

im05, (4)

где im06.

Из (4) видно, что при заданном x3 величины x1 и x2 имеют двумерное нормальное распределение с коэффициентом корреляции

im07.

Ясно, что p12.3 не зависит от фиксируемого значения величины x3. Кроме того, сокращая на общий множитель |C| из (2) находим

im08. (5)

p12.3 называется частным коэффициентом корреляции между x1 и x2 при фиксированном x3. Он симметричен относительно первичных индексов 1, 2. Его вторичный индекс 3 относится к переменной, которая фиксирована.

Хотя (5) выведено в предположении нормальности, мы теперь для любого исходного распределения определим частный коэффициент корреляции с помощью (5). Итак, по определению, для величин, отличных от нормальных, частная корреляция также вычисляется по формуле (5).

Рассмотрим теперь общий случай.

Частная корреляция больше чем трех величин

5. В соответствии с общей концепцией мы рассуждаем следующим образом.

Пусть имеется p-мерное невырожденное нормальное распределение, фиксируем p2 случайных величины, то получаем частную корреляцию оставшихся двух (скажем, x1 и x2):

im09, (6)

im10. (7)

Совместная х. ф. всех p величин есть

im11,

im13. (8)

Если в (8) положить t1=t2=. =tk=0, то из равенства im14единице получаем

im15. (9)

Следовательно, после деления (8) на (9) находим

im16. (10)

Этот общий результат вытекает из теоремы Барлетта (1938).

Предположим теперь, что наши p величин имеют многомерное нормальное распределение.

Тогда, используя их х. ф., преобразуем подынтегральную функцию числителя в (10):

im17(11)

im19.

Учитывая сказанное, из (10) имеем

im20(12)

im23. (13)

im27. (14)

Если обозначить безусловную (k×k)-матрицу рассеяния <im22> через A, (k×(pk))-матрицу <im28> через B’ и ((pk)×(pk))- матрицу рассеяния, из которой D получается в результате нормировки, через E, то (14) утверждает, что условная матрица рассеяния равна

im29.

7. В частности, если зафиксировать только одну переменную, скажем xp, то Dpp=1, и условная ковариация (14) тогда равна

im30. (15)

При u=v из (15) находим условную дисперсию u:

im31.

Из двух последних формул получаем условный коэффициент корреляции того же вида, что и (5):

im32.

Если зафиксируем все переменные, кроме двух, скажем x1 и x2, то из (14) будем иметь

im33. (16)

Рассматривая (7), находим, что минор элемента p12, а именно

im34,

может быть разложен по его первой строке и столбцу в виде

im35,

и аналогично для миноров элементов p11, p22. Таким образом, (16) представимо в форме

im36,

Источник

Комфорт
Adblock
detector