Суть коэффициента детерминации состоит в следующем

Содержание
  1. Формула коэффициента детерминации, что измеряет?
  2. Детерминация, что это — определение
  3. Коэффициент детерминации, что показывает?
  4. Индекс детерминации
  5. Формула
  6. Коэффициент детерминации скорректированный
  7. Эмпирический коэффициент детерминации
  8. Коэффициент детерминации
  9. Что такое коэффициент детерминации?
  10. Ключевые выводы
  11. Понимание коэффициента детерминации
  12. График коэффициента детерминации
  13. Коэффициент детерминации
  14. Содержание
  15. [править]Проблемы и общие свойства R2
  16. [править]Интерпретация
  17. [править]Общие свойства для МНК регрессии
  18. [править]Общие свойства для МНК регрессии со свободным членом (единичным фактором)
  19. [править]Мнимая регрессия
  20. [править]Решение проблем или модификации R2
  21. [править]R2-скорректированный (adjusted)
  22. [править]R2-распространённый (extended)
  23. [править]R2-истинный (несмещённый)
  24. [править]Прочие используемые критерии
  25. [править]См. также
  26. [править]Примечания
  27. СОДЕРЖАНИЕ
  28. Определения
  29. Отношение к необъяснимой дисперсии
  30. Как объяснили дисперсию
  31. Квадрат коэффициента корреляции
  32. Интерпретация
  33. В многолинейной модели
  34. Инфляция R 2
  35. Предостережения
  36. Расширения
  37. Скорректированный R 2
  38. Коэффициент частичной детерминации
  39. Обобщение и разложение R 2
  40. R 2 в логистической регрессии
  41. Сравнение с нормой остатков
  42. История
  43. Суть коэффициента детерминации состоит в следующем

Формула коэффициента детерминации, что измеряет?

oooekoans html 5aaace8e

Основная суть коэффициента детерминации состоит в зависимых переменных величинах дисперсии. Он применяется для оценивания качества линейной регрессии. Проще говоря – этот переменный показатель показывает зависимость (ее универсальную меру, часть) одной величины от других составляющих. Важно – коэффициент имеет свойство увеличиваться, но не уменьшаться. Что это такое (что представляет, его значимость)), как он изменяется и что может включать, какова его объективная оценка, основная функция и характеристика, а также как вычисляется и как его можно применять/использовать более подробно рекомендуем ознакомиться в предложенной публикации.

Детерминация, что это — определение

Термин детерминация происходит от латинского «определение» или «ограничение». Наиболее часто применим в биологии, эмбриологии (генетическая детерминация, научные доказательства того, что каждый организм/клетка/эмбрион и пр. развивается под контролем генома (первопричина человеческого устройства). Основан на анализе клеток, в нем показана половая эконометрика). В обычном восприятии термин означает причинную связь и/или предопределение (казуальные факторы), относится к образованию организационного образования.

В одном из распространенных учений существует понятие детерминизма, как составляющая основания мира (может обусловливать принцип его основания — детерминанта). Адепты полностью отрицают (исключают) существование вещей, их порядка «вне» взаимосвязи.

В противовес выступает индетерминизм – его главная составляющая отрицание зависимых факторов, т.е. причинности.

На примере данных учений и верований отображена вероятностная социокультурная зависимость (волатильность) в развитии личности и мотивации. А расчет позволяет оценить риски и сделать предположения как поведет себя отдельно взятая личность (человек) в той или иной ситуации, можно ли его допустить к военной службе (с его помощью можно оценить в чем заключаются особенности воинской корреляции), государственному управлении, в деловом общении и пр.

Коэффициент детерминации может принимать значения от полного «0» до единицы, и чем он ближе к значению «1», тем более связанный его результат/признак с другими величинами.

Термин показывает в криминалистике/правоохранительной системе: факт преступления является причинной связью (синоним преступности) между личностными качествами и поведением индивидуума (фиксирует и поясняет человеческие ошибки, совокупность факторов). Следовательно указанный показатель рассчитывается для оценки качества поведения (преступного), дает более полное представление о том, какие факторы этому послужили, и что в принципе послужило его причиной (первопричиной). Может объяснять и показывать в психологии данный частный случай, обуславливать параметр отклонения, т.е. факторы выученной беспомощности.

Коэффициент детерминации, что показывает?

Он полностью отображает вариации влияния результативного на факторный признак и очень тесно связан с корреляцией (ее числом). При этом формула расчета коэффициента принимает следующие значения:

• при наличии связи признаков (результативного и факторного) – его значение равняется «0»;
• при ее отсутствии – «1».

Индекс детерминации

На основании коэффициента определяется одноименный индекс для подсчета производных бета и альфа в процентном соотношении, и если процент ниже установленного минимума (может измеряться в пределах 75%) к его соотношению, то установленные значения будут некорректными (альфа и β), т.е. дисперсия дохода во времени бета.

Индекс детерминации это результативный фактор квадрат множественных уравнений (индексов корреляции нелинейных связей). На его основании можно характеризовать регрессионный фактор (на какое количество % и каким образом определяются модели регрессии), определяются показания результативной переменной в отношении к своему уровню (среднему).

Формула

Для расчета этого показателя (истинный коэффициент детерминации, модель зависимости от случайных факторов (х)) применяют формулу, составленную на доказательстве теоремы по разложению сумм квадратов (аппроксимация):

koeffdeterminatsii

Аппроксимацию можно рассчитать по формуле №2:

• R2 — коэффициент (квадрат);
• \bar — значение переменной (математическое);
• fi — предполагаемое уравнением значение переменной;
• yi — значение по исследованию переменной.

Коэффициент детерминации скорректированный

Суть коэффициента детерминации состоит в следующем – его индекс показывает общую долю дисперсий (результативная переменная), объясняющей варианты факторных переменных (увеличение, уменьшение), включенных в модель регрессии.

Далее выводится скорректированный показатель – он учитывает и выводит соотношение количества параметров (оцениваемых) и количество наблюдений. Его применяют для решения (выведение параметров) установленных задач по двум направлениям:

В первом случае (для данной выборки) модель является качественной в случае больших показателей с наименьшим отличием друг от друга (относительно увеличения числа объясняющих переменных). Во втором — в равных условиях рекомендуется выбирать модель с наибольшим скорректированным показателем (средний подбор величины).

Эмпирический коэффициент детерминации

Данный показатель является объяснением доли дисперсии в своем значении, обусловленным вариантами условий и факторов, в свою очередь заложенных в основу данной группировки (проблема знаковой деятельности).

По любым вопросам обращайтесь к нашим юристам через данную форму!

Источник

Коэффициент детерминации

Что такое коэффициент детерминации?

Коэффициент детерминации – это статистическое измерение, которое исследует, как различия в одной переменной могут быть объяснены разницей во второй переменной при прогнозировании исхода данного события. Другими словами, этот коэффициент, более известный как R-квадрат (или R 2 ), оценивает, насколько сильна линейная связь между двумя переменными, и на него сильно полагаются исследователи при проведении анализа тенденций. Приведем пример его применения: этот коэффициент может включать в себя следующий вопрос: если женщина забеременеет в определенный день, какова вероятность того, что она родит ребенка в определенный день в будущем? В этом сценарии этот показатель предназначен для расчета корреляции между двумя взаимосвязанными событиями: зачатием и рождением.

Ключевые выводы

Понимание коэффициента детерминации

Коэффициент детерминации – это измерение, используемое для объяснения того, насколько изменчивость одного фактора может быть вызвана его взаимосвязью с другим связанным фактором. Эта корреляция, известная как « степень соответствия », представлена ​​как значение от 0,0 до 1,0. Значение 1,0 указывает на идеальное соответствие и, таким образом, является высоконадежной моделью для будущих прогнозов, а значение 0,0 указывает на то, что расчет вообще не может точно смоделировать данные. Но значение 0,20, например, предполагает, что 20% зависимой переменной предсказывается независимой переменной, тогда как значение 0,50 предполагает, что 50% зависимой переменной предсказывается независимой переменной, и так далее.

График коэффициента детерминации

На графике степень соответствия измеряет расстояние между подогнанной линией и всеми точками данных, которые разбросаны по диаграмме. Плотный набор данных будет иметь линию регрессии, которая близка к точкам и будет иметь высокий уровень соответствия, что означает, что расстояние между линией и данными невелико. Хотя хорошее соответствие имеет R 2, близкое к 1,0, само по себе это число не может определить, смещены ли точки данных или прогнозы. Он также не сообщает аналитикам, является ли значение коэффициента детерминации изначально хорошим или плохим. Пользователь по своему усмотрению может оценить значение этой корреляции и то, как ее можно применить в контексте анализа будущих тенденций.

Источник

Коэффициент детерминации

Коэффициент детерминации (R2)— это доля объяснённой дисперсии отклонений зависимой переменной от её среднего значения. Зависимая переменная объясняется (прогнозируется) с помощью функции от объясняющих переменных, в частном случае является квадратом коэффициента корреляции между зависимой переменной и её прогнозными значениями с помощью объясняющих переменных. Тогда можно сказать, что R2 показывает, какая доля дисперсии результативного признака объясняется влиянием объясняющих переменных.

Формула для вычисления коэффициента детерминации:

image001 89

где yi — наблюдаемое значение зависимой переменной, а fi — значение зависимой переменной предсказанное по уравнению регрессии image002 44-среднее арифметическое зависимой переменной.

Содержание

· 1 Проблемы и общие свойства R2

o 1.1 Интерпретация

o 1.2 Общие свойства для МНК регрессии

o 1.3 Общие свойства для МНК регрессии со свободным членом (единичным фактором)

o 1.4 Мнимая регрессия

· 2 Решение проблем или модификации R2

o 2.1 R2-скорректированный (adjusted)

o 2.2 R2-распространённый (extended)

o 2.3 R2-истинный (несмещённый)

· 3 Прочие используемые критерии

[править]Проблемы и общие свойства R2

[править]Интерпретация

Иногда показателям тесноты связи можно дать качественную оценку (шкала Чеддока):

Количественная мера тесноты связи

Качественная характеристика силы связи

Функциональная связь возникает при значении равном 1, а отсутствие связи — 0. При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации всегда будет ниже 50 %. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение.

[править]Общие свойства для МНК регрессии

Линейная множественная МНК регрессия имеет следующие общие свойства [1]:

1. Чем ближе значение к 1 тем ближе модель к эмпирическим наблюдениям.

2. С увеличением количества объясняющих переменных увеличивается R2.

[править]Общие свойства для МНК регрессии со свободным членом (единичным фактором)

Для случая наличия в такой регрессии свободного члена коэффициент детерминации обладает следующими свойствами: [2]

1. принимает значения из интервала (отрезка) [0;1].

2. в случае парной линейной регрессионной МНК модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть R2 = r2. А в случае множественной МНК регрессии R2 = r(y;f)2. Также это квадрат корреляции Пирсона между двумя переменными. Он выражает количество дисперсии, общей между двумя переменными.[3]

4. R2 связан с проверкой гипотезы о том, что истинные значения коэффициентов при объясняющих переменных равны нулю, в сравнении с альтернативной гипотезой, что не все истинные значения коэффициентов равны нулю. Тогда случайная величина image004 17имеет F-распределение с (k-1) и (n-k) степенями свободы.

[править]Мнимая регрессия

Значения R2, image005 12, image006 10также могут быть манипулированы, с помощью включения фиктивных факторов. Например, если два показателя имеют возрастающую динамику, то их коэффициент корреляции (который входит в факторное разложение) будет достаточно высок. Поэтому логическая и смысловая адекватность модели имеют первостепенную важность. Только качество модели может быль проверено или сопоставлено с использованием R2 и его модификаций.

[править]Решение проблем или модификации R2

[править]R2-скорректированный (adjusted)

[править]R2-распространённый (extended)

image006 10с условием небольшой модификации, также подходит для сравнения между собой регрессий построенных с помощью: МНК, обобщённого метода наименьших квадратов (ОМНК), условного метода наименьших квадратов (УМНК), обобщённо-условного метода наименьших квадратов (ОУМНК).

[править]R2-истинный (несмещённый)

[править]Прочие используемые критерии

[править]См. также

§ Дисперсия случайной величины

§ Метод группового учета аргументов

[править]Примечания

2. ↑ 1 2 Распространение коэффициента детерминации на общий случай линейной регрессии, оцениваемой с помощью различных версий метода наименьших квадратов (рус., англ.) //ЦЕМИ РАН Экономика и математические методы. — Москва: ЦЕМИ РАН, 2002. — В. 3. — Т. 38. — С. 107-120.

4. Выбор регрессии максимизирующий несмещённую оценку коэффициента детерминации (рус., англ.) // Прикладная эконометрика. — Москва: Маркет ДС, 2008. — В. 4. — Т. 12. — С. 71-83.

Источник

300px Okuns law quarterly differences.svg

220px Thiel Sen estimator.svg

Бывают случаи, когда вычислительное определение R 2 может давать отрицательные значения, в зависимости от используемого определения. Это может возникнуть, если прогнозы, которые сравниваются с соответствующими результатами, не были получены в результате процедуры подгонки модели с использованием этих данных. Даже если была использована процедура подбора модели, R 2 все еще может быть отрицательным, например, когда линейная регрессия проводится без включения точки пересечения или когда для подгонки данных используется нелинейная функция. В случаях, когда возникают отрицательные значения, среднее значение данных лучше соответствует результатам, чем значения подобранной функции, в соответствии с этим конкретным критерием.

СОДЕРЖАНИЕ

Определения

400px Coefficient of Determination.svg

у ¯ знак равно 1 п ∑ я знак равно 1 п у я <\ displaystyle <\ bar > = <\ frac <1>> \ sum _ ^ y_ > svg

тогда изменчивость набора данных может быть измерена двумя формулами сумм квадратов :

Наиболее общее определение коэффициента детерминации:

Отношение к необъяснимой дисперсии

Как объяснили дисперсию

S S res + S S рег знак равно S S малыш <\ displaystyle SS _ <\ text > + SS _ <\ text > = SS _ <\ text >> svg

См. Раздел Разбиение в общей модели OLS для вывода этого результата для одного случая, когда соотношение выполняется. Когда это отношение делает захват, приведенное выше определение R 2 эквивалентно

В этой форме R 2 выражается как отношение объясненной дисперсии (дисперсия прогнозов модели, которая является SS reg / n ) к общей дисперсии (выборочная дисперсия зависимой переменной, которая равна SS tot / n ).

Этот набор условий является важным и имеет ряд последствий для свойств подобранных остатков и смоделированных значений. В частности, в этих условиях:

Квадрат коэффициента корреляции

Его не следует путать с коэффициентом корреляции между двумя оценками, определяемым как

где ковариация между двумя оценками коэффициентов, а также их стандартные отклонения получаются из ковариационной матрицы оценок коэффициентов.

Интерпретация

Значения R 2 вне диапазона от 0 до 1 могут возникать, когда модель соответствует данным хуже, чем горизонтальная гиперплоскость. Это могло произойти, если была выбрана неправильная модель или по ошибке были применены бессмысленные ограничения. Если используется уравнение 1 Кволсета (это уравнение используется наиболее часто), R 2 может быть меньше нуля. Если используется уравнение 2 Квалсета, R 2 может быть больше единицы.

В многолинейной модели

Рассмотрим линейную модель с более чем одной независимой переменной вида

Инфляция R 2

Предостережения

Расширения

Скорректированный R 2

Принцип, лежащий в основе скорректированной статистики R 2, можно увидеть, переписав обычное R 2 как

Коэффициент частичной детерминации

Коэффициент частичной детерминации можно определить как долю вариации, которая не может быть объяснена в сокращенной модели, но может быть объяснена предикторами, указанными в полной (er) модели. Этот коэффициент используется для понимания того, могут ли один или несколько дополнительных предикторов быть полезными в более полностью определенной регрессионной модели.

Расчет для частичного R 2 является относительно простым после того, как две модели оценки и генерации ANOVA таблиц для них. Расчет для частичного R 2 IS

который аналогичен обычному коэффициенту детерминации:

Обобщение и разложение R 2

Как объяснялось выше, эвристика выбора модели, такая как скорректированный критерий и F-тест, проверяет, достаточно ли увеличивается общая сумма, чтобы определить, следует ли добавить в модель новый регрессор. Если к модели добавлен регрессор, который сильно коррелирован с другими регрессорами, которые уже были включены, то итоговое значение вряд ли увеличится, даже если новый регрессор является актуальным. В результате вышеупомянутая эвристика будет игнорировать соответствующие регрессоры, когда взаимная корреляция высока. р 2 <\ displaystyle R ^ <2>> svgр 2 <\ displaystyle R ^ <2>> svgр 2 <\ displaystyle R ^ <2>> svg

220px Geometric R squared .svg

р ⊗ знак равно ( Икс ′ у

R 2 в логистической регрессии

Нагелькерке отметил, что он обладает следующими свойствами:

Сравнение с нормой остатков

Иногда для указания степени соответствия используется норма остатков. Этот член рассчитывается как квадратный корень из суммы квадратов остатков :

Оба R 2 и норма невязки имеют свои относительные преимущества. Для анализа методом наименьших квадратов R 2 изменяется от 0 до 1, при этом более крупные числа указывают на лучшее соответствие, а 1 представляет собой идеальное соответствие. Норма остатков варьируется от 0 до бесконечности, при этом меньшие числа указывают на лучшее соответствие, а ноль указывает на идеальное соответствие. Одним из преимуществ и недостатков R 2 является то, что этот член нормализует значение. Если все значения y i умножить на константу, норма остатков также изменится на эту константу, но R 2 останется прежним. В качестве базового примера для линейного метода наименьших квадратов, подходящего к набору данных: S S малыш <\ displaystyle SS _ <\ text >> svg

R 2 = 0,998, а норма остатков = 0,302. Если все значения y умножаются на 1000 (например, при изменении префикса SI ), то R 2 остается прежним, но норма остатков = 302.

История

Создание коэффициента детерминации было приписано генетику Сьюоллу Райту и впервые было опубликовано в 1921 году.

Источник

Суть коэффициента детерминации состоит в следующем

3.4. Проверка адекватности моделей множественной линейной регрессии

3.4.1. Статистические критерии проверки адекватности моделей множественной регрессии

Анализ адекватности модели является важным этапом эконометрического моделирования. Для проверки адекватности моделей множественной регрессии, также как и парной линейной регрессии используют коэффициент детерминации и его модификации, отражающие особенности множественной модели, а также процедуры проверки статистических гипотез и построения доверительных интервалов для оценок параметров и прогнозов зависимой переменной.

3.4.2. Коэффициент детерминации

Важным показателем, характеризующим качество эмпирической регрессионной функции (ее соответствия наблюдаемым данным), является коэффициент детерминации. Полную сумму квадратов отклонений зависимой переменной от ее выборочного среднего в модели множественной регрессии можно представить в виде

В векторной форме выражение ( 3.28 ) можно записать так

f1
f2

С учетом ( 3.30 ) выражение ( 3.29 ) примет вид

f4

Первая форма записи коэффициента R 2

f5

Вторая форма записи R2

f6

Третья форма записи R2

f7

Все три формы записи по существу имеют тот же вид, что и в парной линейной регрессии, только представлены в векторном виде.

f8
f12

и в этом случае, очевидно, f13для всех значений i=1,2,…,n. Это означает, что поведение зависимой переменной полностью определяется независимыми случайными ошибками модели, и функция регрессии не объясняет поведение зависимой переменной.

Как и в случае парной линейной регрессии, коэффициент детерминации многомерной (множественной) регрессии следует понимать (интерпретировать) как долю (часть) дисперсии (выборочной) переменной y, объясненную уравнением регрессии. Коэффициент детерминации служит мерой адекватности модели: чем он больше, тем лучше ( при прочих равных условиях ) оценено уравнение регрессии.

Зависимость величины R 2 от количества регрессоров

Общеизвестна следующая зависимость R 2 и количества регрессоров k: если включить в модель дополнительный регрессор, то коэффициент детерминации может при этом только увеличиться. Обозначим f14— приращение величины коэффициента детерминации при добавлении дополнительного регрессора, здесь в скобках указано количество регрессоров в модели.

Тогда можно утверждать, что всегда будет f15.

Действительно, в модели с k+1 регрессором минимизируется функция k+1 переменной

f16
f18

3.4.3. Скорректированный коэффициент детерминации

Скорректированный коэффициент детерминации Тейла

Рассмотрим вторую форму представления коэффициента детерминации ( 3.34 ):

Выражение ( 3.36 ) можно записать в эквивалентном виде

f1

где f3, f4— смещенные оценки дисперсий случайной составляющей модели f5и зависимой переменной f6. Если теперь в выражении ( 3.37 ) смещенные оценки дисперсий заменить несмещенными, то получим скорректированный коэффициент детерминации Тейла

f2

Скорректированный коэффициент детерминации всегда меньше обычного, то есть имеет место соотношение

f7
f8
f9

откуда и следует неравенство ( 3.39 ).

Ранее было отмечено, что добавление дополнительного регрессора, как правило, увеличивает значение обычного коэффициента детерминации. Этого не происходит, если использовать скорректированный коэффициент детерминации. Его изменение, вызванное добавлением регрессора, может быть как положительным, так и отрицательным и поэтому, ориентируясь на значение скорректированного коэффициента, можно более объективно оценить, целесообразно ли введение дополнительного регрессора при уменьшении степеней свободы (приводит ли это к более адекватной модели). Лучшей признается модель, для которой скорректированный коэффициент f10больше.

Для модели примера 3.1. вычислим коэффициент детерминации и скорректированный коэффициент детерминации Тейла. Используя формулы ( 3.34 ) и ( 3.38 ), соответственно получим:

f11
f12

Данный результат позволяет сделать заключение о достаточно высоком качестве построенной регрессионной модели.

Вычислим коэффициент детерминации и скорректированный коэффициент детерминации Тейла для регрессии примера 3.2. Их значения равны

f13
f14

соответственно, что также позволяет сделать вывод о достаточно высоком качестве построенной модели.

Сравните результаты примеров 3.3, 3.4 с коэффициентами детерминации парных регрессий в примерах 2.4, 2.5. Сделайте выводы.

3.4.4. Построение доверительных интервалов для параметров регрессии и их линейных комбинаций

Построение доверительных интервалов как для отдельных коэффициентов регрессии так и для прогноза зависимой переменной является важнейшим этапом анализа регрессионной модели. Основные идеи, на которых базируются процедуры построения доверительных интервалов были рассмотрены в разделе ( 2.4.2 ) для случая парной линейной регрессии. Однако в многомерном случае появляются дополнительные задачи, в частности, построения интервалов и проверки гипотез для линейных комбинаций коэффициентов регрессии.

Эмпирическия оценка ковариационной матрицы вектора оценок параметров

Ранее для истинной ковариационной матрицы было получено выражение (формула ( 3.27 ))

f1
f4

В этом выражении неизвестно теоретическое значение дисперсии случайной составляющей модели f5. Оцененная по методу наименьших квадратов ковариационная матрица вектора b получается, если в выражении для теоретической ковариационной матрицы истинное значение дисперсии f5заменить его несмещенной оценкой. Получим выражение для такой оценки. Вспоминая выражения ( 3.15 ), ( 3.16 ) для оценок параметров и зависимой переменной, запишем

f6
f8
f11

Таким образом, для оцененной ковариационной матрицы получаем выражение

f12

На практике не приходится вычислять оценку ковариационной матрицы вручную, так как для этого существуют эффективные пакеты программ.

Доверительные интервалы для отдельных коэффициентов

Процедура построения доверительных интервалов для отдельных коэффициентов множественной регрессии принципиально не отличается от соответствующей процедуры в случае парной линейной регрессии, которую мы изучили в разделе 2.4.2. Как отмечалось выше, в классической линейной нормальной модели регрессии случайная переменная

f13a
f15
f19

Выражению ( 3.46 ) можно дать следующую интерпретацию: двусторонний симметричный доверительный интервал с

f21
f22

с вероятностью f20накрывает истинное значение регрессионного коэффициента f24. Уровень значимости выбирают, как и в парной линейной регрессии, либо равным 0,01 (однопроцентный уровень значимости), либо 0,05 (пятипроцентный уровень значимости).

Сравните доверительные интервалы, полученные в примерах 3.5, 3.6 с интервалами примеров 2.6, 2.7. Целесообразно ли включение дополнительных регрессоров в модели для объяснения поведения зависимой переменной?

Доверительные интервалы для линейных комбинаций коэффициентов регрессии

Часто при тестировании построенной модели множественной регрессии возникает задача проверки гипотез и построения доверительных интервалов для линейных комбинаций коэффициентов регрессии. Например, необходимо проверить, является ли сумма двух или нескольких коэффициентов постоянной величиной и построить доверительные границы для этой суммы.

f23

где f51— вектор коэффициентов линейной комбинации с постоянными компонентами, f52— оцененная линейная комбинация, f53— истинное (теоретическое) значение линейной комбинации, f54— оценка по методу наименьших квадратов стандартной ошибки линейной комбинации. Получим выражение для этой оценки. Теоретическая дисперсия линейной комбинации

f50

Заменяя в формуле ( 3.50 ) теоретическую дисперсию случайного члена ее несмещенной оценкой ( 3.42 ), получим эмпирическую оценку дисперсии линейной комбинации

f55
f56
f57

Заметим, что в линейной комбинации f58некоторые из коэффициентов f59могут быть равны нулю (разумеется, соответствующие коэффициенты в теоретическом значении комбинации также должны быть равны нулю). Границы симметричного доверительного интервала с уровнем значимости f60для значения линейной комбинации f61задаются следующим образом:

f62
f63

Замечание к интерпретации доверительных интервалов.

Процедура проверки гипотез относительно отдельных коэффициентов

f1
f2

Проверка гипотез о линейных комбинациях коэффициентов

Гипотезы о линейных комбинациях коэффициентов множественной регрессии формулируются следующим образом:

f8
f9

Правило проверки этих гипотез: гипотеза f12при уровне значимости f13отклоняется, если соответствующий двусторонний симметричный доверительный интервал не накрывает (не включает) значение c * с уровнем доверия f14.

1. двустороннюю пару гипотез относительно одного, двух или нескольких коэффициентов регрессии;

2. двустороннюю пару гипотез относительно значений одной, двух или нескольких линейных комбинаций коэффициентов регрессии (в отличие от t- теста, который проверяет гипотезу только об одной линейной комбинации);

3. совокупность гипотез относительно коэффициентов и их линейных комбинаций (t- тест подобного рода гипотезы проверять не позволяет).

В общем случае гипотезы для применения F- теста формулируются следующим образом:

f1
f2

Таким образом, с помощью F- теста в общем случае проверяются гипотезы относительно одновременного выполнения (или не выполнения) совокупности m линейных соотношений вида

F- статистика вычисляется по формуле

f5

Правило проверки гипотез на основе F-теста:

Гипотеза f9отклоняется, если выполнено неравенство

f7

2. Выбрать уровень значимости f15.

5. Проверить выполнение неравенства ( 3.54 ).

Частный случай: F-тест для совокупности регрессионных коэффициентов

На практике может возникнуть необходимость проверки гипотез о значимости коэффициентов множественной регрессии в совокупности, то есть нулевой гипотезы

f10

против альтернативной. Заметим, что в формулировке гипотезы не участвует свободный член f18регрессионного уравнения. Очевидно, гипотеза H0 вида ( 3.55 ) является частным случаем общей гипотезы ( 3.51 ), проверяемой с помощью F-теста. Действительно, достаточно матрицу C размерности (k-1) x k в общей формулировке ( 3.51 ) задать в виде

f17
f19

Ее можно получить из общей формулы для вычисления F-статистики ( 3.53 ).

Замечание. О проверке статистической значимости коэффициента детерминации.

f21
f22

F-тест для проверки этих гипотез можно получить, используя соотношение ( 3.56 ).

Опишите порядок проведения F-теста для проверки гипотезы ( 3.57 ) против альтернативы ( 3.58 ) и проверьте значимость коэффициентов детерминации в моделях примеров 3.1, 3.2.

f23
f24

Правило принятия решения состоит в следующем.

Нулевая гипотеза отклоняется, если выполняется неравенство

Источник

Adblock
detector
f25