- Что показывает коэффициент осцилляции в статистике
- Дисперсия, среднеквадратичное (стандартное) отклонение, коэффициент вариации в Excel
- Дисперсия
- Расчет дисперсии в Excel
- Свойства дисперсии
- Среднеквадратичное (стандартное) отклонение
- Расчет cреднеквадратичного (стандартного) отклонения в Excel
- Коэффициент вариации
- Расчет коэффициента вариации в Excel
- Коэффициент осцилляции
- Относительные показатели вариации. Коэффициент осцилляции:
- Показатели вариации
Что показывает коэффициент осцилляции в статистике
— область применения и методику расчёта степенных средних величин;
— исчислять степенные средние величины;
— формулировать вывод по полученным результатам.
Наряду со средними величинами в статистике исчисляются показатели вариации. Вариацией в статистике называются различия индивидуальных значений изучаемого признака. Возникает вариация в силу того, что отдельные значения признака статистической совокупности формируются под воздействием разнообразных факторов. Значение изучения вариации в том, что по колеблемости признаков можно судить о качественной однородности совокупности. Совокупности могут иметь одинаковые значения средней величины, но отличаться колеблемостью индивидуальных значений.
Например : По имеющимся данным о дневной выработке рабочих двух бригад определить среднюю выработку рабочего за день в каждой бригаде, сделать вывод об однородности рассматриваемых совокупностей и надёжности их средних.
Выработка в первой бригаде: 31, 25, 30, 26, 28 деталей.
Выработка во второй бригаде: 27, 20, 56, 19, 18 деталей.
Исходные данные не сгруппированы, поэтому для расчёта средней выработки применяем среднюю арифметическую простую. Средняя дневная выработка рабочего:
в первой бригаде
во второй бригаде
Среднедневная выработка рабочего в обеих бригадах одинакова, но индивидуальные значения выработки во второй бригаде подвержены значительным колебаниям. Это вызывает необходимость измерять вариацию.
К абсолютным показателям вариации относятся
размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.
В нашем примере размах вариации индивидуальной выработки:
в первой бригаде R1 =31-25=6 деталей
во второй бригаде R2 =56-18=38 деталей
Сравнение этих показателей свидетельствует о том, что размах вариации индивидуальной выработки во второй бригаде на 32 детали больше, чем в первой бригаде. Однако размах вариации не улавливает колеблемости вариантов внутри изучаемой совокупности. Для получения обобщающей характеристики колеблемости всех вариантов совокупности исчисляются другие показатели вариации.
Среднее линейное отклонение даёт обобщённую характеристику степени колеблемости признака в совокупности относительно среднего уровня признака и рассчитывается как средняя арифметическая из индивидуальных линейных отклонений по формуле:
— для невзвешенных данных
— для взвешенных данных
Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируют состав работающих, ритмичность производства, равномерность поставок материалов; разрабатывают системы материального стимулирования. Но этот показатель усложняет расчёты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.
В статистике дисперсия, центральный момент второго порядка, является оценкой одноимённого показателя теории вероятностей и оценкой дисперсии в математической статистике, что позволяет использовать теоретические положения этих дисциплин для анализа социально – экономических процессов. На дисперсии практически основаны все метод математической статистики. Большое значение имеет правило сложения дисперсий. Дисперсия рассчитывается как средний квадрат отклонений индивидуальных значений признака от среднего
значения признака по формуле:
— для невзвешенных данных
— для взвешенных данных
Для расчёта показателей вариации в нашем примере строим вспомогательную таблицу:
Индивидуальное линейное отклонение
Дисперсия, среднеквадратичное (стандартное) отклонение, коэффициент вариации в Excel
Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. В этой статье изучим дисперсию, среднеквадратичное отклонение и коэффициент вариации.
Дисперсия
Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.
Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.
Формула дисперсии в теории вероятностей имеет вид:
То есть дисперсия — это математическое ожидание отклонений от математического ожидания.
На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое. Расчет дисперсии производят по формуле:
s 2 – выборочная дисперсия, рассчитанная по данным наблюдений,
X – отдельные значения,
X̅– среднее арифметическое по выборке.
Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. Однако при увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной.
Простыми словами дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Теперь вы знаете, как найти дисперсию.
Расчет дисперсии в Excel
Генеральную и выборочную дисперсии легко рассчитать в Excel. Есть специальные функции: ДИСП.Г и ДИСП.В соответственно.
В чистом виде дисперсия не используется. Это вспомогательный показатель, который нужен в других расчетах. Например, в проверке статистических гипотез или расчете коэффициентов корреляции. Отсюда неплохо бы знать математические свойства дисперсии.
Свойства дисперсии
Свойство 1. Дисперсия постоянной величины A равна 0 (нулю).
Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А 2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.
Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.
Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.
Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.
Среднеквадратичное (стандартное) отклонение
Если из дисперсии извлечь квадратный корень, получится среднеквадратичное (стандартное) отклонение (сокращенно СКО). Встречается название среднее квадратичное отклонение и сигма (от названия греческой буквы). Общая формула стандартного отклонения в математике следующая:
На практике формула стандартного отклонения следующая:
Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.
Расчет cреднеквадратичного (стандартного) отклонения в Excel
Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).
Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.
Коэффициент вариации
Значение стандартного отклонения зависит от масштаба самих данных, что не позволяет сравнивать вариабельность разных выборках. Чтобы устранить влияние масштаба, необходимо рассчитать коэффициент вариации по формуле:
По нему можно сравнивать однородность явлений даже с разным масштабом данных. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. В реальности, если коэффициент вариации превышает 33%, то специально ничего делать по этому поводу не нужно. Это информация для общего представления. В общем коэффициент вариации используют для оценки относительного разброса данных в выборке.
Расчет коэффициента вариации в Excel
Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:
Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:
Коэффициент осцилляции
Еще один показатель разброса данных на сегодня – коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.
Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.
Таким образом, в статистическом анализе существует система показателей, отражающих разброс или однородность данных.
Ниже видео о том, как посчитать коэффициент вариации, дисперсию, стандартное (среднеквадратичное) отклонение и другие показатели вариации в Excel.
Относительные показатели вариации. Коэффициент осцилляции:
Коэффициент осцилляции:
%.
Для оценки меры вариации и ее значимости используют коэффициент вариации. Он получается путем сопоставления среднего линейного или среднего квадратического отклонения со средним уровнем явления и выражается в процентах:
Линейный коэффициент вариации:
%.
Коэффициент вариации:
%.
Относительные показатели вариации используются для:
1) сравнения колеблимости различных признаков в одной и той же совокупности;
2) при сравнении колеблимости одного и того же признака в нескольких совокупностях.
Значение коэффициента вариации изменяется от 0 до 1, и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности. Они дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по составу.
Альтернативный признак – косвенный признак, имеющий две взаимоисключающие разновидности.
Альтернативные признаки принимают всего два значения:
1 – наличие признака;
0 – отсутствие признака.
Дисперсия альтернативного признака:
где p – доля единиц в совокупности, обладающих данным признаком;
q – доля единиц, не обладающих данным признаком.
Среднеквадратическое отклонение альтернативного признака:
Общая дисперсия –измеряет вариацию признака по всей совокупности от общей средней под влиянием всех факторов, обусловивших эту вариацию:
.
Межгрупповая дисперсияхарактеризует вариацию групповых средних от общей средней:
,
где − групповые средние;
−общая средняя.
Внутригрупповая (частная) дисперсия отражает случайную вариацию, вариацию признака в группах от групповой средней:
.
Средняя из внутригрупповых (частных) дисперсии:
,
где − групповые дисперсии;
− число в группах.
Между указанными видами дисперсий существует соотношение, которое называется правилом сложения дисперсий: общая дисперсия равна сумме средней из частных дисперсий и межгрупповой:
,
где − общая дисперсия;
− средняя из внутригрупповых дисперсии;
− межгрупповая дисперсия.
С помощью правила сложения дисперсий можно измерить силу влияния факторного признака, который положен в основу группировки, на результативный признак, вычислив коэффициенты детерминации и эмпирическое корреляционное отношение.
Эмпирический коэффициент детерминации показывает долю вариации результативного признака под влиянием факторного признака, равен отношению межгрупповой дисперсии к общей:
.
Эмпирическое корреляционное отношение показывает тесноту связи между группировочным и результативным признаками:
.
Эмпирическое корреляционное отношение варьирует в пределах от 0 до 1. При связи нет, т.е. группировочный признак не оказывает влияния на результативный. При — связь полная, т.е. изменение результативного признака полностью обусловлено группировочным признаком. Чем больше корреляционное отношение приближается к единице, тем полнее корреляционная связь между признаками. (Связь при: 0-0,2 – очень слабая, 0,2-0,3 – слабая, 0,3-0,5 – умеренная, 0,5-0,7 – заметная, 0,7-0,9 – тесная, 0,9-0,99 – весьма тесная).
Правило сложения дисперсий для доли признака:
,
где − общая дисперсия доли;
− средняя из внутригрупповых дисперсий доли;
− межгрупповая дисперсия доли.
Общая дисперсия доли:
,
где − доля изучаемого признака во всей совокупности, определяемая по формуле:
.
Средняя из групповых дисперсий доли:
.
Межгрупповая дисперсия доли:
.
Показатели вариации
Поможем написать любую работу на аналогичную тему
Показатели вариации. При изучении варьирующего признака у единиц совокупности нельзя ограничиваться лишь расчетом средней величины из отдельных вариантов, так как одна и та же средняя может относиться далеко не к одинаковым по составу совокупностям.
Вариацией признака называется различие индивидуальных значений признака внутри изучаемой совокупности.
Термин «вариация» произошел от латинского variatio – изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией.
Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Колеблемость отдельных значений характеризуют показатели вариации. Чем больше вариация, тем дальше в среднем отдельные значения лежат друг от друга.
Различают вариацию признака в абсолютных и относительных величинах.
К абсолютным показателям относятся: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. Все абсолютные показатели имеют ту же размерность, что и изучаемые величины.
К относительным показателям относятся коэффициенты осцилляции, линейного отклонения и вариации.
Показатели абсолютные. Рассчитаем абсолютные показатели, характеризующие вариацию признака.
Размах вариации, представляет собой разность между максимальным и минимальным значением признака.
Показатель размаха вариации не всегда применим, так как он учитывает только крайние значения признака, которые могут сильно отличаться от всех других единиц.
Более точно можно определить вариацию в ряду при помощи показателей, учитывающих отклонения всех вариантов от средней арифметической.
Таких показателей в статистике два: среднее линейное и среднее квадратическое отклонение.
Среднее линейное отклонение (L) представляет собой среднее арифметическое из абсолютных значений отклонений отдельных вариантов от средней.
– для несгруппированных данных;
– для сгруппированных данных.
Практическое использование среднего линейного отклонения заключается в следующем, с помощью этого показателя анализируется состав работающих, ритмичность производства, равномерность поставок материалов.
Недостаток этого показателя заключается в том, что он усложняет расчеты вероятного типа, затрудняет применение методов математической статистики.
Среднее квадратическое отклонение () является наиболее распространенным и общепринятым показателем вариации. Оно несколько больше среднего линейного отклонения. Для умеренно асимметричных распределений установлено следующее соотношение между ними
=1,25L
Для его исчисления каждое отклонение от средней возводится в квадрат, все квадраты суммируются (с учетом весом), после чего сумма квадратов делится на число членов ряда и из частного извлекается корень квадратный.
Все эти действия выражает следующая формула
– для несгруппированных данных,
– для сгруппированных данных.
т.е. среднее квадратическое отклонение представляет собой корень квадратный из средней арифметической квадратов отклонений от средней.
Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше σ, тем лучше среднее арифметическое отражает собой всю представляемую совокупность.
Средняя арифметическая из квадратов отклонений вариантов значений признака от средней величины носит название дисперсии (), которая рассчитывается по формулам
– для несгруппированных,
– для сгруппированных.
Отличительной особенностью данного показатели является то, что при возведении в квадрат () удельный вес малых отклонений уменьшается, а больших увеличивается в общей сумме отклонений.
Дисперсия обладает рядом свойств, некоторые из них позволяют упростить её вычисление:
1. Дисперсия постоянной величины равна 0.
Если , то и .
Тогда .
2. Если все варианты значений признака (x) уменьшить на одно и то же число, то дисперсия не уменьшится.
Пусть , но тогда в соответствии со свойствами средней арифметической и .
Дисперсия в новом ряду будет равна
, т.е. дисперсия в ряду равна дисперсии первоначального ряда .
3. Если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.
Пусть , тогда и .
Дисперсия же нового ряда будет равна
Выше был рассмотрен расчет показателей вариации для количественных признаков, но в экономических расчетах может ставиться задача оценки вариации качественных признаков. Например, при изучении качества изготовленной продукции, продукцию можно разделить на качественную и бракованную.
В таком случае речь идет об альтернативных признаках.
Альтернативными признаками называются такие, которыми одни единицы совокупности обладают, а другие нет. Например, наличие производственного стажа у абитуриентов, ученая степень у преподавателей ВУЗов и т.д. Наличие признака у единиц совокупности условно обозначаем через 1, а отсутствие – 0. Тогда, если долю единиц, обладающих признаком (в общей численности единиц совокупности), обозначить через р, а долю единиц, не обладающих признаком, через q, дисперсию альтернативного признака можно рассчитать по общему правилу. При этом p + q = 1 и, значит, q = 1– p.
Сначала рассчитываем среднее значение альтернативного признака:
Рассчитаем среднее значение альтернативного признака
,
т.е. среднее значение альтернативного признака равно доле единиц, обладающих данным признаком.
Дисперсия же альтернативного признака будет равна:
Таким образом, дисперсия альтернативного признака равняется произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих данным признаком.
А среднее квадратическое отклонение будет равно =.
Показатели относительные. Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях представляют интерес показатели вариации, выраженные в относительных величинах. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане.
Чаще всего они выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Различают следующие относительные показатели вариации:
1. Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней.
.
2. Относительное линейное отклонение характеризует долю усредненного значения абсолютных отношений от средней величины.
.
3. Коэффициент вариации оценивает типичность средних величин.
.
Чем меньше , тем однороднее совокупность по изучаемому признаку и типичнее средняя. Если ≤33%, то распределение близко к нормальному, а совокупность считается однородной. Из приведенного примера вторая совокупность однородна.
Виды дисперсий и правило сложения дисперсий. Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.
При этом можно определить три показателя колеблемости признака в совокупности:
1. Общую вариацию совокупности, которая является результатом действия всех причин. Эта вариация может быть измерена общей дисперсией (), характеризующей отклонения индивидуальных значений признака совокупности от общей средней
.
2. Вариацию групповых средних, выражающих отклонения групповых средних от общей средней и отражающих влияние того фактора, по которому произведена группировка. Эта вариация может быть измерена так называемой межгрупповой дисперсией (δ2)
,
где — групповые средние, а -общая средняя для всей совокупности, и — численность отдельных групп.
3. Остаточную (или внутригрупповую) вариацию, которая выражается в отклонении отдельных значений признака в каждой группе от их групповой средней и, следовательно, отражает влияние всех прочих факторов кроме положенного в основу группировки. Поскольку вариацию в каждой группе отражает групповая дисперсия
,
то для всей совокупности остаточную вариацию будет отражать средняя из групповых дисперсий. Эту дисперсию называют средней из внутригрупповых дисперсий () и рассчитывается она по формуле
.
Общая вариация признака в совокупности должна определяться как сумма вариации групповых средних (за счет одного выделенного фактора) и остаточной вариации (за счет остальных факторов). Это равенство находит свое выражение в сложении дисперсий
.
Это равенство, имеющее строго математическое доказательство, известно, как правило сложения дисперсий.
Правило сложения дисперсий позволяет находить общую дисперсию по её компонентам, когда индивидуальные значения признака неизвестны, а в распоряжении имеются только групповые показатели.
Коэффициент детерминации. Правило сложения дисперсии позволяет выявить зависимость результатов от определенных факторов при помощи коэффициента детерминации.
,
Этот коэффициент показывает долю (удельный вес) общей вариации изучаемого признака, обусловленную вариацией группировочного признака.
Корень квадратный из коэффициента детерминации носит название корреляционного отношения ():
Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Корреляционное отношение изменяется в пределах от 0 до 1. Если , то группировочный признак не оказывает влияния на результативный. Если , то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю.
Показатели асимметрии и эксцесса. В области экономических явлений строго симметричные ряды встречаются крайне редко, чаще приходится иметь дело с асимметричными рядами.
В статистике для характеристики асимметрии пользуются несколькими показателями. Если учесть, что в симметричном ряду средняя арифметическая совпадает по значению с модой и медианой, то наиболее простым показателем асимметрии () будет разность между средней арифметической и модой, т.е. =.
Если ()>0, то на графике такой ряд будет иметь вытянутость вправо (правосторонняя асимметрия).
Если () 0, то эксцесс считают положительным (распределение островершинно), если