Что такое среднеквадратичное отклонение
Перейти к содержимому

Что такое среднеквадратичное отклонение

  • автор:

2.2.4. Среднее квадратическое отклонение

В чём его смысл? Если мы отклонимся от математического ожидания влево и вправо на среднее квадратическое отклонение:

– то на этом интервале (или вблизи него) будут «сконцентрированы» наиболее вероятные значения случайной величины. Что мы, собственно, и наблюдаем – в полученный интервал попали значения и .

Однако так сложилось, что при анализе рассеяния чаще оперируют понятием дисперсии. Давайте разберёмся, что она означает применительно к играм. Если в случае со стрелками речь идёт о «кучности» попаданий относительно центра мишени, то здесь дисперсия характеризует две вещи:

Во-первых, при увеличении ставок, дисперсия тоже возрастает. Так, например, если мы увеличим в 10 раз, то математическое ожидание увеличится в 10 раз, а дисперсия – в 100 раз (коль скоро, это квадратичная величина). Но, заметьте, что сами-то правила игры не изменились! Изменились лишь ставки, грубо говоря, раньше мы ставили 10 рублей, теперь 100.
Второй, более интересный момент состоит в том, что дисперсия характеризует стиль игры. Мысленно зафиксируем игровые ставки на каком-то определённом уровне, и посмотрим, что здесь к чему:
Игра с низкой дисперсией – это осторожная игра. Игрок склонен выбирать самые надёжные схемы, и в ситуации неопределённости не рискует слишком большими деньгами. Например, система «красное / чёрное» в рулетке (см. Задачу 85).
Игра с высокой дисперсией. Её часто так и называют – дисперсионной игрой. Это авантюрный или агрессивный стиль игры, где игрок выбирает «адреналиновые» схемы. Вспомним хотя бы Мартингейл, где на кону оказываются суммы, на порядок превосходящие «тихую» игру предыдущего пункта.
Многими любимый покер: здесь есть так называемые тайтовые игроки, которые склонны осторожничать и «трястись» над своими игровыми средствами (банкроллом). Неудивительно, что их банкролл не подвергается значительным колебаниям (низкая дисперсия). Наоборот, если у игрока высокая дисперсия, то это агрессор. Он часто рискует, делает крупные ставки и может, как сорвать огромный банк, так и програться в пух и прах.
То же самое происходит на биржах, и так далее – примеров масса.
Причём, во всех случаях не важно – на копейки ли идёт игра или на тысячи долларов. На любом уровне есть свои низко- и высокодисперсионные игроки. Ну а за средний выигрыш, как мы помним, «отвечает» математическое ожидание.

Наверное, вы заметили, что нахождение дисперсии – есть процесс длительный и кропотливый. Но математика щедрА:

Полную и свежую версию этой книги в pdf-формате ,
а также курсы по другим темам можно найти после Оглавления.

Также вы можете изучить эту тему подробнее – просто, доступно, весело и бесплатно!

С наилучшими пожеланиями, Александр Емелин

3.2.6. Среднее квадратическое отклонение

Или среднеквадратическое отклонение. Или стандартное отклонение. Это синонимы. Оно обозначается греческой буквой «сигма», и коль скоро у нас выборочная совокупность, то добавляем соответствующий подстрочный индекс:

– выборочное среднее квадратическое отклонение.

Чем меньше стандартное отклонение (и дисперсия), тем меньше вариация – тем бОльшее количество вариант находится вблизи выборочной средней. Но у нас, как нетрудно «прикинуть на глазок», разброс довольно-таки велик – значительное количество вкладов расположено далековато от среднего значения , и поэтому стандартное отклонение получилось немалым.

Следующая часть задачи состоит в том, чтобы корректно оценить генеральную дисперсию и генеральное среднее квадратическое отклонение .

Не так давно я рассказал о том, что выборочная дисперсия представляет собой смещённую оценку генеральной дисперсии. Это означает, что если мы будем проводить неоднократные выборки из той же генеральной совокупности, то полученные значения будут систематически занижено оценивать . Обращаю ваше внимание, что это не значит, что будет всегда меньше, чем .

И поэтому выборочную дисперсию, как намекает условие, нужно поправить:

исправленная выборочная дисперсия

или 240,30 денежных единиц – исправленное среднее квадратическое отклонение.

и – это уже несмещённые оценки генеральной дисперсии и генерального стандартного отклонения соответственно.

Ввиду большого объёма выборки (100 вариант) этой поправкой можно пренебречь, но мы всё же не будем «разбрасываться» 30 «копейками».

Ответ: ; в качестве оценки соответствующих генеральных показателей принимаем и .

Рассмотренные выше показатели (размах вариации, среднее линейное отклонение, дисперсия, стандартное отклонение) входят в группу абсолютных показателей вариации, которые обладают рядом неудобств.

Так, если в прорешанной задаче не уменьшать варианты в 1000 раз, то дисперсия получится в миллион раз больше! Да-да, не , а . И возникает естественное желание привести результаты к некому единому стандарту.

Для этого существуют показатели относительные, и самый известный из них –

© mathprofi.ru — mathter.pro, 2010-2023, сделано в Блокноте.

Среднеквадратическое отклонение (Mean square deviation)

Среднеквадратическое отклонение — статистическая характеристика распределения случайной величины, показывающая среднюю степень разброса значений величины относительно математического ожидания. Обозначается греческой σ (сигма) или буквой S .

Среднеквадратическое отклонение измеряется в единицах самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

Определяется как квадратный корень из дисперсии случайной величины. Стандартное отклонение на основании смещённой оценки дисперсии (иногда называемой просто выборочной дисперсией):

S = √ 1 n n ∑ i = 1 ( x i − ¯ x ) 2 .

Стандартное отклонение на основании несмещённой оценки дисперсии:

S 0 = √ n n − 1 S 2 = √ 1 n − 1 n ∑ i = 1 ( x i − ¯ x ) 2 ,

где S 2 — выборочная дисперсия; x i — i-й элемент выборки; n — объём выборки; ¯ x — среднее арифметическое выборки (выборочное среднее):

¯ x = 1 n n ∑ i = 1 x i = 1 n ( x 1 + … + x n ) .

Большее значение среднеквадратического отклонения показывает больший разброс наблюдаемых значений признака относительно среднего; меньшее значение, соответственно, показывает, что величины в множестве сгруппированы вокруг среднего.

Наряду с дисперсией среднеквадратическое отклонение является одним из параметров нормального распределения. Чем оно выше, тем длиннее «хвосты» распределения.

В анализе данных среднеквадратическое отклонение может использоваться в качестве меры изменчивости значений признаков, степени отклонения желаемых показателей от наблюдаемых, а также для обнаружения выбросов и аномальных значений в данных c помощью правила трёх сигм.

Среднеквадратическое отклонение

Среднеквадрати́ческое отклоне́ние (синонимы: среднеквадрати́чное отклоне́ние, квадрати́чное отклоне́ние; близкие термины: станда́ртное отклоне́ние, станда́ртный разбро́с) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания.

Основные сведения

Измеряется в единицах измерения самой случайной величины. Равно корню квадратному из дисперсии случайной величины. Среднеквадратическое отклонение используют при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

Среднеквадратическое отклонение:

\sigma=\sqrt<\frac<1></p>
<p>\sum_^n\left(x_i-\bar\right)^2>.» width=»» height=»» /></p>
<p><b>Стандартное отклонение</b> (оценка среднеквадратического отклонения случайной величины Пол, стены вокруг нас и потолок, <i>x</i> относительно её математического ожидания на основе несмещённой оценки её дисперсии):</p><div class='code-block code-block-13' style='margin: 8px 0; clear: both;'>
<!-- 13komputernn -->
<script src=

s=\sqrt<\frac<n></p>
<p>\sigma^2>=\sqrt\sum_^n\left(x_i-\bar\right)^2>;» width=»» height=»» /></p>
<p>где <img decoding=— дисперсия; x_i\,\!— Пол, стены вокруг нас и потолок, i -й элемент выборки; n\,\!— объём выборки; \bar<x>\,\!» width=»» height=»» /> — среднее арифметическое выборки:</p><div class='code-block code-block-14' style='margin: 8px 0; clear: both;'>
<!-- 14komputernn -->
<script src=

\bar<x></p>
<p> = \frac\sum_^n x_i = \frac (x_1+\ldots+x_n).» width=»» height=»» /></p>
<p>Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной [1] .</p><div class='code-block code-block-15' style='margin: 8px 0; clear: both;'>
<!-- 15komputernn -->
<script src=

Правило трёх сигм

График плотности вероятности нормального распределения и процент попадания случайной величины на отрезки, равные среднеквадратическому отклонению.

Правило трёх сигм (3\sigma\,\!) — практически все значения нормально распределённой случайной величины лежат в интервале \left[\bar-3\sigma;\bar+3\sigma\right]. Более строго — не менее чем с 99,7 % достоверностью значение нормально распределенной случайной величины лежит в указанном интервале (при условии, что величина \bar истинная, а не полученная в результате обработки выборки).

Если же истинная величина \bar<x>» width=»» height=»» /> неизвестна, то следует пользоваться не <img decoding=, а Пол, стены вокруг нас и потолок, s . Таким образом, правило трёх сигм преобразуется в правило трёх Пол, стены вокруг нас и потолок, s .

Интерпретация величины среднеквадратического отклонения

Большое значение среднеквадратического отклонения показывает большой разброс значений в представленном множестве со средней величиной множества; маленькое значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

Например, у нас есть три числовых множества: , и . У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения — значения внутри множества сильно расходятся со средним значением.

В общем смысле среднеквадратическое отклонение можно считать мерой неопределенности. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.

Практическое применение

На практике среднеквадратическое отклонение позволяет определить, насколько значения в множестве могут отличаться от среднего значения.

Климат

Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой внутри континента. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

Спорт

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

Технический анализ

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера.

См. также

Литература

Пояснение причин и соответствующее обсуждение вы можете найти на странице Википедия:К удалению/17 декабря 2012.
Пока процесс обсуждения не завершён, статью можно попытаться улучшить, однако следует воздерживаться от переименований или удаления содержания, подробнее см. руководство к дальнейшему действию.
Не снимайте пометку о выставлении на удаление до окончания обсуждения.

* Боровиков, В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. — СПб. : Питер, 2003. — 688 с. — ISBN 5-272-00078-1 .

  1. Обе вышеупомянутые оценки — состоятельные

Wikimedia Foundation . 2010 .

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *