Дашборд описательной статистики

Приветствую всех любителей красивой статистики! Предлагаю испробовать дашборд (краткий, наглядный, интерактивный отчет на один лист или экран), в котором рассчитываются показатели описательной статистики для анализируемой выборки. В дашборде также показываются аномалии (значения с наибольшим отклонением от средней), которые при желании можно тут же удалить. Все показатели и графики в этом случае обновляются.

Теперь более подробно. Первым делом по выборке строится т.н. «ящик с усами» (англ. box-and-whiskers diagram or plot, box plot). Это специальная диаграмма, которая показывает степень и характер разброса данных.

Вначале нарисовано два одинаковых «ящика». Однако если удалить аномальные наблюдения, то второй «ящик» изменится (разброс станет меньше).

В правой верхней таблице отражены статистические показатели по выборке. Первая колонка – для исходных данных, вторая – для скорректированной выборки. Третья колонка – относительная разница.

Нижняя таблица – перечень 10-ти наиболее отдаленных от средней арифметической значений. Первая колонка – названия наблюдений, вторая – их значения, третья – отклонение в среднеквадратических отклонениях от средней, последняя – статус присутствия в анализе (есть галочка – учитывается в расчетах, нет галочки – не учитывается в расчетах). Отклонение более 3-х сигм подсвечивается красным цветом. Это сигнал, что наблюдение находится далеко от общей массы. Его можно (но не всегда обязательно) исключить из анализа простым снятием галочки.

Последняя диаграмма – распределение средней арифметической, причем в двух вариантах: до и после удаления выбросов. Если удалить аномальное наблюдение, то при небольшом размере выборки распределение средней может заметно сместиться в какую-либо сторону, а также сузиться из-за уменьшения стандартной ошибки (зависящей от степени разброса исходных данных).

Закрашенная область под графиком (плотностью распределения средней) соответствует ширине доверительного интервала при указанной выше вероятности. Доверительная вероятность предлагается в 3-х наиболее часто используемых вариантах: 90%, 95% и 99% (переключатели над диаграммой). Чем больше доверительная вероятность, тем, соответственно, шире интервал.

В ролике ниже можно посмотреть, как это все это работает.

Получить бесплатно дашборд описательной статистики можно здесь.

Плодотворного использования!

Источник: StatAnaliz.info

Читайте по теме:

Оставить комментарий