Теперь более подробно. Первым делом по выборке строится т.н. «ящик с усами» (англ. box-and-whiskers diagram or plot, box plot). Это специальная диаграмма, которая показывает степень и характер разброса данных.
Вначале нарисовано два одинаковых «ящика». Однако если удалить аномальные наблюдения, то второй «ящик» изменится (разброс станет меньше).
В правой верхней таблице отражены статистические показатели по выборке. Первая колонка – для исходных данных, вторая – для скорректированной выборки. Третья колонка – относительная разница.
Нижняя таблица – перечень 10-ти наиболее отдаленных от средней арифметической значений. Первая колонка – названия наблюдений, вторая – их значения, третья – отклонение в среднеквадратических отклонениях от средней, последняя – статус присутствия в анализе (есть галочка – учитывается в расчетах, нет галочки – не учитывается в расчетах). Отклонение более 3-х сигм подсвечивается красным цветом. Это сигнал, что наблюдение находится далеко от общей массы. Его можно (но не всегда обязательно) исключить из анализа простым снятием галочки.
Последняя диаграмма – распределение средней арифметической, причем в двух вариантах: до и после удаления выбросов. Если удалить аномальное наблюдение, то при небольшом размере выборки распределение средней может заметно сместиться в какую-либо сторону, а также сузиться из-за уменьшения стандартной ошибки (зависящей от степени разброса исходных данных).
Закрашенная область под графиком (плотностью распределения средней) соответствует ширине доверительного интервала при указанной выше вероятности. Доверительная вероятность предлагается в 3-х наиболее часто используемых вариантах: 90%, 95% и 99% (переключатели над диаграммой). Чем больше доверительная вероятность, тем, соответственно, шире интервал.
В ролике ниже можно посмотреть, как это все это работает.
Получить бесплатно дашборд описательной статистики можно здесь.
Плодотворного использования!
Источник: StatAnaliz.info