Сергей Сергаев
Сергей Сергаев личный блог
21 января 2022, 23:24

Для любителей статистического анализа (квартет Энскомба)

Статистика - это такой инструмент… Очень страшный в неумелых руках.
В умелых руках и того страшнее — способен разорвать мозг на куски.
Вот есть наборы данных (с двумя переменными x и y) I, II, III и IV, про которые известны следующие их свойства:
Для любителей статистического анализа (квартет Энскомба)
Квартет Энскомба — четыре набора числовых данных, у которых простые статистические свойства идентичны, но их графики существенно отличаются. Каждый набор состоит из 11 пар чисел. Квартет был составлен в 1973 году английским математиком Ф. Дж. Энскомбом.
Сами последовательности приведены ниже. Значение x одинаковы для первых трёх последовательностей.
Для любителей статистического анализа (квартет Энскомба)
 
А теперь смотрим на эти графики глазами:
Для любителей статистического анализа (квартет Энскомба)

Энскомб утверждал: Большинство статистических вычислений строятся на предположениях относительно поведения данных. Эти предположения могут оказаться неверными, и тогда результаты вычислений тоже будут содержать ошибку. Всегда следует пытаться проверять, являются ли предположения верными. А если они ошибочны, мы должны быть способны понять, что с ними не так. В этом весьма полезны графики.
 
Применение графиков для визуализации и изучения данных получило название разведочного анализа данных. Наибольшую известность он приобрел благодаря продвижению американским математиком Джоном Тьюки в книге Exploratory Data Analysis (Pearson), опубликованной в 1977 году. При правильном подходе графики помогают видеть более масштабную картину, а также отмечать очевидные или необычные закономерности.

3 Комментария

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн