Дополнение к итоговому обзору посещаемости рфпл: пояснения, оправдания и извинения
В деле любого статистиковеда (шмогли выговорить?) основное правило — перепроверять данные на их достоверность и перепроверять то, что ты пишешь.
К сожалению, очень часто проскакивают ошибки, где-то мелкие, где-то большие. Какие-то сильно не влияют на посыл написанного, какие-то серьезно искажают весь смысл.
И, к большому сожалению, одна такая смогла просочиться в итоговый обзор посещаемости РФПЛ. 99% читателей, скорее всего, её даже не заметили.
Сразу скажу, что последние месяцы для меня выдался довольно тяжелым — перенесенная травма колена и последующая реабилитация отняли много сил, обзор писал будучи под барбитуратами обезболивающими. Это не оправдание самой ошибки, потому что в любом случае нужно проверять, что пишешь.
Ошибка была в расчетах среднего процента заполняемости для клубов, которые сезон провели на двух и более стадионах. Как известно, просто так средний процент с нескольких средних процентов нельзя взять, сложить и разделить на их количество.
Для этого применяется среднее взвешенное либо арифметическое, либо гармоническое.
Формула средней гармонической:
Используется гармоническое, так как нам известно значение х — заполняемость (меньше либо равно единице) и z — посещаемость, которая является произведением заполняемости на вместимость стадиона. Выражаясь простым языком, чтобы получить средний процент заполняемости, мы делим итоговую посещаемость на сумму всех стадионов.
В нашем случае, на примере Ростова, который сыграл на 2 стадионах с четырьмя разными вместимостями (15840 на Олимп-2, 13000 на первом тестовом матче Ростов Арена, 25000 — на втором и 40709 — на третьем) мы получаем формулу и вычисления:
Это то, что вы сейчас можете видеть в итоговом обзоре. Но до указания на ошибку пользователем Demitar, в графе Заполняемость у Ростова красовалось красивое число 87% (в истории осталась неправильная таблица, вот ссылка).
Что в корне неправда и что меня ничуть не смутило (рекорды ведь сплошные!).
А получилось так, потому что вместо того, чтобы суммировать всё и вся, я взял средние значения. Как это выглядело:
Разница в 16%. Огромная, в плане процентов и достоверности.
То же самое касается и Урала — вместо первоначальных 76% с верными расчетами получаются правильные 60%. Немного корректируется заполняемость у остальных клубов: Ахмат — с 60 до 54, Рубин — с 21 до 23, Тосно — с 22 до 27, Амкар — с 26 до 32.
Формула для расчетов была верная. Но каким-то необъяснимым образом я её переиначил, использовав средние значения. Немного оправдаюсь своим плохим состоянием здоровья в те дни и тем, что это первое такое серьезное подведение итогов посещаемости российского чемпионата.
Подготовить такой материал и не сойти с ума было сложно.
***
Извиняюсь перед теми, кого ввел в заблуждение (Ростов по заполняемости теперь не на первом месте) и ещё раз говорю спасибо пользователю Demitar (хотя он сначала довольно резко высказался, что мне хотелось его забанить).
Увидимся на чемпионате мира по футболу! Обзоры посещаемости будут выходить после каждого сыгранного тура.
***
Подписывайтесь, оставляйте комментарии, ставьте плюсики за понравившийся отчет. Поле ровное, мяч круглый, трибуны прямоугольные.
При копировании материала указывайте ссылку на блог.
Итоги посещаемости чемпионата России по футболу, сезон 2017-2018
Отчет об открытии Самара-Арены
Первый матч на «Калининград Арене». Как это было
Раздвижная крыша: строить или нет?
Что там с посещаемостью в Европе?