23 января 2020 года министр Кабинета Министров Дмитрий Дубилет в своем Telegram-канале опубликовал данные переписи населения. Она проводилась смешанными методами, с учетом данных госреестров, данных мобильных операторов и т.д.

А 4 февраля 2020 года на сайте Украинского центра общественных данных (УЦОД) появилось расследование о том, что эта перепись якобы фейковая, поскольку разные данные населения отличаются от данных Госстата на один и тот же коэффициент: 0,88. Разбираемся, что случилось.

В чем обвиняют Дубилета и команду, которая проводила перепись

На сайте УЦОД речь идет о том, что разоблачение — результат проверки: как данные по половой и возрастной структуре населения, опубликованные Кабмином, соотносятся с данными Госстата.

Авторы расследования взяли данные с сайта Госстата и сгруппировали их по возрастным категориям, которые есть в презентации Кабмина: дети 0-14 лет, ранний трудоспособный возраст 15-24 лет, основной трудоспособный возраст 25-54 года и т.д. Результаты занесли в Google-таблицу. При сравнений показателей Госстата и переписи обнаружили, что они все отличаются примерно в 0,88 раз:

Соответственно, Дубилета и команду, которая проводила перепись, обвинили в обычном умножении данных Госстата на 0,88.

“Мы попробовали воссоздать возможное применение коэффициента 0,888 к данным Госстата. После нескольких итераций нам удалось практически со 100% точностью сгенерировать данные, которые опубликовал Дубилет, как якобы результат экстраполяции данных пенсионного реестра на данные Госстата”, — сообщают авторы материала.

Результаты подсчетов также выложили в онлайн-таблице. По данным УЦОД, результаты совпали для всех групп. Из этого авторы расследования делают вывод, что Дубилет с командой “сфальсифицировали общенациональное исследование, сознательно обманув всю Украину”.

Эти выводы до сих пор обсуждают в Facebook.

Как обвинения комментируют в Кабмине

Утром 5 февраля 2020 года Дмитрий Дубилет прокомментировал обвинения, опубликованные на сайте УЦОД, и назвал их фейком. В частности, он напомнил, что один из методов работал так: взяли количество пенсионеров по данным Пенсионного фонда, затем экстраполировали эти данные через половую и возрастную структуру. Получился график-“елка” (который анализируется в расследовании):

По словам Дубилета, елочку брали из двух источников: данные Госстата и данные госреестров. И эти “елки” совпали почти полностью.

“Почему данные “елки” по данным Госстата и по данным, которые мы получили из электронных реестров, почти полностью совпали? Потому что Госстат свою “елку” вел также на основании электронных реестров. Как только кто-то умирает или рождается — Госстат отражает это в своей “елке”. Непонятно, зачем подавать как сенсацию то, что черным по белому написано нами же в описании методологии”, — пишет Дубилет.

Он имеет в виду слайд 2 презентации, где описан второй метод подсчета:

Он также отметил, что якобы разоблачительный материал УЦОД поддерживали платной рекламой и публикациями на “сомнительных сайтах”. По словам Дубилета, один из них предложил снять публикацию за $1500.

Update: Исследование по просьбе редакции прокомментировал Павел Поликарчук, руководитель проекта “Рейтинг. Бизнес в официальных цифрах”, который участвовал в проекте оценки количества населения:

“Суть претензии «исследователей» заключается в том, что данные проведенной нами оценки точно совпадают по структуре с данными поло-возрастной структуры, которую публикует Госстат.

В этом нет ничего удивительного. Ведь в самой презентации и во время пресс-конференции об этом было явно и прямо заявлено, что мы опирались на структуру, сделанную Госстатом, а потом уточняли и пересчитывали ее за счет других реестров.

Почему в случае каждой возрастной группы возникло примерно одно и то же соотношение между данными Госстата и уточненным количеством, полученным в ходе оценки? Причина в том, что и “елка” от Госстата, и построенная нами базируются на источниках данных одного типа — госреестрах.

Точное совпадение структуры между несвязанными реестрами и структурой, опубликованой Госстатом, и дало подтверждение правильности наших расчетов. Еще это показало, что Госстат отлично справлялся с ведением этой структуры на протяжении 19 лет с момента проведения последней переписи”.