На 2020 год в Украине запланирована перепись населения. Но это — довольно дорогой для бюджета проект. Министр Кабинета министров Дмитрий Дубилет рассказывает о том, как с помощью данных мобильных операторов можно провести ее аналог: “электронную перепись”.
Почему планируют именно “электронную перепись”?
Сразу уточним: “электронная перепись”, о которой пишет Дмитрий Дубилет, не является полноценной заменой переписи населения (последний раз такая проводилась еще в 2001 году). В ходе “электронной переписи” собираются данные о:
- количестве населения городов, районов, областей;
- поле и возрасте населения.
Когда проводится традиционная перепись (т.е. по домам ходят интервьюеры с анкетами), собирают более специализированные данные, от национальности до использования типа отопления и ТВ. Но, по словам Дубилета, он пообщался с пользователями таких данных в правительстве — министрами, директорами департаментов и т.д., и оказалось, что в 90% случаев нужны данные первого типа.
Поэтому правительство как эксперимент проведет “электронную перепись”: это исследование о населении Украины, базирующееся на данных мобильных операторов, госреестрах и данных опроса на выборке из 30 000 домохозяйств.
Благодаря тому, что не придется нанимать 100 000 интервьюеров, которые будут обходить дома с анкетами, и потом обрабатывать эти данные, в бюджете-2020 можно будет потратить на перепись не 3,4 млрд грн, а 1,4 млрд.
По какой методологии будут считать?
По словам Константина Пацеры, который преподает аналитику для топ-менеджеров в LvBS и МИБ, и который консультировал проект, для подсчета будут использовать данные трех крупнейших мобильных операторов: “Киевстар”, “Vodafone Украина” и lifecell. Это — агрегированные анонимные данные.
Для целей исследования операторы используют активности абонентов в вечернее и ночное время (с 20:00 до 07:00), чтобы точнее определять место проживания (для случаев, когда, к примеру, человек работает или учится в одном городе, а живет в другом). Такие данные собирались и уточнялись на протяжении двух месяцев.
Чтобы получить конечный результат о количестве населения, данные операторов скорректируют с учетом того, что у пользователя может быть несколько SIM-карт, что у пенсионеров и детей до 14 лет мобильных может вообще не быть и т.д.
Операторы подчеркивают, что в данных, которые они передавали для проекта, нет персональной информации.
“Это — статистика по количеству пользователей SIM-карт в каждом населенном пункте. Также даем количество пользователей телефонов с двумя SIM-картами, что поможет исключить дублирование количества клиентов разных операторов. Например, в городе N проживает 100 000 наших клиентов, из них 20 000 пользуются двумя SIM-картами”, — сообщили в “Vodafone Украина”.
По словам Константина Пацеры, в госреестрах данные — не всегда актуальные. К примеру, для определения места жительства можно использовать данные о выдаче паспорта, но с тех пор человек мог несколько раз переехать. А данные мобильных операторов показывают, где проживают абоненты, в реальном времени.
Хронологически работа над проектом выглядит так:
- Сбор анонимной информации у мобильных операторов.
- Сбор данных из реестров о детях (РАГСы) и пенсионеров (Пенсионный фонд), т.е. для групп, где меньше проникновение мобильной связи.
- Проведение “калибрующих” соцопрсов. В них можно уточнять, сколько SIM-карт в среднем попадает на одного украинца в разных возрастных группах.
- Обработка данных в математической модели.
Также в декабре в Оболонском районе Киева и Бородянском районе Киевской области Госкомстат проведет пробную перепись: эти данные также можно будет сравнить с полученными в ходе “электронной переписи”.
По словам консультанта, по прогнозам точность полученных данных будет высокой, поскольку такие подходы к оценке численности населения уже использовались в других странах. Кроме того, к точности традиционной переписи тоже есть вопросы: это доступность в домохозяйства и желание жителей участвовать в переписи.
Данные о населении Украины будут готовы к концу года, а обнародуют их в начале 2020 года.