Микроданные переписи населения 2002 г.: двадцатипроцентная выборка по частным домохозяйствам и индивидам

Микроданные переписи населения 2002 г.: двадцатипроцентная выборка по частным домохозяйствам и индивидам

Доступ: Продвинутый подсказка
Дата обновления: 16.12.2021
Теги:
перепись населения, частные домохозяйства

Описание

Двадцатипроцентная выборка с микроданными Всероссийской переписи населения 2002 года по частным домохозяйствам и индивидам, проживающим в этих домохозяйствах.

При формировании выборки использовался метод систематического сэмплинга (Two-Stage Systematic Sampling), а также исключались наблюдения, которые соответствуют временно пребывающим на территории России, лицам из коллективных домохозяйств и лицам, проживающим в населенных пунктах, которые входят в состав ЗАТО. При формировании выборки не учитывались домохозяйства, в которых проживает одиннадцать и более лиц.

В каталоге в открытом режиме доступа размещена десятипроцентная выборка, которую можно скачать себе на устройство.

Единица наблюдения в датасете — член частного домохозяйства. Выборка разделена на восемь частей по федеральным округам. Минимальный уровень географической детализации — муниципальное образование второй ступени (муниципальные районы, городские округа и внутригородские районы). Также отражены крупные города.

В выборке представлены основные показатели из переписных листов: характеристики индивидов (возраст, пол, уровень образования, владение языками, экономическая активность, источники дохода и др.), характеристики домохозяйства (размер, родственные связи) и информация о характеристиках жилища.

Всего набор содержит 28 020 429 наблюдений по 84 атрибутам.

Датасет доступен в продвинутом режиме доступа в формате CSV (кодировка: «UTF-8», разделитель: «;»).

Применили датасет в исследовании?
Укажите его в источниках

cooperation-gov
Цитирование помогает платформе ИНИД становиться популярнее и добавлять больше государственных данных в каталог
подсказка

Характеристики датасета

Использование

Предоставление данных

Формат
CSV

Характеристики набора

Временной период
2002 г.
Количество наблюдений
28020429

Обновления

Размещено
16.12.2021
Обновлено
16.12.2021
Частота обновления
не указано
Дата следующего обновления
не указано

Происхождение

Источники данных
Ответственные за набор данных
Копыток Витовт Константинович, Кузьмина Юлия Викторовна, Тихонов Сергей Владимирович

Применили датасет в исследовании?
Укажите его в источниках

cooperation-gov
Цитирование помогает платформе ИНИД становиться популярнее и добавлять больше государственных данных в каталог
подсказка
Структура набора данных

Информация об атрибутах, их содержании, кодах, с помощью которых закодированы значения атрибутов, а также расшифровки кодов представлены в интерактивном описании (Codebook) этого набора. Также кодбук в формате html добавлен в архив с датасетом (codebook_2002_open_special.html).

Внесенные в набор данных изменения по сравнению с источниками

Для формирования выборки используется систематический сэмплинг (Two-Stage Systematic Sampling).

  • Сначала с помощью систематического сэмплинга отбираются частные домохозяйства, соответствующие выбранному критерию по числу лиц, проживающих в этих домохозяйствах (для двадцатипроцентной выборки — не более десяти лиц в одном домохозяйстве).
  • На втором этапе отбираются все индивиды, проживающие в этих домохозяйствах.

Отбор домохозяйств происходит по следующему алгоритму.

  1. Исключаются наблюдения, которые соответствуют временно пребывающим на территории России и лицам из коллективных домохозяйств (наблюдения, соответствующие домохозяйствам бездомных, сохраняются), а также лицам, проживающим в населенных пунктах, которые входят в состав закрытых административно-территориальных образований (ЗАТО).
  2. К микроданным, исходя из кода ТЕРСОН-МО населенного пункта, в котором проживает домохозяйство, добавляются географические атрибуты: код федерального округа, код региона, код муниципального района/городского округа/внутригородского района.
  3. Уникальная выборка домохозяйств последовательно упорядочивается по следующим атрибутам:
    1. федеральный округ;
    2. регион;
    3. муниципальный район, городской округ, внутригородской район;
    4. тип населенного пункта (город/село);
    5. количество лиц, проживающих в домохозяйстве;
    6. идентификатор домохозяйства.
  4. Выбирается случайное число от 1 до 5. С шагом 5 отбираются номера домохозяйств, включаемых в выборку.

На втором этапе в выборку включаются все индивиды, которые проживают в отобранных домохозяйствах.

Обработанные микроданные Всероссийской переписи населения 2002 года

Владелец источника данных

Федеральная служба государственной статистики

Краткое описание источника данных

Выборка сформирована на основе микроданных Всероссийской переписи населения 2002 года. Эти данные получены Росстатом после обработки индивидуальных переписных листов.

Выборка была передана Росстатом в АНО «ЦПУР» в соответствии с Дополнительным соглашением от 10.12.2021 № 1 к Соглашению об информационном и экспертно-аналитическом взаимодействии между Росстатом и ЦПУР от 11.09.2020 № 8-С

Ссылка на источник данных

Прямая ссылка отсутствует, источник — информационная система ограниченного доступа

Перечень используемых классификаторов

ТЕРСОН-МО (территориальная единица разработки статистики о населении) версии 2010 года, адаптированный для населенных пунктов, существующих на момент проведения переписи в 2002 году.

Понятия, используемые в источнике

Частными домохозяйствами считаются домохозяйства, размещающиеся постоянно в обычных жилых помещениях — квартирах, индивидуальных (одноквартирных) домах, комнатах в общежитиях неквартирного типа, других жилых помещениях и помещениях, приспособленных для жилья. Выборка с микроданными построена по частным домохозяйствам. Домохозяйства бездомных и студенческие общежития также учитывались при формировании выборки.

Коллективными домохозяйствами называются совместно проживающие группы людей, обычно объединенных общей целью, подчиненных общим правилам и совместно питающихся. К коллективным домохозяйствам относятся лица, постоянно живущие в институциональных учреждениях, то есть учреждениях социального и медицинского обслуживания, казармах, местах заключения, религиозных организациях. Наблюдения, соответствующие лицам, проживающим в коллективных домохозяйствах, не учитывались при формировании выборки

Методология и изменения методологии для источника данных

Подробная методология проведения переписи и подведения ее итогов отражена в Методологических пояснениях к микроданным Всероссийской переписи населения 2002 и 2010 гг.

Ссылки на методологию

Методологические пояснения к микроданным Всероссийской переписи населения 2002 и 2010 годов: http://www.gks.ru/free_doc/new_site/perepis2010/croc/Documents/Materials/metod_comments.docx

Похожие датасеты

Смотреть всё

Похожие датасеты

Мероприятия

Смотреть все