Адресный классификатор: объединённые географические данные ФИАС и Почты России с детализацией до дома
Лицензия:  CC BY-SA
2570
160

Адресный классификатор: объединённые географические данные ФИАС и Почты России с детализацией до дома

Доступ: Открытый подсказка
Дата обновления: 14.10.2021
Теги:
недвижимость, географические объекты, дома

Описание

Набор содержит объединённые из двух источников (ФИАС и обработанные порталом kodifikant.ru данные Почты России) географические данные РФ с детализацией до дома.

Цель датасета — создание единого максимально полного классификатора географических данных, с помощью которого можно было бы осуществлять поиск и привязку географических объектов к официальным стандартизированным геоданным. Для осуществления этой привязки можно использовать библиотеку, доступную по ссылке.

Единица наблюдения в датасете — адрес объекта недвижимости. Данные для каждого наблюдения приведены по следующим атрибутам: федеральный округ, субъект РФ, муниципальное образование, населенный пункт, локация, улица, дом.

Набор данных охватывает все регионы Российской Федерации. Всего набор содержит 25 569 964 наблюдений по 11 атрибутам.

Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»).

Применили датасет в исследовании?
Укажите его в источниках

cooperation-gov
Цитирование помогает платформе ИНИД становиться популярнее и добавлять больше государственных данных в каталог
подсказка

Характеристики датасета

Использование

Лицензия
Доступ подсказка
Открытый

Предоставление данных

Формат
CSV

Характеристики набора

Временной период
Актуален на 14.10.2021
Количество наблюдений
25569964

Обновления

Размещено
14.10.2021
Обновлено
14.10.2021
Частота обновления
Ежеквартально
Дата следующего обновления
не указано

Происхождение

Источники данных
Ответственные за набор данных
Валько Данила Валерьевич, Глонин Константин Вячеславович, Давыдов Николай Юрьевич

Применили датасет в исследовании?
Укажите его в источниках

cooperation-gov
Цитирование помогает платформе ИНИД становиться популярнее и добавлять больше государственных данных в каталог
подсказка
Структура набора данных
Адресный классификатор: объединённые географические данные ФИАС и Почты России с детализацией до дома (administrative_addresses)
arrow-down-grey arrow-top-green
Атрибут Описание Количество пропусков (NaN) (шт/%) Единица измерения ОКЕИ Формат
region Уровень федерального округа 0 cat
municipality Уровень муниципального округа 10419174 cat
municipality_type Тип уровня муниципального округа 10419174 cat
settlement Уровень населенного пункта 959308 cat
settlement_type Тип уровня населенного пункта 959308 cat
location Уровень локации 19834616 cat
location_type Тип уровня локации 19834616 cat
street Уровень улицы 4268982 cat
street_type Тип уровня улицы 4268982 cat
house Уровень дома 5 cat
source Код источника данных об адресе 1 - ФИАС 2 - Почта России 0 integer

Внесенные в набор данных изменения по сравнению с источниками

  • ФИАС предусматривает 10 адресных уровней, их свертка в компактную структуру датасета производилась по схеме:
    • 1 – регион → region
    • 3 – район → municipality
    • 35 – уровень городских и сельских поселений (фактически не задействован)
    • 4 – город → settlement
    • 6 – населенный пункт → settlement
    • 65 – планировочная структура и др. территории (ГСК, СНТ, лагери отдыха и т.п.) -> location
    • 7 – улицы → street
    • 75, 8, 9 (не задействованы)

Для каждого уровня создается колонка с типом адресного элемента *_type (например, settlement_type = деревня, поселок, …).

Объекты на уровнях 3 (за исключением районов), 4, 6 раскладываются начиная с размещения поселения нижнего уровня в settlement и затем вверх по иерархии (например, поселения в г. Москва и городские округа указанные, как города размещаются в municipality, если в settlement уже указана деревня или посёлок).

Адреса Почты России извлечены html-парсером и перенесены в том виде, в котором они представлены в первоисточнике.

Источник 1. Федеральная информационная адресная система (ФИАС)

Владелец источника данных

Федеральная налоговая служба (ФНС России)

Краткое описание источника данных

Федеральная государственная информационная система, обеспечивающая формирование, ведение и использование государственного адресного реестра (https://fias.nalog.ru/)

Данные представлены в DBF и XML формате.

Ссылка на источник данных

https://fias.nalog.ru/DataArchive

Методология и изменения методологии для источника данных

Формат сведений об адресах, содержащихся в Государственном адресном реестре утвержден Приказом ФНС России от 13.05.2020 № ЕД-7-6/329@ https://fias.nalog.ru/docs/%D0%9F-%D0%983490.doc  

Ссылки на методологию

Документация и нормативные акты по ФИАС https://fias.nalog.ru/FiasInfo

Источник 2. Почтовые индексы и адреса России

Владелец источника данных

Почта России, Кодификант.ру

Краткое описание источника данных

Публичный клон адресных данных Почты России в html-структуре

Ссылка на источник данных

https://index.kodifikant.ru/ru/