09.09.2021

Данные Росавтодора для ML-обучения доступны в каталоге ИНИД

Сегодня на платформе появился набор данных о трафике, ремонтных работах и аварийно-опасных участках, на трассах федерального значения М-8 и Р-21. Он доступен для Machine learning-инженеров в соответствующем режиме доступа. Дата-сет предоставлен Росавтодором с включением информации из системы ГЛОНАСС БДД. 

Дата-сет «Трафик, аварийность и ремонтные работы на участках дорог М-8 (Москва-Северодвинск) и Р-21 (Санкт-Петербург – Борисоглебск)» содержит три плоских таблицы в формате csv: traffic, crash_parts, repair. В файле traffic записаны данные об интенсивности движения на трассах М-8 и Р-21 с первого января 2016 года по четырнадцатое апреля 2021 года, в таблице — 7 368 510 строк по 14 атрибутам. Crash_parts содержит данные об аварийно-опасных участках трасс с 2015 по 2020 годы и состоит из 2 862 строк по 8 атрибутам. Repair — набор о ремонтных работах, содержит 377 строк по 12 атрибутам. 

Набор данных обработан специалистами для третьего трека хакатона Emergency DataHack, в котором участники старались предсказать вероятность ДТП — решения участников хакатона  можно увидеть здесь. В таблице traffic.csv заменили почти 121 тысячу значений трафика и около  64 тысяч значений средней скорости заменены на расчётные.

Читайте также

Загрузить еще