Датасет Туту.ру и данные модели Open Data Science

  •  
  •  
  •  
  •  

Датасет

result_export — это то, как люди путешествовали по стране за прошлый апрель (с некоторыми погрешностями). Датасет представляет собой набор векторов от города к городу (первый указанный город — откуда, второй — куда), вид транспорта и число пассажиров, восстановленное до 100%.

Ограничения данных:
автобусы — самая неточная часть датасета. Мы не можем точно знать, сколько людей проехало на автобусах из-за так называемых «серых» перевозчиков, которых мы не поддерживаем на платформе. Но мы постарались восстановить эти данные по известным маршрутам.

В авиа и железной дороге данные куда более точные, но не на 100%. Мы не видим перемещения военных, персонала железной дороги, детские вагоны и прочие необычные билеты. Есть ряд перевозок вроде вертолетных маршрутов между городами Дальнего Востока и винтомоторной авиация Якутии. В авиации наше покрытие рынка очень хорошо по всей европейской части России и падает к востоку (во Владивостоке, Новосибирске и Хабаровске данные наиболее точны в восточной части страны). На железнодорожных билетах погрешность довольно мала.

Если человек ехал в поезде Москва – Петербург и вышел в Твери, то он считается за пассажира Москва – Тверь.

Выводы модели Open Data Sciense

table_full_transport_case — табличный вывод в модели с полным трафиком и слабой самоизоляцией: город, 1000 одновременно инфицированных, 10 тысяч, 100 тысяч, снова меньше 1000 инфицированных. Моделируется 180 дней от старта, старт — 22 марта.

table_10_percent_trafic_case_and_isolation — таблица сценария с ограничением трафика до 10% и большей самоизоляцией.

0326_no_capitals — вывод модели в сценарии с изолированными крупнейшими узлами трафика.

0326_no_flights — вывод модели без перелетов.

0326_with_flights — вывод модели для сценария 1 (все как обычно, без мер).