ПРИМЕНЕНИЕ ОТКРЫТЫХ ДАННЫХ НАЛОГОВОЙ СЛУЖБЫ ДЛЯ ЭКОНОМИКО-ГЕОГРАФИЧЕСКОГО АНАЛИЗА

Авторы

  • Павел Олегович Сёмин Пермский государственный национальный исследовательский университет, г. Пермь, Россия

DOI:

https://doi.org/10.17072/2079-7877-2024-4-54-66

Ключевые слова:

открытые данные, пространственный анализ, геоданные, административные данные, малое и среднее предпринимательство, реестр организаций, Apache Spark, ФНС России

Аннотация

В статье представлена технология создания геокодированного табличного набора данных о субъектахмалого и среднего предпринимательства (МСП) в России на основе открытых данных Федеральной налоговой службы (ФНСРоссии). Получаемый в результате применения технологии набор данных охватывает всю территорию России и содержитинформацию, детализированную до уровня конкретных юридических лиц и индивидуальных предпринимателей. Таблицавключает следующие поля (колонки): ИНН, ОГРН, вид (юридическое лицо, индивидуальный предприниматель, глава крестьянского (фермерского) хозяйства), категория (микропредприятие, малое, среднее предприятие), имя или наименование,место жительства или местонахождение (субъект федерации, район, город, населённый пункт), код основного вида деятельности по ОКВЭД, доходы, расходы, среднесписочная численность работников. Данные о доходах, расходах и численностиработников доступны за каждый год с 2018 г., остальные – за каждый месяц с августа 2016 г. Статья излагает воспроизводимую методику обработки исходных данных и демонстрирует её применение для получения и разведочного анализа сведенийо фирмах в сфере сельского, лесного хозяйства и рыболовства. Дополнением к статье является открытое консольное приложение на языке программирования Python, реализующее описанную технологию. Показано, что открытые данные ФНС России с помощью предложенного алгоритма можно применять для решения ряда аналитических и исследовательских задач вобласти экономической географии, в особенности тех, где требуются дезагрегированные сведения или пространственная детализация до населённых пунктов. Благодаря географическим координатам получаемый набор данных может без дополнительной обработки использоваться для картографирования. Наличие кодов ОКТМО позволяет объединять его с официальными статистическими сведениями.

Биография автора

Павел Олегович Сёмин, Пермский государственный национальный исследовательский университет, г. Пермь, Россия

аспирант

Загрузки

Опубликован

2024-12-30

Как цитировать

Сёмин, П. О. (2024). ПРИМЕНЕНИЕ ОТКРЫТЫХ ДАННЫХ НАЛОГОВОЙ СЛУЖБЫ ДЛЯ ЭКОНОМИКО-ГЕОГРАФИЧЕСКОГО АНАЛИЗА. Географический вестник=Geographical Bulletin, (4(71), 54–66. https://doi.org/10.17072/2079-7877-2024-4-54-66

Выпуск

Раздел

Экономическая, социальная и политическая география