Сведения о налогоплательщике

1 августа ФНС опубликовала в открытом доступе больше информации о компаниях. Планировалось, что это будет сервис, который поможет проверять контрагентов, его будет удобно использовать, всем наступит цифровая экономика. В реальности это оказался не сервис, а какой-то программный код. Но все равно налоговая тайна больше не тайна, данные опубликованы, их можно использовать и узнавать о вас то, что раньше было нельзя.

Вот как это работает и что теперь будет известно всем.

Содержание

Кому нужна информация о чужом бизнесе?

Информация о юрлицах нужна компаниям, которые должны проверять своих контрагентов на порядочность. Например, если производитель закупает сырье у поставщика, он должен этого поставщика проверить: не однодневка ли это, занимается ли он хозяйственной деятельностью, платит ли налоги, есть ли у него имущество и сотрудники, чтобы выполнить контракт. Если этого не сделать, у налоговой могут возникнуть вопросы уже к производителю: а не занимается ли он сам обналом или уходом от налогов?

Екатерина Мирошкина экономист

Раньше контрагентов тоже проверяли: смотрели, кто директор, нет ли судебных споров, где фирма зарегистрирована, действительна ли ее регистрация, сдает ли она отчетность. Теперь ФНС опубликовала большую порцию новых данных. А скоро опубликует еще больше.

Опубликованы данные только о юридических лицах. Эта же информация об индивидуальных предпринимателях в открытом доступе появляться не будет (по крайней мере, пока).

С какой стати ФНС раскрывает налоговую тайну?

Опубликованные сведения — уже давно не налоговая тайна. Их исключили из списка данных, которые знает только налоговая и не может никому рассказывать.

Например, долги по налогам и штрафам — это не налоговая тайна. И сумма страховых взносов, и за что именно вас штрафовали, и налоги, которые вы платите в бюджет. Все это по закону не тайна, а скоро будет опубликовано в открытом доступе.

Перечень исключений, которые не являются налоговой тайной, есть в ст. 102 НК РФ. Вы можете проверять эти данные по своим партнерам, а они — по вам.

Какие данные о компаниях раскрыла налоговая?

С 1 августа 2018 года опубликовали такую информацию.

Сведения о среднесписочной численности. Теперь кто угодно может узнать, сколько человек официально работает в любой компании. Ваш партнер может узнать, сколько человек трудоустроено у вас, а вы можете проверить партнера. Вдруг у него в офисе сидит двадцать человек, причем десять из них принимают от вас деньги, а по отчетам проходит только двое? Кто тогда эти остальные люди?

Или вы работаете с транспортной компанией, но, по данным налоговой, у нее в штате два человека с зарплатой по 10 тысяч рублей. Когда налоговая будет проверять ваш бизнес, она спросит, что это за партнер такой, который выдает вам счета-фактуры на транспортные услуги? И почему вы не задались таким вопросом? Может быть, никаких транспортных услуг и не было вовсе?

На самом деле водители в этой компании могут работать как ИП или физлица по договорам подряда. Но вопрос налоговая все равно задаст. Лучше заранее проверять своих партнеров и работать с теми, кто не вызывает подозрений. Но так же будут проверять и вас. Сведения о среднесписочной численности должны сдавать все компании.

Сведения об участии в консолидированной группе налогоплательщиков. Это касается только крупных компаний с миллиардными оборотами. Консолидированная группа — это когда несколько фирм объединяются и вместе платят налог на прибыль, потому что связаны между собой. Если у вас нет каких-то взаимозависимых фирм, с которыми вы вместе получаете 100 млрд рублей в год, то ничего такого ваши партнеры не узнают.

Сведения о спецрежимах. Можно проверить, применяет ли фирма спецрежим. Это пригодится для проверки выставленного НДС.

Еще эти данные подходят для самопроверки. Например, если вы на спецрежиме и подали в налоговую уведомление еще при регистрации, то в ответ налоговая ничего не выдает. А потом вам присылают запрос: почему это вы не подаете декларацию по НДС.

Выясняется, что налоговая не знает, что вы на спецрежиме, и ждет от вас налоги и отчеты по полной программе. Чтобы разобраться, нужно поднимать документы, хотя второго экземпляра с отметкой может не быть. Еще бывает, что фирму вам регистрирует бухгалтерская компания или юрист. Они говорят, что все зарегистрировали и подали уведомление о переходе на спецрежим. А потом оказывается, что на упрощенку вас не перевели.

Чтобы заранее узнать о спецрежиме, можно использовать открытые данные налоговой. Хотя есть, конечно, и другие способы.

Это все, что рассказала налоговая?

Да, пока это все. Публикация данных в открытом доступе делится на три этапа:

  1. 1 августа — то, что уже опубликовали.
  2. 1 октября — сведения о доходах и расходах из бухгалтерской отчетности, суммы уплаченных налогов и взносов.
  3. 1 декабря — информация о нарушениях, долгах по налогам, пеням и штрафам. А через год опубликуют долги и по страховым взносам.

Значит, надо быстрее оплачивать долги и оформлять сотрудников?

Тут не все так просто. Налоговая раскрывает данные не в реальном времени. По приказу ФНС, данные актуальны не на день публикации или запроса, а на конкретную дату. Причем эта дата может быть даже в прошлом году.

Когда опубликуют Актуальность данных
Спецрежимы 1 августа 2018 года на 31 декабря 2017 года
Среднесписочная численность 1 августа 2018 года за 2017 год
Суммы уплаченных налогов 1 октября 2018 года за 2017 год
Доходы и расходы по бухгалтерской отчетности 1 октября 2018 года за 2017 год
Долги по каждому налогу, пеням и штрафам 1 декабря 2018 года на 31 декабря 2017 года, при условии, что до 1 октября 2018 года долг не погашен
Налоговые нарушения и штрафы за них 1 декабря 2018 года которые вступили в силу в 2017 году, при условии, что до 1 октября 2018 года штраф не оплачен

Спецрежимы Когда опубликуют 1 августа 2018 года Актуальность данных на 31 декабря 2017 года Среднесписочная численность Когда опубликуют 1 августа 2018 года Актуальность данных за 2017 год Суммы уплаченных налогов Когда опубликуют 1 октября 2018 года Актуальность данных за 2017 год Доходы и расходы по бухгалтерской отчетности Когда опубликуют 1 октября 2018 года Актуальность данных за 2017 год Долги по каждому налогу, пеням и штрафам Когда опубликуют 1 декабря 2018 года Актуальность данных на 31 декабря 2017 года, при условии, что до 1 октября 2018 года долг не погашен Налоговые нарушения и штрафы за них Когда опубликуют 1 декабря 2018 года Актуальность данных которые вступили в силу в 2017 году, при условии, что до 1 октября 2018 года штраф не оплачен

Это значит, что 1 октября будут опубликованы только те суммы налогов, которые фирма заплатила за 2017 год. В этот период бизнес мог еще быть маленьким и даже убыточным, доходов по отчетности было немного. А в 2018 году он стал приносить прибыль, и доходов с налогами стало больше. Но данные об этом будут доступны только в 2019 году. Не все партнеры это узнают — могут подумать, что сумма налогов актуальна на дату запроса. В результате может сложиться неправильное мнение о бизнесе.

Со штрафами тоже есть риски. Компания могла получать много штрафов по налогам в 2017 году, а до 1 октября 2018 года все их погасить, чтобы заключить выгодный контракт. Кажется, что фирма добросовестная, а она весь прошлый год не сдавала отчеты и платила налоги с просрочками.

Поэтому этот сервис хоть и полезный, но вряд ли поможет получить на 100% достоверную и актуальную информацию. Его можно использовать, но нужно проверять партнера и по другим каналам. Например, использовать сервисы налоговой с актуальной информацией.

Как пользоваться сервисом?

Пользоваться этим сервисом в том виде, в котором его запустили, невозможно. Потому что это не сервис, а набор нечитаемых данных. Нельзя указать ИНН и узнать, какая среднесписочная численность сотрудников у партнера.

В прошлом году, когда была попытка запустить «Прозрачный бизнес», для него сделали отдельный домен pb.nalog.ru, там был поиск по ИНН. Он поработал несколько часов, а потом его закрыли.

В этот раз все ждали такой же сервис, но что-то пошло не так. Говорят, что так и было задумано, но скачать можно только файл с данными, из которого ничего не понятно. То есть вы не сможете зайти на сайт налоговой, указать там ИНН партнера и узнать, какой у него спецрежим, сколько человек там работает и нет ли долгов по налогам. А конкурент не сможет вот так запросто узнать, какой у вас оборот по балансу за 2017 год.

Это сведения о среднесписочной численности. Если присмотреться, можно понять, что в компании с ИНН 3851000388 работает 1 человек, а с ИНН 7728790244 — 2 человека

Значит, этот сервис не имеет смысла?

Этот сервис имеет смысл, потому что данные вот в таком виде смогут загружать и обрабатывать другие сервисы, которые представляют информацию в понятном виде. Таких сервисов много. Разобраться могут и сами компании, если программист адаптирует код из файлов в читаемый вид. Это несложно, но этим надо заниматься.

Файлы с открытыми данными уже обработали те, кто предлагает услуги по проверке контрагентов. Есть даже боты в Телеграме, которые по ИНН выдают численность сотрудников.

Вот что будет, если отправить такому боту ИНН компаний со снимка экрана, который мы привели выше.

Вот в управляющей компании работает один человек

И тут все сходится с сайтом налоговой

А о физлицах такое будут публиковать?

Пока нет. Но о физлицах можно и сейчас найти много интересной информации. Например, сколько они должны по требованиям приставам, оформлены ли как ИП, в каких фирмах числятся директорами и в каких судах были ответчиками.

А еще можно узнать, в какой компании работает человек, а потом проверить эту компанию: сколько налогов она платит и сколько человек в ней работает. Раньше можно было сказать, что работаешь заместителем руководителя отдела продаж в условном ООО «Ромашка», а теперь любое заинтересованное лицо узнает, что в «Ромашке» числится один человек, отдела продаж там вообще нет, а замещать некого.

Что со всем этим делать?

Если вы физлицо — поднимите бокал за тех, кто в бизнесе.

Если у вас юрлицо, приведите в порядок отчетность и ту информацию, которая может быть известна партнерам. Несмотря на странный вид данных на сайте налоговой, эту информацию через другие сервисы уже сейчас можно получить в один клик.

Заплатите штрафы и недоимки по налогам до 1 октября, чтобы в декабре не испортить себе репутацию.

Оформите сотрудников, если официально у вас их мало. Можно оформить их на полставки, в отчете пока не видна зарплата и взносы. Но тогда приготовьтесь к зарплатной комиссии.

Приготовьтесь отвечать на вопросы партнеров по поводу небольшой численности и долгов по налогам, если они есть. Это не значит, что у вас однодневка. Даже такую ситуацию можно грамотно объяснить. Попросите помочь бухгалтера все правильно оформить.

Подключитесь к любому сервису, который обрабатывает данные налоговой и помогает проверять контрагентов. Используйте его для проверки контрагентов перед сделкой и в ходе сотрудничества. Собирайте и храните отчеты о партнерах, а они будут хранить отчеты о вас. ФНС не просто так публикует эту информацию. При случае она спросит, почему вы этим не пользовались.

Опубликованы сведения о налоговых режимах, применяемых налогоплательщиками

Что можно узнать о контрагенте

Напомним, что пункт 1 статьи 102 НК РФ относит к налоговой тайне любую полученную налоговым органом информацию о налогоплательщике. Однако из данного правила есть исключения. Так, к исключениям относятся: сведения о сумме уплаченных организацией налогов; о суммах недоимки и задолженности по пеням и штрафам; о налоговых правонарушениях, о применяемых налогоплательщиком спецрежимах; о среднесписочной численности работников организации; о суммах доходов и расходов по данным бухгалтерской отчетности организации. (Также см. «Сведения о применяемых налогоплательщиками спецрежимах и об уплате ими налогов будут публиковаться на сайте ФНС»).

Определить вероятность выездной налоговой проверки и получить рекомендации по налоговой нагрузке

Первые данные, которые раньше являлись налоговой тайной, были опубликованы на сайте Федеральной налоговой службы 1 августа. Как уже было сказано выше, в открытом доступе появились сведения о применяемых организациями налоговых режимах (УСН, ЕНВД, ЕСХН, СРП), сведения о среднесписочной численности работников (при этом сведения о среднесписочной численности не раскрываются в отношении крупнейших налогоплательщиков и организаций, информация о деятельности которых отнесена к гостайне), а также данные об участии юрлица в консолидированной группе налогоплательщиков.

Как получить сведения о контрагенте

Впрочем, найти в размещенных ФНС сведениях информацию о конкретном контрагенте крайне сложно. На сайте ФНС дана гиперссылка на архив файлов, состоящий из огромного количества отдельных файлов в формате XML. Соответственно, чтобы найти конкретную организацию, придется поочередно открывать десятки, если не сотни файлов, и изучать их содержимое.
Чтобы понять, какую систему налогообложения применяет ваш контрагент, нужно смотреть на значение признака. Их всего четыре вида: признак применения ЕСХН, признак применения УСН, признак применения ЕНВД, признак применения при выполнении СРП (соглашения о разделе продукции). Если указано значение «1», то именно на этом режиме работает налогоплательщик. Например, «ПризнУСН = «1»» означает, что организация применяет «упрощенку».
Обратите внимание: получить все перечисленные сведения можно в несколько кликов в сервисе «Контур.Фокус». 1 августа, сразу после появления сведений на сайте ФНС разработчики «Фокуса» обработали их и загрузили в сервис. Теперь пользователям «Контур.Фокуса» достаточно ввести в поисковую строку сервиса название или ИНН контрагента, чтобы узнать, какую систему налогообложения он применяет и о какой среднесписочной численности отчитывается в ИФНС. Точно так же можно проверить, какую систему налогообложения применяет ваша собственная организация по данным налоговиков. Ведь нередко случается, что сведения о переходе компании на УСН или ЕНВД «теряются», и инспекция в конце года требует сдавать отчетность и платить налоги по ОСНО.

Подключиться к «Контур.Фокусу» и узнать систему налогообложения

Какие еще сведения об организациях появятся в открытом доступе

Остальные сведения, согласно приказу ФНС России от 30.05.18 № ММВ-7-14/361@, будут размещены позднее. А точнее:

  • с 1 октября — об уплаченных налогах (сборах, взносах), а также о суммах доходов и расходов по данным бухгалтерской (финансовой) отчетности;
  • с 1 декабря — о недоимке по налогам и взносам, долгах по пеням и штрафам, а также о налоговых правонарушениях и мерах ответственности. Важный момент: данные о задолженности, образовавшейся на 31 декабря 2017 года, как и сведения о налоговых правонарушениях организаций, будут опубликованы только в том случае, если недоимка и штрафы не будут уплачены до 1 октября 2018 года;
  • в 2019 году — о суммах недоимки и задолженности по пеням и штрафам по страховым взносам.

Проверить финансовое состояние своей организации и ее контрагентов

Также см. «Сведения о налоговых долгах организаций появятся в открытом доступе с декабря».

Больше не тайна: ФНС раскрыла сведения о налогоплательщиках

С 1 августа 2018 года на сайте ФНС можно найти первую порцию сведений, которые раньше относились к налоговой тайне. А именно сведения:

  • о среднесписочной численности работников организаций;
  • специальных налоговых режимах, применяемых налогоплательщиками;
  • участии организаций в консолидированной группе налогоплательщиков по состоянию на 31 декабря прошлого года.

Пользоваться ими для оценки благонадежности контрагентов сейчас не очень удобно — сведения пока доступны только в виде набора файлов. Будет проще, когда заработает сервис «Прозрачный бизнес».

И ждем новых пополнений:

  • 01.10.2018 налоговики должны выложить информацию об уплаченных налогах и взносах, о суммах доходов и расходов по данным бухгалтерской (финансовой) отчетности;
  • 01.12.2018 — данные о налоговых недоимках, задолженности по пеням и штрафам, а также о налоговых правонарушениях и мерах ответственности за них.

Больше о способах проверки бизнес-партнеров читайте в статьях:

  • «Как и на каких ресурсах проверить сведения о контрагентах?»;
  • «Проверка контрагента на сайте налоговой (нюансы)».

Срок размещения на сайте ФНС информации о налогоплательщиках отложен

Еременко Н. Н., эксперт информационно-справочной системы «Аюдар Инфо»

С 08.08.2017 действует Приказ ФНС России от 27.07.2017 № ММВ-7-14/582@, внесший изменения в документ, устанавливающий сроки, период, порядок формирования и размещения на сайте ФНС сведений, указанных в п. 1.1 ст. 102 НК РФ, а именно в Приказ ФНС России от 29.12.2016 № ММВ-7-14/729@. Изначально предполагалось, что первое размещение на сайте открытых данных о налогоплательщиках состоится 25.07.2017. Ожидаемого не произошло. Высшее налоговое ведомство приняло решение перенести сроки запуска данного интернет-сервиса. Помимо этого, внесены некоторые другие изменения в порядок размещения сведений о налогоплательщиках на сайте ведомства.

В соответствии со ст. 102 НК РФ налоговую тайну составляют любые полученные налоговым органом, органами внутренних дел, следственными органами, органом государственного внебюджетного фонда и таможенным органом сведения о налогоплательщике, плательщике страховых взносов, за исключением ряда сведений, указанных в п. 1 данной статьи.

Пункт 1.1 ст. 102 НК РФ предписывает, что сведения об организации, указанные в пп. 3, а также пп. 7, 9 – 11 названного пункта, должны быть размещены в форме открытых данных на официальном сайте ФНС, за исключением сведений об организации, составляющих государственную тайну. К сведениям, требующим обязательного размещения, относится информация о налогоплательщиках следующего характера:

  • о суммах недоимки и задолженности по пеням и штрафам;

  • о налоговых правонарушениях и мере ответственности за их совершение;

  • о специальных налоговых режимах, применяемых налогоплательщиками;

  • об участии организации в консолидированной группе налогоплательщиков;

  • о среднесписочной численности работников организации за календарный год;

  • об уплаченных организацией в календарном году суммах налогов и сборов (по каждому налогу и сбору) без учета сумм налогов (сборов), уплаченных в связи с ввозом товаров на таможенную территорию Евразийского экономического союза, сумм налогов, уплаченных налоговым агентом, о суммах страховых взносов;

  • о суммах доходов и расходов по данным бухгалтерской (финансовой) отчетности организации за год, предшествующий году размещения указанных сведений в форме открытых данных на сайте ФНС.

Сроки и период размещения сведений, указанных в п. 1.1 ст. 102 НК РФ, порядок их формирования и размещения утверждены Приказом ФНС России от 29.12.2016 № ММВ-7-14/729@ (далее – Порядок). Благодаря поправкам, внесенным в названный документ, изменены сроки размещения информации на сайте ФНС. Так, в соответствии с обновленным Порядком первое размещение на сайте ФНС открытых данных о налогоплательщиках-организациях будет осуществлено 01.06.2018 (п. 7 Порядка).

Также установлено, что вышеназванные сведения находятся в открытом доступе не менее года, следующего за днем их размещения на сайте ФНС (ранее ФНС называла иное ограничение: не менее трех календарных лет, следующих за годом их размещения на сайте).

Для размещения на сайте необходимые сведения формируются в наборы открытых данных. Что касается сведений о суммах недоимки, задолженности по пеням и штрафах, налоговых правонарушениях и мере ответственности за их совершение, а также применяемых спецрежимах, то в набор открытых данных в отношении каждой организации (с указанием ИНН налогоплательщика) включается информация следующего характера (п. 3 Порядка):

Размещаемая информация

Порядок размещения сведений на сегодняшний день

Как планировалось размещать сведения в соответствии с прежними правилами

Наименование налога, сумма недоимки, сумма задолженности по пеням, штрафам – по каждому налогу и сбору, страховым взносам, по которым у организации имеется недоимка и (или) задолженность по пеням и штрафам

Указываются по состоянию на 31 декабря года, предшествующего году их размещения на сайте ФНС, при наличии такой недоимки и задолженности по пеням и штрафам по состоянию на 1 мая года размещения указанных сведений

За календарный месяц, предшествующий месяцу их размещения на сайте

Общая сумма недоимки и задолженности по пеням и штрафам

Сведения о наличии налоговых правонарушений и мерах ответственности за них с указанием общего размера штрафа

Указываются в отношении налоговых правонарушений, решения о привлечении к ответственности за совершение которых вступили в силу в период с 1 января по 31 декабря года, предшествующего году размещения указанных сведений на сайте, при неуплате штрафа в срок до 1 мая года размещения таких сведений

Наименование специального налогового режима, применяемого организацией

Указываются по состоянию на 31 декабря года, предшествующего году их размещения на сайте ФНС

По состоянию на 1-е число месяца их размещения на сайте

Сведения об участии в консолидированной группе налогоплательщиков или о том, что организация является ответственным участником консолидированной группы налогоплательщиков

Указываются по состоянию на 31 декабря года, предшествующего году их размещения на сайте ФНС

Обратите внимание: при первом размещении вышеназванного набора открытых данных в него включаются сведения о налоговых правонарушениях, решения о привлечении к ответственности за совершение которых вступили в силу в период с 02.06.2016 по 31.12.2017, и мерах ответственности за их совершение при неуплате штрафа в срок до 01.05.2018.

Что касается иных сведений, размещаемых в соответствии с п. 1.1 ст. 102 НК РФ на сайте ФНС, то они также формируются в наборы открытых данных в разрезе каждой организации с указанием ее наименования и ИНН. При этом в набор данных включается информация следующего характера (п. 4 Порядка):

Размещаемая информация

Порядок размещения сведений

Сведения о среднесписочной численности работников организации

В календарном году,

предшествующем году размещения сведений на сайте

Наименование и сумма налога, уплаченная организацией по каждому налогу и сбору, по страховым взносам (без учета сумм налогов (сборов), уплаченных в связи с ввозом товаров на таможенную территорию Евразийского экономического союза, сумм налогов, уплаченных налоговым агентом)

Суммы доходов и расходов по данным бухгалтерской (финансовой) отчетности организации

За год, предшествующий году размещения таких сведений

Вышеназванные сведения размещаются на сайте ФНС ежегодно 1 июня.

К сведению: размещение открытых данных, предусмотренных п. 3 и 4 Порядка, должно осуществляться с соблюдением требований Постановления Правительства РФ от 10.07.2013 № 583 «Об обеспечении доступа к общедоступной информации о деятельности государственных органов и органов местного самоуправления в информационно-телекоммуникационной сети «Интернет» в форме открытых данных».

ФНС опубликовала открытые данные о доходах и расходах фирм по бухотчетности

© anekdotov.net

Это сведения, ранее составлявшие налоговую тайну.

ФНС сообщила, что разместила на своем сайте набор открытых данных за 2018 год – сведения о доходах и расходах организаций по данным бухгалтерской отчётности . Сведения о суммах налогов и сборов, уплаченных организациями в 2018 году, планируется опубликовать в течение 10 дней.

Напомним, размещение информации, ранее составлявшей такую тайну, стало возможным благодаря поправкам, внесенным законом от 1 мая 2016 года № 134-ФЗ в статью 102 НК. Открытые данные в виде трех разных наборов теперь публикуются три раза в год. 1 августа прошлого года появились первые сведения о среднесписочной численности работников юрлиц, а в начале августа этого года они обновлены. 1 октября ровно год назад впервые были опубликованы данные о спецрежимах. о суммах уплаченных налогов, о доходах и расходах по данным бухотчетности за 2017 год. Кстати, в этом году данные о спецрежимах попали в августовскую «порцию». 1 декабря обнародованы сведения о недоимках и налоговых правонарушениях юрлиц.

К данным бухотчетности и данным о суммах уплаченных налогов за год обратились более 79 тысяч пользователей, отметила ФНС. Использование таких сведений помогает повысить защищённость при выборе деловых партнеров для бизнеса, считают налоговики.

ФНС раскрыла налоговую информацию бизнеса в формате трудночитаемых открытых данных

Фото: iStock

Федеральная налоговая служба (ФНС) опубликовала данные о налоговой и бухгалтерской отчетностях российского бизнеса, следует из сообщения пресс-службы ФНС. Однако предпринимателям будет сложно воспользоваться этой информацией, считают эксперты.

Налоговики разместили информацию о среднесписочной численности работников юрлиц, специальных налоговых режимах, применяемых компаниями, а также об участии организаций в консолидированной группе налогоплательщиков по состоянию на 31 декабря прошлого года. «Размещение указанной информации поможет налогоплательщикам выбирать надежных партнеров для успешной деятельности», — говорится на сайте ФНС.

Информация размещена в формате открытых данных на сайте ведомства (наборы 74–76). Предпринимателям предлагают скачать архивы с файлами в формате .xml (на момент публикации общее количество скачиваний составило 84). В ФНС не оставили руководства по использованию архивов, а корректно отобразить xml-файлы с помощью браузеров Internet Explorer, Mozilla Firefox и Google Chrome не удалось, отмечает «Фонтанка».

Скриншот сайта ФНС

По мнению руководителя практики налоговых споров «МЭФ-Аудит PKF» Александра Овеснова, неспециалисту невозможно работать с наборами электронных записей, пишет РБК. С ним согласился и глава аналитического департамента «Пепеляев групп» Вадим Зарипов. По его словам, формат открытых данных затрудняет пользование сведениями. Овеснов предположил, что налогоплательщики ожидали увидеть сведения в виде удобного и доступного электронного сервиса (например, в виде «Сведений о государственной регистрации юридических лиц и индивидуальных предпринимателей» или аналогичных сервисов на сайте ФНС).

В конце июля агентство РИА Новости со ссылкой на ФНС сообщало, что с 1 августа информация о налогоплательщиках, которая раньше относилась к налоговой тайне, появится на портале «Прозрачный бизнес» (с начала августа в ФНС планировали размещать данные о среднесписочной численности сотрудников за предыдущий год, специальных налоговых режимах и статистику об участии бизнеса в консолидированной группе налогоплательщиков).

В сообщении управления Федеральной налоговой службы по Калужской области от 19 апреля 2018 года говорится о сервисе «Прозрачный бизнес», который позволит проверять контрагентов. Отметим, что тогда в ФНС заявляли, что на сайте ведомства появятся наборы открытых данных об организациях.

Скриншот сайта ФНС

В пресс-службе центрального аппарата ФНС России Inc. сообщили, что в рамках публикации налоговых данных портал «никогда не подразумевался». Отдельный портал может заработать, если размещенные открытые данные будут востребованы, предположил представитель ФНС. «Подразумевалось, что с 1 числа (августа — Inc.) будут открытые данные», — добавил представитель ведомства. По его словам, ФНС исполняет обязательство по открытым данным.

Представитель ведомства отметил, что размещение данных в опубликованном формате предусмотрено законодательно. «Нас обязывают в таком формате выкладывать, а люди, занимающиеся и интересующиеся, читают без программного обеспечения эти данные, либо пользуются программами, которые можно найти», — сообщил представитель ведомства. Он отметил, что в открытых данных предприниматели могут найти организацию по ИНН.

В июне налоговики перенесли запуск сервиса «Прозрачный бизнес» на 1 августа. Это произошло из-за большого количества обращений со стороны предпринимателей. Бизнес просил у ФНС время на то, чтобы сверить данные.

Планируется, что с 1 октября налоговая служба будет раскрывать данные о бухгалтерской отчетности, сумму уплаченных налогов, страховых взносов и других сборов. А с 1 декабря в картотеке ФНС должны появиться данные о компаниях, которые недоплачивают или вовсе не платят налоги и совершают другие налоговые правонарушения.

ФНС хотела начать публиковать данные о налогоплательщиках еще в июле 2017 года. Однако размещение этой информации отложили, поскольку предприниматели хотели сверить данные о себе.

Подписывайтесь на наш канал в Telegram: @incnews

Парсинг 0.5Tb xml за несколько часов. Поиск организаций в открытых данных реестра субъектов МСП ФНС

По роду деятельности (автоматизация процессов и разработка архитектуры информационных систем) часто приходится сталкиваться с необходимостью написать скрипт и получить результат «здесь и сейчас» для неожиданно «прилетевшей» задачи в ситуации, когда нет возможности оперативно привлечь внешних разработчиков.
Решению одной из таких задач будет посвящен обзор. В какой-то момент появилась необходимость проанализировать на основе открытых данных “Единого реестра субъектов малого и среднего предпринимательства” Федеральной налоговой службы (далее Реестр МСП) динамику по месяцам количества организаций определенного вида деятельности, а именно, сельхозпредприятий. Подходы, которые использовались при ее решении, надеюсь будут полезны тем, кто ищет варианты обработки больших структурированных массивов данных XML, но распространенные средства обработки такие как SelectFromXML, он-лайн XML обработчики по каким-то причинам не подходят. Либо ограничен функционал, либо возникают проблемы при работе с кириллической кодировкой, либо не обеспечивается необходимая производительность, либо ограничены ресурсы «железа». Программисты и профессионалы надеюсь не буду слишком строги к стилю кодирования и выбору способов реализации, а критика и советы в комментариях приветствуются.
Итак задача:
На февраль 2018 года реестр МСП содержит 18 zip-архивов размером 3-4Gb. Каждый архив содержит около 5-6 тыс. файлов, содержащих сведения о примерно 6 миллионах организаций, общим объемом около 40Gb. Из этого массива требуется отобрать только те, которые относятся к сельхозпредприятиям и проанализировать динамику количества этих предприятия по месяцам.
Исходные файлы ФНС размещены
Файлы описания организаций содержат следующую структуру:

<Файл ИдФайл=»VO_RRMSPSV_0000_9965_20170110_01b07970-41d2-4d1e-bb80-0abee395d333″ ВерсФорм=»4.01″ ТипИнф=»РЕЕСТРМСП» КолДок=»900″> <ИдОтпр> <ФИООтв Фамилия=»-» Имя=»-«/> </ИдОтпр> <Документ ИдДок=»4e28d9a9-c004-0f72-a27d-7d677620df81″ ДатаСост=»10.01.2017″ ДатаВклМСП=»01.08.2016″ ВидСубМСП=»2″ КатСубМСП=»1″ ПризНовМСП=»2″> <ИПВклМСП ИННФЛ=»636204531704″> <ФИОИП Фамилия=»МАРЫШЕВ» Имя=»ВЯЧЕСЛАВ» Отчество=»ВЛАДИМИРОВИЧ»/> </ИПВклМСП> <СведМН КодРегион=»63″> <Регион Тип=»ОБЛАСТЬ» Наим=»САМАРСКАЯ»/> <Район Тип=»РАЙОН» Наим=»БЕЗЕНЧУКСКИЙ»/> <НаселПункт Тип=»УЛИЦА» Наим=»СОВЕТСКАЯ»/> </СведМН> <СвОКВЭД> <СвОКВЭДОсн КодОКВЭД=»42.21″ НаимОКВЭД=»Строительство инженерных коммуникаций для водоснабжения и водоотведения, газоснабжения» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»52.21.2″ НаимОКВЭД=»Деятельность вспомогательная, связанная с автомобильным транспортом» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»74.30″ НаимОКВЭД=»Деятельность по письменному и устному переводу» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»63.91″ НаимОКВЭД=»Деятельность информационных агентств» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»95.23″ НаимОКВЭД=»Ремонт обуви и прочих изделий из кожи» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»42.21″ НаимОКВЭД=»Строительство инженерных коммуникаций для водоснабжения и водоотведения, газоснабжения» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»62.09″ НаимОКВЭД=»Деятельность, связанная с использованием вычислительной техники и информационных технологий, прочая» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»25.72″ НаимОКВЭД=»Производство замков и петель» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»47.54″ НаимОКВЭД=»Торговля розничная бытовыми электротоварами в специализированных магазинах» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»42.22.1″ НаимОКВЭД=»Строительство междугородних линий электропередачи и связи» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»47.99″ НаимОКВЭД=»Торговля розничная прочая вне магазинов, палаток, рынков» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»82.19″ НаимОКВЭД=»Деятельность по фотокопированию и подготовке документов и прочая специализированная вспомогательная деятельность по обеспечению деятельности офиса» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»49.32″ НаимОКВЭД=»Деятельность такси» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»42.22.2″ НаимОКВЭД=»Строительство местных линий электропередачи и связи» ВерсОКВЭД=»2014″/> </СвОКВЭД> </Документ> <Документ ИдДок=»7a14e521-68a3-9514-7540-04cb03799ac4″ ДатаСост=»10.01.2017″ ДатаВклМСП=»10.09.2016″ ВидСубМСП=»2″ КатСубМСП=»1″ ПризНовМСП=»1″> <ИПВклМСП ИННФЛ=»636204538611″> <ФИОИП Фамилия=»РУЧКАНОВА» Имя=»ЛЮДМИЛА» Отчество=»АЛЕКСЕЕВНА»/> </ИПВклМСП> <СведМН КодРегион=»63″> <Регион Тип=»ОБЛАСТЬ» Наим=»САМАРСКАЯ»/> <Район Тип=»РАЙОН» Наим=»БЕЗЕНЧУКСКИЙ»/> <НаселПункт Тип=»УЛИЦА» Наим=»МОЛОДЕЖНАЯ»/> </СведМН> <СвОКВЭД> <СвОКВЭДОсн КодОКВЭД=»47.11″ НаимОКВЭД=»Торговля розничная преимущественно пищевыми продуктами, включая напитки, и табачными изделиями в неспециализированных магазинах» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»47.25.12″ НаимОКВЭД=»Торговля розничная пивом в специализированных магазинах» ВерсОКВЭД=»2014″/> </СвОКВЭД> </Документ> <Документ ИдДок=»ad8636bb-78c3-763c-52d2-4fe5a93e9a8f» ДатаСост=»10.01.2017″ ДатаВклМСП=»10.09.2016″ ВидСубМСП=»2″ КатСубМСП=»1″ ПризНовМСП=»1″> <ИПВклМСП ИННФЛ=»636204540794″> <ФИОИП Фамилия=»МИЧУРОВА» Имя=»ТАТЬЯНА» Отчество=»АЛЕКСАНДРОВНА»/> </ИПВклМСП> <СведМН КодРегион=»63″> <Регион Тип=»ОБЛАСТЬ» Наим=»САМАРСКАЯ»/> <Город Тип=»ГОРОД» Наим=»САМАРА»/> <НаселПункт Тип=»УЛИЦА» Наим=»ВЛАДИМИРСКАЯ»/> </СведМН> <СвОКВЭД> <СвОКВЭДОсн КодОКВЭД=»47.41″ НаимОКВЭД=»Торговля розничная компьютерами, периферийными устройствами к ним и программным обеспечением в специализированных магазинах» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»49.20.9″ НаимОКВЭД=»Перевозка прочих грузов» ВерсОКВЭД=»2014″/> <СвОКВЭДДоп КодОКВЭД=»47.78″ НаимОКВЭД=»Торговля розничная прочая в специализированных магазинах» ВерсОКВЭД=»2014″/> </СвОКВЭД> </Документ>

Обработка будет выполняться в оболочке bash на виртуальной Linux машине с 2-я ядрами, 8 Gb оперативной памяти и 100Gb дискового пространства:
%Cpu0 : 6.1 us, 2.0 sy, 0.0 ni, 91.8 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st %Cpu1 : 54.1 us, 11.2 sy, 0.0 ni, 6.1 id, 28.6 wa, 0.0 hi, 0.0 si, 0.0 st KiB Mem : 8258760 total, 64684 free, 5645284 used, 2548792 buff/cache KiB Swap: 2129916 total, 1157076 free, 972840 used. 2271428 avail Mem
Скрипт должен обеспечить скачивание zip-архивов с сайта ФНС, переименование файлов для удобства последующей обработки, распаковку, обработку парсером (используется xmlstarlet) для поиска организаций, соответствующих заданных в скрипте критериям, очистку диска от временных файлов (в процессе обработки исходные файлы занимают десятки Gb), сохранение в формате, удобном для последующего использования в системах анализа данных и импорта в программы для работы с электронными таблицами (в нашем случае будет использоваться формат csv).
Скачивание и переименование выполним с использованием wget. Чтобы скрипт понимал, какие архивы с РМСП ему обрабатывать, создадим файл, под условным названием «полетное задание», где укажем, какие файлы обрабатывать и как именовать полученный результат.
Конфигурационный файл имеет следующую структуру:
Ссылка на файл, название результирующего файла, отметка о необходимости обработки ‘*’ (для случаев, если возникает необходимость загрузить не весь набор файлов).
rmspfiles.txt
http://data.nalog.ru/opendata/7707329152-rsmp/data-08262016-structure-08012016.zip;20160826;* http://data.nalog.ru/opendata/7707329152-rsmp/data-09102016-structure-08012016.zip;20160910;* http://data.nalog.ru/opendata/7707329152-rsmp/data-10102016-structure-08012016.zip;20161010;* http://data.nalog.ru/opendata/7707329152-rsmp/data-11252016-structure-08012016.zip;20161125;* http://data.nalog.ru/opendata/7707329152-rsmp/data-12122016-structure-08012016.zip;20161212;* http://data.nalog.ru/opendata/7707329152-rsmp/data-01112017-structure-08012016.zip;20170111;* http://data.nalog.ru/opendata/7707329152-rsmp/data-02102017-structure-08012016.zip;20170212;* http://data.nalog.ru/opendata/7707329152-rsmp/data-03102017-structure-08012016.zip;20170310;* http://data.nalog.ru/opendata/7707329152-rsmp/data-04102017-structure-08012016.zip;20170410;* http://data.nalog.ru/opendata/7707329152-rsmp/data-05102017-structure-08012016.zip;20170510 http://data.nalog.ru/opendata/7707329152-rsmp/data-11062017-structure-08012016.zip;20170611 http://data.nalog.ru/opendata/7707329152-rsmp/data-07102017-structure-08012016.zip;20170710 http://data.nalog.ru/opendata/7707329152-rsmp/data-08102017-structure-08012016.zip;20170810 http://data.nalog.ru/opendata/7707329152-rsmp/data-09112017-structure-08012016.zip;20170911 http://data.nalog.ru/opendata/7707329152-rsmp/data-10102017-structure-08012016.zip;20171010 http://data.nalog.ru/opendata/7707329152-rsmp/data-11102017-structure-08012016.zip;20171110 http://data.nalog.ru/opendata/7707329152-rsmp/data-12112017-structure-08012016.zip;20171211 http://data.nalog.ru/opendata/7707329152-rsmp/data-01112018-structure-08012016.zip;20180111
По завершению скачивания с переименованием запускается цикл по полученным архивам: unzip, поиск в XML нужных записей, запись результата в csv файлы. Перед обработкой следующего архива очищается место на диске от исходных файлов.
Не смотря на простоту задачи, скрипт пройдя этапы отладки и совершенствования получился достаточно замысловатым.
Итак, что получилось в итоге:
Загрузчик файлов:
#!/bin/bash # **************** batch downloader from rmsp v 1.0. 2018-02-15 *********************** start=`date +%s` dt=`date` logFn=’output_wget.log’ printf «********************************************************************************************\n» | tee tmp_output.log echo «* ${dt} wget *» | tee -a tmp_output.log printf «*********************************************************************************************\n\n» | tee -a tmp_output.log # download loop считываем файлы по ссылкам из “полетного задания”, переименовываем и сохраняем в папке zip2 IFS=’;’ while read line; do read -r -a array <<< «$line» echo «${array} | ${array} » # wget ${array} -O ./zip2/${array}.zip | tee -a tmp_output.log 2>&1 # get filesize of external — этот параметр пишется в лог для оценки производительности обработчика FILESIZE=$(wget —spider ${array} 2>&1 | awk ‘/Length/ {print $2}’) # — c — continue, 3>&1 — размер файла wget -c ${array} -O ./zip2/${array}.zip 3>&1 | tee -a tmp_output.log end=`date +%s`; runtime=$((end-start)); dt=`date ‘+%Y-%m-%d %H:%M:%S’` printf «%s %4d sec %10d %s ${dt} $runtime $FILESIZE ${array} ${array} | tee -a tmp_output.log done < rmspfiles.txt echo «» | tee -a tmp_output.log //записываем в файл для последующей отладки результаты работы cat tmp_output.log $logFn > tmp_output2.log; mv tmp_output2.log $logFn
2. Парсер
#!/bin/bash # 2018-02-16 Версия 1.1 Добавлены столбцы в итоговый файл # 2018-02-19 Добавлены кавычки для предотвращение переноса строки в номерах лицензий в excell # 2018-02-19 Добавлен sed для замены /n -> ; @@; -> \n # удалены для лицензий кавычки # задаем разделитель колонок для итоговых файлов (в нашем случае табуляция) sp=’ ‘ # Задаем параметры обработчика, пути для исходных и результирующих файлов, названия файлов для журналов обработки. path_src=»./src» path_zip=»./zip2″ path_res=»./res» t1=»p1.log» t2=»p2.log» t3=»parsz.log» fnExt=»»$1 start=`date +%s` dt=`date ‘+%Y-%m-%d %H:%M:%S’` # Результат выводим в лог echo «**** | parsz | ${dt} unzip from: $path_zip/$fnExt.zip to $path_src/$fnExt» # | tee $t1 # -q quiet mode (-qq => quieter) # -o overwrite files WITHOUT prompting # -j junk paths. The archive’s directory structure is not recreated; all files are deposited in the extraction directory (by default, the current one). unzip -j -q -o $path_zip/$fnExt.zip -d $path_src/$fnExt/ end=`date +%s` runtime=$((end-start)) MOREF1=`ls «$path_src/$fnExt/» | wc -l` echo » ${dt}, $runtime sec | files from: $path_src/$fnExt/ to $path_res/$fnExt.csv» | tee -a $t1 echo «ИНН$spНаименование МСП\ $spКатегория МСП\ $spВид МСП\ $spВид Деятельности (Основной ОКВЭД)\ $spРегионНаим\ $spРайонТип\ $spРайонНаим\ $spгородТип\ $spгородНаим\ $spНаселПунктТип\ $spНаселПунктНаим\ $spДатаСост\ $spДатаВключения\ $spНомерЛицензии\ $spФайлИмя@@\ » > $path_res/res-$fnExt.csv /usr/bin/find $path_src/$fnExt/ -name «*.xml» | xargs -n1 xmlstarlet sel -T -f -t -m «//Документ/ОргВклМСП» \ -v «@ИННЮЛ» -o «$sp» \ -v «@НаимОрг» -o «$sp» \ —if «../@КатСубМСП=1» -o «Микро» —else —if «../@КатСубМСП=2» -o «Малые» —else -o «Средние» —break —break -o «$sp» \ —if «../@ВидСубМСП = 1» -o «Организация» —else -o «ИП» —break -o «$sp» \ -v «../СвОКВЭД/СвОКВЭДОсн/@НаимОКВЭД» -o «$sp» \ -v «../СведМН/Регион/@Наим» -o «$sp» \ -v «../СведМН/Район/@Тип» -o «$sp» \ -v «../СведМН/Район/@Наим» -o «$sp» \ -v «../СведМН/Город/@Тип» -o «$sp» \ -v «../СведМН/Город/@Наим» -o «$sp» \ -v «../СведМН/НаселПункт/@Тип» -o «$sp» \ -v «../СведМН/НаселПункт/@Наим» -o «$sp» \ -v «../@ДатаСост» -o «$sp» \ -v «../@ДатаВклМСП» -o «$sp» \ -v «../СвЛиценз/@НомЛиценз» -o «$sp» \ -o «$fnExt@@» \ -n >> $path_res/res-$fnExt.csv end=`date +%s` runtime=$((end-start)) dt=`date ‘+%Y-%m-%d %H:%M:%S’` echo » ${dt}, $runtime sec :parsing» | tee -a $t1 # Удаляем переносы строк в значениях за исключением последних в строках sed -e ‘:a;N;$!ba;s/\n/;/g’ $path_res/res-$fnExt.csv > $path_res/sed_tmp.csv sed -e ‘s/@@;/\n/g’ $path_res/sed_tmp.csv > $path_res/res-$fnExt.csv end=`date +%s` runtime=$((end-start)) dt=`date ‘+%Y-%m-%d %H:%M:%S’` echo » ${dt}, $runtime sec :sed » | tee -a $t1 cat $t1 $t3 > $t2; mv $t2 $t3 # удаляем исходные XML файлы rm -rf $path_src/$fnExt/* echo «Удаляем исходные XML файлы rm -rf $path_src/$fnExt/*» rm $t1
Весь массив данных из 18 файлов общим объемом в сотни Gb обрабатывается около 6 часов.
Процесс обработки записывается в файлы для последующей отладки и оптимизации скрипта.
После импорта в MS Excel получаем следующий результат:

Сведения о налогоплательщике

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *