nils.ackermann.gmail.com / Depositphotos.com

Обеспечение благоприятных условий для сбора, обработки и хранения данных – одна из задач национальной программы «Цифровая экономика РФ». Что неудивительно, ведь количество формируемых данных постоянно растет: по экспертным оценкам, к 2025 году общемировой объем данных может достигнуть 163-175 зеттабайт (в 2018 году этот показатель составил 33 ЗБ), а их анализ становится инструментом для принятия эффективных решений в области государственного управления, повышения качества оказываемых государственных услуг, корректировки производственных и бизнес-процессов. Отталкиваясь от мнений представителей профессионального сообщества, посмотрим, каким должно быть регулирование обработки данных для достижения этих целей и какие отрасли уже готовы к цифровой трансформации.

 

Правовое регулирование

Уже не один год обработка больших данных считается одним из важнейших направлений в области информационных технологий, непосредственно влияющих на глобальную технологическую конкурентоспособность (об этом прямо говорится, в частности, в Стратегии развития отрасли информационных технологий в Российской Федерации на 2014-2020 годы и на перспективу до 2025 года). Причем положения о необходимости развития и применения технологий Big data содержатся не только в стратегических, но и в отраслевых документах. Так, обработка больших данных отнесена к основным сквозным технологиям работы с данными в транспортном комплексе в соответствии с комплексным планом модернизации и расширения магистральной инфраструктуры на период до 2024 года, порядок отражения расходов на внедрение технологии Big data в сферу осуществления учетно-регистрационных действий предусмотрен Порядком формирования и применения кодов бюджетной классификации РФ. Кроме того, в методических рекомендациях по переходу государственных компаний на преимущественное использование отечественного программного обеспечения определены целевые показатели по разработке на основе такого ПО систем обработки больших данных.

Однако законодательного определения самого понятия «большие данные» пока нет. Исходя из нормативного понимания обработки больших объемов данных (подп. «к» п. 4 Стратегии развития информационного общества в Российской Федерации на 2017-2030 годы) можно говорить о том, что большие данные представляют собой структурированную и неструктурированную информацию из большого количества различных, в том числе разрозненных или слабосвязанных, источников в объемах, которые невозможно обработать вручную за разумное время. Под структурированными данными, как отмечают представители экспертного сообщества, понимается упорядоченная информация, содержащаяся в базах данных, информационных системах и т. д. А неструктурированными данными являются информация,содержащаяся в аудио- и видеозаписях, включенный в графические изображения текст, то есть данные в форматах, затрудняющих поиск конкретных сведений в них.

Какие биометрические данные признаются персональными, узнайте из материала «Особенности обработки биометрических персональных данных» Энциклопедии решений интернет-версии системы ГАРАНТ. Получите бесплатный доступ на 3 дня!

Получить доступ

Кроме того, эксперты, в том числе при обсуждении необходимого для перехода к цифровой экономике нормативного регулирования, используют еще и такие понятия, как большие пользовательские данные (подразумевается совокупность информации, формируемой при использовании различных онлайн-сервисов, приложений, социальных сетей) и Интернет вещей (данные приборов автоматического измерения показателей, устройств, фиксирующих сведения о перемещениях объекта, и др.). Тем не менее общепризнанные определения этих понятий также отсутствуют. Стоит отметить, что попытка закрепить в законе определение больших пользовательских данных – как информации о физических лицах из различных источников, не содержащей персональных данных и не позволяющей без использования дополнительных данных или дополнительной обработки определить конкретное лицо, – и правила их обработки предпринималась депутатами минувшей осенью, но успехом не увенчалась – соответствующий законопроект был возвращен авторам. И все же, как сообщила в ходе состоявшегося 14 марта семинара-совещания на тему: «Правовое регулирование больших данных» первый заместитель председателя Комитета Совета Федерации по конституционному законодательству и государственному строительству Людмила Бокова, без внесения в законодательство указанных понятий не обойтись, в том числе из-за необходимости установить, как они соотносятся с персональными данными.

МНЕНИЕ

Юрий Контемиров, начальник Управления по защите прав субъектов персональных данных Роскомнадзора:

«Большие пользовательские данные подразумевают конкретного субъекта персональных данных. Если мы говорим о регулировании больших данных как совокупности, которая обладает групповыми характеристиками, присущими различным субъектам персональных данных, и используется для социального прогнозирования, планирования и т. д. – это одна ситуация, но когда мы говорим о совокупности данных для анализа платежеспособности конкретного физического лица, – совсем другая.

Современные бизнес-модели построены на использовании данных, но если мы посмотрим, как регулируются вопросы обработки данных на примере американских корпораций, например метрических программ Google, то увидим следующее. Программа считывает, какие страницы пользователи смотрели, чем интересовались, и этот объем данных передается в общую аналитику, формируется вывод о том, что на такой-то территории люди интересуются тем-то. В лицензионных условиях использования программ записано, что необходимо уведомить субъекта о том, что данные собираются, получить его согласие, в том числе на хранение данных в США, предоставить документ, с которым человек должен ознакомиться и понять, как его данные собираются, где используются и т. д.

Мы спрашивали у зарубежных коллег, как большие данные регулируются в европейских странах, в Азии. И коллеги говорят, что все рассматривается через призму законодательства о персональных данных, потому что носителем всей информации является человек. Кроме того, по мнению коллег из Европы, те разработки, которые есть у Amazon, Teradata и др., позволяют даже обезличенные базы сопоставить и вывести цифровой профиль конкретного физического лица. Поэтому при подготовке законопроектов нельзя допускать явного перекоса в сторону интересов бизнеса. Должны быть предусмотрены формы участия конкретного субъекта в принятии решений о предоставлении тех или иных сведений, чтобы он мог управлять использованием этих данных».

Оба обозначенных варианта: закрепление правил взаимодействия пользователей и обрабатывающих данные компаний в пользовательских соглашениях и жесткое законодательное регулирование путем приравнивания к персональным данным – имеют свои преимущества и недостатки, учет которых при выборе подхода к регулированию больших данных в России, по мнению руководителя по правовым вопросам и комплаенс Ассоциации участников рынка больших данных Никиты Данилова, может обеспечить конкурентоспособность страны на мировом рынке. Так, убытки компаний, занимающихся обработкой данных, в связи с существенными ограничениями для обработки и хранения данных на территории Евросоюза, введенными Общим Регламентом о защите персональных данных (GDPR), – по данным Deutsche Telecom, телеком-отрасль, соблюдая установленные законодательные требования, ежедневно теряет €100 млн – и высокая стоимость обработки и хранения данных в странах Азии создают предпосылки для создания в России виртуальной особой экономической зоны, предоставляющей возможности для хранения и обработки данных на территории страны не только российским, но и зарубежным, в том числе транснациональным, компаниям, уверен эксперт.

Не стоит забывать и о том, что компании собирают и используют пользовательские данные в основном для того, чтобы создавать более удобные для клиентов сервисы. Как подчеркнул директор по направлению «Нормативное регулирование» АНО «Цифровая экономика» Дмитрий Тер-Степанов, граждане, как правило, не против обработки своих данных с такой целью, поэтому стоит подумать о перенесении акцента с защиты данных конкретного лица как таковой на предоставление ему права решать, могут ли они передаваться далее и в каком объеме, и разработку механизмов защиты этого права.

Кстати, именно такой принцип – использования данных лица с его согласия – будет положен в основу создания инфраструктуры «Цифровой профиль» – платформы, обеспечивающей обмен информацией между государством, гражданами и организациями (ее запуск также предусмотрен национальной программой «Цифровая экономика РФ»). Разрабатываемый проект концепции цифрового профиля согласно размещенным на официальном сайте АНО «Цифровая экономика» данным предполагает возможность предоставления государственным и коммерческим организациям доступа к содержащимся в государственных информационных системах сведениям о гражданине при получении его согласия. В качестве пилотного проекта предлагается реализовать доступ банков к данным ГИС для формирования заявок на получение кредита и проведения оценки кредитоспособности соответствующих лиц в онлайн-режиме – потенциальные заемщики будут давать согласие на осуществление этих действий в специальном приложении. Планируется, что, помимо совокупности данных из государственных информационных систем, в цифровом профиле гражданина будут содержаться сведения о так называемых цифровых согласиях: перечни персональных данных, доступ к которым он разрешил при получении каких-либо услуг.

При этом содержимое самих информационных систем – как зарегистрированных в качестве ГИС (количество которых на сегодняшний день составляет более 300), так и не зарегистрированных, но используемых федеральными и региональными органами власти – будет включено в Национальную систему управления данными (НСУД), проект концепции которой также разрабатывается в настоящее время. Предполагается, что НСУД будет интегрирована с инфраструктурой электронного правительства, государственными справочниками и классификаторами, что позволит обеспечить актуальность и избежать дублирования информации, содержащейся в разных базах. Не исключено, что контролировать качество содержащихся в НСУД данных смогут и непосредственно граждане и организации, но механизм такого контроля пока не разработан.

 

Перспективные направления использования больших данные

Согласно проведенному в конце прошлого года компаниями IDC и Seagate Technology исследованию «The Digitization of the World – From Edge to Core» (Глобальная цифровизация: от периферии к центру) наиболее подготовленной к цифровой трансформации, предполагающей, помимо прочего, непосредственное использование технологий анализа данных для принятия решений, является промышленность. Так называемый промышленный Интернет – данные датчиков, установленных на оборудовании, – позволяет отслеживать состояние, своевременно производить ремонт или замену этого оборудования и в принципе более эффективно его использовать. Анализ данных сенсоров, встраиваемых в готовую продукцию, в режиме реального времени способствует формированию нового подхода к обслуживанию покупателей – производитель, сделав вывод о вероятной предстоящей поломке, может сообщить об этом потребителю и даже заблаговременно отправить ему подлежащие замене детали (в рамках гарантийного срока), рассказал руководитель рабочей группы индустриального Интернета Ассоциации Интернета вещей Максим Рябчицкий в ходе прошедшей 12 марта конференции «Управление данными: основа цифровой трансформации».

В банковской сфере анализ данных применяется для выявления признаков потенциально мошеннических операций, улучшения существующих банковских продуктов и оценки востребованности новых предложений. Сократить расходы кредитных организаций на такие исследования, как отметил директор по работе с корпоративными заказчиками компании YADRO Сергей Тонкоглаз, поможет создание ими совместно с производителями аппаратно-программного обеспечения инновационных лабораторий. Работа на такой площадке предоставит банку возможность прогнозировать результаты выведения на рынок новых предложений, а разработчикам – создавать, например, новые аппаратно-программные платформы, подходящие именно под бизнес-задачи кредитной организации.

Перспективным представляется использование больших данных и в медицине. В частности, удаленный мониторинг состояния пациента с помощью данных диагностических приборов имеет существенное значение для развития телемедицины. Причем, по словам заведующего лабораторией электронного здравоохранения Института цифровой медицины Первого МГМУ имени И.М. Сеченова Игоря Шадёркина, использоваться для этого могут не только медицинские, но и изначально бытовые приборы, к примеру фитнес-трекеры. Уже сейчас они позволяют отслеживать, к примеру, вариабельность сердечного ритма (на основе данных о пульсе), режим сна и количество так называемых ночных вставаний, и анализ этих сведений может способствовать предотвращению проблем со здоровьем. Сбор и оценка данных из различных источников, в том числе социальных сетей (увлекается ли человек спортом или ведет пассивный образ жизни, курит ли, работает в ночное время и т. д.) в принципе имеет важное значение для превентивной медицины, уверен эксперт, отмечая, правда, что пока у медицинских организаций нет ресурсов для обработки такого значительного объема информации.

Кроме того, анализ данных имеет важное значение для выявления врачебных ошибок и «пропущенных» заболеваний, сообщил заместитель директора по развитию бизнеса компании «Комплексные медицинские информационные системы», член Экспертного совета Минздрава России по вопросам использования информационно-коммуникационных технологий в системе здравоохранения Александр Гусев. Но для того чтобы такое его использование стало возможным, необходимо привести все формируемые в медицинских организациях данные в форматы, пригодные для автоматизированной обработки. Несмотря на то что внедрение единой государственной информационной системы в сфере здравоохранения и электронных медицинских карт обеспечило перевод большой части накопленной медицинскими учреждениями информации в цифровой формат, эти данные между собой, как правило, не связаны: нужно соотнести истории болезни, результаты лабораторных исследований, КТ-изображения и т. д., что очень затратно. «Пришло наконец понимание, что цифровая медицина как явление – абсолютно не то же самое, что информатизация здравоохранения. Там мы не меняли диагностический процесс, просто переводили все в электронный вид, поэтому результаты не полностью пригодны для цифровой медицины. Скорее всего, по мере создания истинно цифровых сервисов, той трансформации, о которой сейчас идет речь, будут создаваться более качественные данные, которые позволят нам говорить о клинической эффективности и поддержке принятия врачебных решений», – полагает эксперт.

***

Таким образом, использование результатов анализа больших данных как метода принятия решений имеет важное значение и для государственных, и для бизнес-структур. Поэтому логично предположить, что с законодательным закреплением соответствующей терминологии и правил обработки этих данных затягивать не стоит.