Важная публикация:
Алексей КУТОВЕНКО
Об открытых данных в Беларуси регулярно говорят на конференциях, однако до сих пор их использование крайне ограниченно. В чем причина?
Что такое открытые данные?
Открытые данные — это представленные в машиночитаемом формате источники первичной достоверной информации, доступные для свободного просмотра, анализа и повторной публикации либо для использования в сторонних проектах без каких-либо лицензионных ограничений и дополнительного контроля. В данном контексте машиночитаемость означает не просто представление данных в электронном виде, а использование форматов, предназначенных для импорта в другие программы.
Таким образом, даже несмотря на официальное разрешение правообладателя на повторную публикацию, информация в таблице, размещенная на обычной веб-странице, не является открытыми данными. Если же эта информация доступна в виде подготовленного файла, который можно без дополнительных существенных преобразований импортировать в другую базу данных или программу анализа, тогда она становится полноценными открытыми данными.
Некоторые энтузиасты создавали такие базы и раньше, извлекая данные из открытых интернет-источников и приводя их в удобный для машинной обработки формат. Это движение получило значительное ускорение после принятия в 2013 году государствами — членами «Большой восьмерки» Хартии открытых данных. Идея о том, что приведенные к машиночитаемым форматам данные, например уже свободно предоставляемые государственными органами разных стран, могут использоваться гораздо эффективнее, нашла отклик, и количество проектов, опирающихся на открытые данные, стало расти. Хартия призвала присоединиться к движению открытых данных и бизнес.
Развиваются и инструменты работы с открытыми данными, причем активность в данном секторе проявляют крупные интернет-компании. Так, в последние годы Google вложила в проекты и гранты, связанные с открытыми данными, более 3 млн долларов. Кроме того, был предоставлен доступ к ряду инструментов для анализа таких данных, в том числе использующих технологии машинного обучения.
Открытые данные в Беларуси
Нельзя сказать, что концепция открытых данных не нашла применения в нашей стране. Например, создано сообщество opendata.by, которое каталогизирует источники и всячески популяризирует идею их использования. Пример проекта, реализованного с помощью сообщества, — «Безопасный город». Он обобщает и визуализирует открытые данные о происшествиях в Минске.
Белорусские ученые также присматриваются к открытым данным, ведь это хороший ресурс для анализа и потенциальная база для исследований. Примеры реализации научных проектов можно увидеть на портале и облачном хостинге Grid.by, принадлежащем Национальной академии наук.
Заявлены и проекты общегосударственного уровня. С конца 2016 года в рамках госпрограммы развития цифровой экономики и информационного общества на 2016—2020 годы создается Государственный портал открытых данных. Разработчик системы — компания Light Well Organisation, специализирующаяся на банковском программном обеспечении. Согласно планам, портал должен заработать в 2018 году и объединить не менее ста наборов данных.
Казалось бы, растите и развивайтесь! Однако отечественных проектов, использующих открытые данные и доведенных до приемлемого уровня, крайне мало, их можно пересчитать по пальцам. В чем причина и можно ли рассчитывать на изменение ситуации?
Проблемы использования
В сообществе opendata.by к основным проблемам роста относят нехватку в госструктурах квалифицированных кадров, которые могли бы подготавливать машиночитаемые данные, отсутствие соответствующего законодательства и субъективные опасения. Отметим, что в данном случае речь идет только о проблемах, связанных с использованием данных госструктур и органов. Что касается контакта с частным бизнесом в Беларуси, то в этом вопросе поле еще совершенно непаханое.
К перечню проблем можно добавить и ряд технических трудностей, связанных с форматами данных: они далеко не всегда являются машиночитаемыми. Среди наиболее заметных — разрозненность данных, отсутствие стандартных программных интерфейсов доступа к данным из различных источников и единого механизма поиска открытых данных, ошибки в форматах представления данных. Каждая проблема имеет несколько аспектов, решать их тоже придется комплексно.
Пожалуй, наиболее серьезной является проблема отсутствия регулирования. Поскольку в качестве основного источника выступают прежде всего госорганы, без установления четких правил вряд ли можно надеяться на активное создание баз открытых данных. К тому же использование таких данных без правового урегулирования может быть далеким от оптимального.
Один из примеров — «Минсктранс». Несколько лет тому назад он предлагал открытый интерфейс для доступа к информации о движении общественного транспорта. На его основе сторонние разработчики создали несколько популярных мобильных приложений.
Затем доступ внешних разработчиков к данным был закрыт — предприятие планировало развивать собственные сервисы. В итоге сопоставимые мобильные приложения так и не были созданы, а сервисы доступны только на веб-сайте, не самом удобном для мобильного использования.
Попытка «Минсктранса» монетизировать доступ к базе с помощью USSD-запросов — это никак не уровень технологий 2017 года. Какой-либо автоматизированный внешний доступ к базе, пусть даже платный, невозможен. В результате данные явно не раскрывают свой потенциал.
Если правила игры будут четко определены, решение технических проблем вряд ли заставит себя долго ждать. Во многом переломным может стать ожидаемый запуск Государственного портала открытых данных, ведь сопутствующие проблемы все равно придется так или иначе решать.
Правда, без подводных камней тоже не обойдется. Какие технические решения будут приняты в ходе работы над порталом, пока неясно. Пожелаем успеха проектировщикам и разработчикам: цена каждой ошибки может оказаться очень высокой. Ведь именно их решения волей-неволей станут определяющими для реализации подавляющего большинства новых проектов, которые планируют опираться на белорусские открытые данные.
Материал опубликован в №30 газеты «Белорусы и рынок» от 12 августа 2017 года.
Источник:
http://belmarket.by/otkrytye-problemy-otkrytyh-dannyh





