web analytics

Глобальный барометр данных: каково текущее состояние открытых данных в мире?

В какой степени страны принимают политику и системы данных для общественного блага?


Недавно я прочитал книгу о принятии политики открытых данных в городах по всему миру. Он называется Beyond Transparency (общедоступен по этой ссылке) и состоит из тематических исследований, показывающих успехи и препятствия политики открытых данных в начале 2010-х годов. Как намекает название, предоставление доступных и бесплатных наборов данных — это шаг к более прозрачному правительству, но не только. В книге рассказывается о том, как эти данные стимулировали инновации, повышали эффективность правительства и поощряли новые гражданские привычки, такие как более активное участие граждан. Специалисты по работе с данными, в том числе инженеры и специалисты по данным, также разработали собственные решения на основе этих новых наборов данных, создав более совершенные модели и приложения. Некоторые примеры этих новых гражданских технологических экосистем см. в Building a Smarter Chicago.главу и аналитическую работу, созданную на таких веб-сайтах, как Data SF или Chicago Data Portal! Еще одна любимая глава: Город, управляемый данными , о том, как сбор звонков по номеру 311 позволяет Нью-Йорку моделировать службы экстренной помощи и распределение ресурсов.

С 2010-х годов сотни стран приняли собственные законы об открытых данных. Глобальный барометр данных ( лицензия: Creative Commons Attribution 4.0 ) измеряет состояние открытых данных в 109 из них, отвечая на вопрос « В какой степени страны управляют данными для общественного блага? В исследовании используется сочетание количественных показателей и качественных описаний, чтобы дать четкую картину того, как обстоят дела в мире с точки зрения открытых данных. Это невероятно тщательная работа, поэтому я думаю, что было бы интересно потратить некоторое время на изучение ее части с помощью этой истории.

Краткое примечание : для истории я использую блокноты Observable (на основе JS) для визуализации и Jupyter для обработки данных; ссылки на оба в самом конце.

Давайте начнем!

Обзор индекса: какое место занимают страны?

Общий индекс стран варьируется от 0 (не существует) до 100 (демонстрирует передовой опыт).

Общий индекс открытых данных (изображение автора)

График выше показывает довольно небольшой спред. Страной с наивысшим баллом (70) являются Соединенные Штаты, а с самым низким баллом (10) – Туркменистан, тогда как средний балл составляет 38,51. Этот индекс создается путем изучения методов работы с открытыми данными в каждой стране по 4 направлениям или «столпам»: управление, возможности, доступность, использование и воздействие. Для каждого из этих компонентов страны предоставляют информацию о существовании определенного элемента (например, системы защиты данных), элементов (функций, связанных с качеством, и функций открытых данных) и степени(ограничения и применимость конкретной структуры в стране). В исследовании также отслеживаются вторичные индикаторы для каждого компонента, каждый из которых оценивается по 100-балльной шкале. Таким образом, общий балл индекса, равный 100, будет представлять собой своего рода «нормативный идеал» по всем этим первичным и вторичным индикаторам.

Страны с одинаковыми показателями по-прежнему имеют огромные различия в показателях.

Давайте сосредоточимся на странах, чей индекс находится на среднем уровне (от 35 до 45). Их 20, включая Албанию и Косово, а также страны со всего мира: Ямайку, Казахстан, Парагвай, Филиппины, Перу, Таиланд и Южную Африку и другие.

Несмотря на общее сходство индексов, если посмотреть на их средние баллы по модулям, их производительность не так постоянна. Барометр собирает тематические или модульные баллы в дополнение к столбцам, а 7 модулей рассматривают практику открытых данных в следующих областях: здравоохранение и COVID-19, земля, государственные финансы, закупки, меры по борьбе с изменением климата, политическая честность и информация о компании. Вот взгляд на модули действий по борьбе с изменением климата, политической честности и закупок для этих 20 стран:

Климатическое действие (изображение автора)
Политическая честность (изображение автора)
Закупки (изображение автора)

Во многих странах есть несоответствия:

  • У Ямайки самые высокие показатели по борьбе с изменением климата, но только низкий балл по закупкам. Более глубокий анализ климатических показателей показывает, что Ямайка предоставляет данные об окружающей среде через свой Статистический институт, в том числе показатели о «дождях, солнечном свете, случаях загрязнения, парниковых газах, охраняемых лесных массивах, уровне моря», а также «отсутствие свидетельств пробелов в данных». В отделе закупок, однако, нет общедоступной информации на этапе планирования и данные низкого качества: они не содержат названий/идентификаторов компаний, получивших контракты, или информации о «расходах по контракту».
  • В Албании подробная информация о закупках доступна в Интернете ( ссылка здесь ), однако реализация контрактов не охватывается, а данные лишь частично машиночитаемы. Также доступны данные о политическом финансировании, но они не содержат данных о доходах партий и кандидатов или исторической информации об отслеживании.

Прогресс по всем этим модулям ведет к более прозрачному и эффективному правительству. Например, наличие более качественных данных о закупках позволяет гражданам анализировать, где и как тратятся деньги на всех этапах проекта, или добиваться более справедливого распределения. Точно так же наличие прозрачных данных о лоббировании и деклараций об активах позволяет повысить ответственность за политическую честность. Климатическая информация позволяет общественности быть в курсе таких аспектов, как биоразнообразие, выбросы или уязвимость.

Структуры управления существуют, но в значительной степени фрагментированы

Управление является одним из основных столпов набора данных. Вопросы, на которые он отвечает, включают оценку состояния политик и структур, определяющих, как данные защищены и управляются. Исследование управления отслеживает несколько показателей: «политика открытых данных» является одним из них, а также «защита данных», «системы обмена данными», «управление данными» и некоторые другие. Вот как страны оценивают эти показатели управления:

Показатели управления в 109 странах (изображение автора)

Многие страны демонстрируют умеренные показатели по таким показателям, как защита данных, политика открытых данных или управление данными. Около 92% опрошенных политик имеют общее определение открытых данных, 72% стран имеют ту или иную структуру управления данными, а 90% из них предлагают правила защиты данных (отчет здесь ). Многие страны предлагают частичные или полные правила по вопросам согласия на использование данных, прав на возмещение ущерба и доступа или исправления.

Хотя формы управления данными существуют, Глобальные открытые данные показывают, что страны все еще имеют серьезные ограничения. Например, только 24% фреймворков решают вопросы информации о местоположении и только 31% — алгоритмического принятия решений (также в отчете ). Большинство из этих стран находятся в Европе и Северной Америке: эти два региона включают 17 из 23 стран, ответивших «Да» на вопрос «Структуры явно охватывают защиту данных, связанных с местоположением», и 20 из 31, чьи «структуры учитывают алгоритмические изготовление”.

Последние два показателя, доступность и языковой охват, оценивают правила, обеспечивающие доступность данных для людей с ограниченными возможностями и доступность на официальном языке (языках) каждой страны. Последнее особенно важно для стран со многими такими языками, но, тем не менее, также раздробленными: 13 из 109 стран набирают 100 баллов в этой категории (имеющие силу закона).

Реагирование на COVID-19 было сложной задачей, но также и возможностью для управления данными.

Пандемия COVID-19 проверила многие из этих систем данных, особенно на местном уровне. В исследовании оцениваются объемы данных не только о наличии данных о вакцинации, но и о медицинских данных в режиме реального времени (например, о койках в отделении интенсивной терапии) и статистике естественного движения населения. Статистика естественного движения населения включает информацию о рождении и смертности, исторические периоды и то, насколько эти данные доступны на местном уровне в стране. Вот тепловая карта того, как обстоят дела в странах:

Результаты модуля «Здоровье и COVID-19» (изображение автора)

Данные о вакцинации были в основном доступны в большинстве стран, включенных в набор данных, однако не без проблем. Только около 50% доступных наборов данных были разбиты по возрасту, а около 33% были дезагрегированы по полу ( статистика отчета ). Кроме того, медицинские данные в режиме реального времени были доступны только примерно в 50% стран, и еще меньше опубликовали информацию о количестве доступных коек. Для некоторых из этих стран этот тип данных был впервые доступен только во время пандемии, что позволяет странам начать использовать его для улучшения отчетности в области здравоохранения в будущем.

И насколько легко пользователям было изучать данные? Более глубокий анализ показывает, что 61 из 109 стран не предлагали официальных открытых инструментов, позволяющих гражданам получать доступ к данным статистики естественного движения населения. Точно так же 63 из 109 не предоставили официальных и доступных данных о вакцинации против COVID-19. 57 стран также не предлагали машиночитаемые данные (такие как CSV), что важно для легкого распространения и воспроизведения.

Что дальше для будущего открытых данных? (и ресурсы)

Основным выводом отчета стало относительное отсутствие сред открытых данных на глобальном уровне (вспомните средний общий индекс: 38/100). Как мы уже видели в этой истории, наличие полностью сформированных законов об открытых данных просто необходимо. В дополнение к исследованиям, проводимым Global Data Barometer, есть и другие репозитории, которые отслеживают новое законодательство по вопросам открытых данных по всему миру. Одним из них является отчет State of Open Data от The Gov Lab. Итак, взгляните на законы по секторам или типам сотрудничества!

Однако в целом отчет Global Data Barometer освещает практические проблемы, связанные с принятием этих законов, включая пробелы в данных или недоступные или недоступные данные. Одним из ярких примеров, который мы рассмотрели, была публикация и управление медицинскими данными, особенно в чрезвычайных ситуациях, таких как COVID-19, когда своевременное получение информации имеет решающее значение. Этот пример, однако, также показал, как новые проблемы могут также стимулировать данные для повышения прозрачности и предоставления гражданам возможности оставаться в курсе, что очень многообещающе! В целом отчет указывает на очень конкретные области, на которых каждая страна должна сосредоточиться, предлагая стратегии для улучшения сбора данных, в то же время обеспечивая общее представление о текущих проблемах с открытыми данными.

Вот блокноты ( Jupyter и Observable ),

Спасибо за прочтение!

Источник:
https://towardsdatascience.com/global-data-barometer-whats-the-current-state-of-open-data-in-the-world-2841e80503c2

Rate article
( No ratings yet )

Leave a Reply