USE OF OPEN DATA FOR PRESENTATION AND VISUALIZATION OF INFORMATION about occupational safety and health
Jiřina Ulmanová1, Veronika Měrková1
1Výzkumný ústav bezpečnosti práce, v. v. i.; ulmanova@vubp-praha.cz, merkova@vubp-praha.cz
Abstrakt
Cílem tohoto článku je představit výzkumný projekt, který se zabývá využitím a vizualizací otevřených dat pro podporu analýz v oblasti bezpečnosti a ochrany zdraví při práci. V úvodní části seznamuje čtenáře s definicí a charakteristikou otevřených dat, navazuje počátečními východisky a vizemi pro tvorbu webové aplikace postavené na platformě otevřených dat a diskutuje problémy, se kterými se řešitelé při získávání dat potýkají. V závěru jsou pak představeny vizualizace dat z oblasti BOZP, které vytváří Evropská agentura pro BOZP a nadace Eurofound.
Klíčová slova: otevřená data, datové sady, BOZP, vizualizace, prezentace informací, výzkumné projekty, Výzkumný ústav bezpečnosti práce
Abstract
The aim of this article is to present a research project that deals with the use and visualization of open data to support analyses in the field of occupational health and safety. In the introductory part, it introduces the definition and characteristics of open data, follows the starting points and visions for creating a web application based on the open data platform and discusses the problems that solvers face in obtaining open data sets. Finally, visualizations of data from the field of OHS created by the European Agency for Safety and Health at Work and the Eurofound foundation are presented.
Keywords: open data, data sets, OSH, visualization, presentation of information, research projects, Occupational Safety Research Institute
Přijat k publikování / Received for publication 29. 11. 2019
Otevřená data jsou podle OECD předpokladem zvýšení konkurenceschopnosti České republiky a jsou obrovskou příležitostí současnosti. Veřejné i soukromé instituce disponují celou řadou datových a informačních zdrojů, kterých lze využít a efektivně je sdílet a analyzovat. Využívání a sdílení otevřených dat je zakotveno v činnosti celé řady mezinárodních i národních iniciativ a organizací.
Na národní úrovni jde řadu strategických materiálů a akčních plánů, např. o Strategický rámec Česká republika 2030, Strategický rámec rozvoje veřejné správy ČR pro období 2014–2020, soubor koncepcí a implementačních plánů Digitální Česko, Strategie rozvoje ICT služeb veřejné správy a její opatření na zefektivnění ITC služeb, Implementace směrnice Public Sector Information, Akční plán Partnerství Otevřeného vládnutí. Na Portálu veřejné správy je dostupný Národní katalog otevřených dat, který umožňuje vyhledávat otevřené datové sady zveřejněné jednotlivými orgány veřejné správy v ČR. Otevřeným datům se věnuje projekt Ministerstva vnitra České republiky, který zprovoznilo portál pro ostatní orgány veřejné správy, které plánují otevřít svá data. Popisuje doporučovaný postup otevírání dat a nabízí vzorové publikační plány, které obsahují (pro jednotlivé typy orgánů veřejné správy) konkrétní datové sady k publikaci ve formátu otevřených dat. Portál rovněž informuje o školeních připravených k tématu otevřených dat. Pozadu nejsou ani ostatní ministerstva, která se také rozhodla publikovat svá otevřená data. Je tedy zjevné, že se tomuto trendu Česká republika otevřela a že se snaží na něj reagovat.
Totéž se děje i na mezinárodní úrovni. Na úrovni Evropské unie byl vytvořen The European Union Open Data Portal – datový portál veřejně přístupných dat, který je centralizovaným úložištěm dat, jež produkují evropské instituce a další subjekty EU a jejichž objem neustále narůstá.
Oblast bezpečnosti a ochrany zdraví při práci (BOZP) je multidisciplinárním oborem a pro analýzy především ze socioekonomického hlediska existuje pro využití otevřených dat obrovský potenciál. S tím, jak se mění charakter práce, s rapidním nástupem digitalizace a automatizace, nových forem práce, se vznikem nových rizik je třeba pohlížet na oblast BOZP v širokém kontextu a díky analýzám dostupných dat a informací bude možné lépe zaměřit vhodná opatření a doporučení pro co nejvyšší míru ochrany fyzického a duševního zdraví člověka.
V rámci výzkumného projektu institucionální podpory pro potřeby MPSV „Vývoj webové aplikace postavené na platformě otevřených dat k problematice bezpečnosti a ochrany zdraví při práci (BOZP)“ se aktuálně zabýváme možnostmi využití otevřených dat, která jsou v současné době volně k dispozici, pro podporu analýz v oblasti bezpečnosti a ochrany zdraví při práce. Tento dvouletý projekt (1/2019-12/2020) si klade za cíl zmapovat aktuální situaci v oblasti otevřených dat využitelných pro tuto problematiku a vytvořit veřejně dostupnou webovou aplikaci postavenou na otevřených datech.
Otevřená data jsou informace a data zveřejněná na internetu, která jsou úplná, snadno dostupná, strojově čitelná, používající standardy s volně dostupnou specifikací, zpřístupněná za jasně definovaných podmínek užití dat s minimem omezení a dostupná uživatelům při vynaložení minima možných nákladů[1]. Jsou využitelná nejen pro volně dostupné aplikace, ale lze jich využít i ke komerční činnosti.
Zákon 106/1999 Sb., o svobodném přístupu k informacím (§3), definuje otevřená data jako „informace zveřejňované způsobem umožňujícím dálkový přístup v otevřeném a strojově čitelném formátu, jejichž způsob ani účel následného využití není omezen a které jsou evidovány v národním katalogu otevřených dat“.
Pro potřeby našeho projektu budou primárně zdrojem datových sad instituce veřejné správy a další veřejné instituce, které disponují daty souvisejícími s problematikou BOZP. Obecně by měla otevřená data zveřejňovaná institucemi veřejné zprávy splňovat tyto principy [5]:
Stěžejním zdrojem o tom, jaké datové sady jsou v současné k dispozici od státních a veřejných institucí, je Národní katalog otevřených dat veřejné správy ČR (dále NKOD). NKOD obsahuje katalogizační záznamy o datových sadách zpřístupněných veřejnými institucemi ČR, včetně odkazů ke stažení dat, která jsou uložena na webu příslušného poskytovatele dat. K 15. 12. 2019 je v katalogu registrováno 38 poskytovatelů dat, kteří dohromady zveřejnili 134 426 datových sad.
Z pohledu BOZP jsou v NKOD pro naši oblast zajímavé datové sady od těchto institucí:
Na každoroční konferenci Open Data Expo 2019 jsme měli možnost diskutovat se zainteresovanými institucemi o způsobech, jak data získat. U zástupce České správy sociálního zabezpečení jsme dohodli postup, jak o data zažádat, a v rámci schvalovacího procesu pak budeme informováni, zda je možné námi požadovaná data získat. Pokud by měly zájem o stejná data i další subjekty, pak by se požadovaná datová sada dostala do tzv. publikačního plánu pro otevřená data a byli bychom schopni získávat tyto sady pravidelně, nejen jednorázově pro potřeby projektu. Tím by byla zaručena možnost data v budoucí aplikaci aktualizovat a vytvářet tak analýzy pro delší časový úsek.
U Ministerstva zdravotnictví ČR už není proces získání dat zaručen. Poskytování dat je v tomto případě vázáno na legislativu, konkrétně na zákon č. 372/2011 Sb., o zdravotnických službách (část 6 – Zdravotnická dokumentace a národní zdravotnický informační systém). V něm je stanoveno, které instituce mají právo na přístup k tomuto druhu informací. Je třeba najít v zákoně podporu a mít tak možnost o agregované datové sady požádat. Zde bude třeba součinnost právního oddělení. Data je třeba žádat u servisní organizace Ministerstva zdravotnictví., kterou je Ústav zdravotnických informací a statistiky ČR. Ten ovšem není myšlence otevřených dat příliš nakloněn.
Pro obsáhnutí celého tematického spektra BOZP existují další veřejné instituce, jejichž data by byla pro zpracování analýz stěžejní. Jedná se o:
S oběma institucemi úzce spolupracujeme, ale ani jedna z uvedených institucí svá data ve formátu otevřených dat nezveřejňuje.
V průběhu prvního roku projektu jsme se věnovali také monitoringu a analýze dostupných komerčních i volně dostupných softwarů vhodných pro práci s otevřenými daty, které by byly využitelné pro tvorbu webové aplikace. V monitorovací zprávě bylo popsáno 23 nástrojů. Při monitoringu jsme si stanovili kritéria, která je třeba při výběru softwarového řešení pro otevřená data zvážit:
Jako nejpřijatelnější varianta se nám jeví vytvoření vlastního katalogu (ať už přímo s daty, jehož původcem je VÚBP, či s volně dostupnými daty jiných institucí) a vytvoření vizualizací v podobě dashboardů vztahující se k různým problematikám z BOZP. V tomto případě bychom zvažovali využití CKANu či DKANu.
Po analýze datových sad, které jsou v současné době k dispozici volně na internetu a které jsou veřejně publikované, jsme se rozhodli zaměřit projekt na obecné sociální a ekonomické ukazatele, a to na úrovni krajů.
Celá řada informací, které by se daly pro webovou aplikaci využít, je i v podobě nestrukturovaných dat a informací, např. v výročním zprávách, zprávách o činnostech apod., takže jako jednu z možností vidíme vytvořit si vlastní datové sady (katalog otevřených dat) zpracováním právě těchto zdrojů. Jak bylo uvedeno výše, některé veřejné instituce nemají možnost data v podobě otevřených dat publikovat (SZÚ, SÚIP), ale poskytují je veřejnosti v podobě výše uvedených zpráv či v podobě agregovaných dat a my bychom je mohli v rámci projektu takto transformovat a využít pro následné prezentace dat širokému okruhu uživatelů. Pro komplexní pohled na BOZP jsou tato data a informace jedny z nejdůležitějších.
Vedle výše zmíněných otevřených datových sad bychom využili také data a informace, které zpracováváme v rámci výzkumné a další činnosti ve Výzkumném ústavu bezpečnosti práce, v. v. i., a dali je do kontextu s obecnými socioekonomickými ukazateli na úrovni krajů.
Využitelná data:
Obr. 1 demonstruje, jak by bylo možné otevřená data prezentovat a vizualizovat koncovým uživatelům. Nad vlastním katalogem otevřených dat by bylo možné realizovat různé výběry, vizualizace atd., a to na úrovni krajů. Po rozkliknutí vybraného ukazatele by se zobrazovaly grafy, tabulky, infografiky. Uživatel by měl možnost si vizualizaci uložit, stáhnout, porovnat s jinými kraji apod.
Obr. 1: Vize budoucí prezentace a vizualizace otevřených dat
Nejen pro potřeby tohoto projektu jsme se zabývali možnými způsoby prezentace a vizualizace dat a informací z oblasti BOZP a prevence rizik. Vizualizace dat (nejen otevřených) a informací může být zajímavým nástrojem, jak usnadnit uživateli orientovat se v dané problematice, zkoumat a objevovat jevy, odhalovat souvislosti, získat komplexní přehled a udělat si o problému ucelený obraz. Využitelná je nejen v každodenních činnostech (plánování, studium apod.), ale pomáhá i s prezentací odborných a vědeckých poznatků v celé řadě oborů tak, aby byly srozumitelnější a uchopitelnější pro širší okruh uživatelů.
Pro inspiraci tedy uvádíme vizualizace dat dvou stěžejních institucí v oblasti BOZP – Evropské agentury BOZP a nadace Eurofound, které jsou zdrojem informací a znalostí nejen pro naše projekt, ale čerpáme z jejich studií, průzkumů a výzkumných zpráv pro celou řadu aktivit VÚBP, v. v. i.
Vizualizaci využívá pro prezentaci dat, informací a zjištění z celé řady svých aktivit také Evropská agentura pro bezpečnost a ochranu zdraví při práci (dále EU-OSHA). Její nástroje vizualizace dat uvádějí fakta a údaje o celé řadě otázek týkajících se bezpečnosti a ochrany zdraví při práci v celé Evropě, včetně způsobu řízení rizik, pracovních podmínek, demografie, dopadu na zdraví, politik a strategií. Uživatelsky přívětivé nástroje zobrazují klíčová zjištění a data, která lze filtrovat podle země, sektoru a dalších proměnných.
EU-OSHA na svých internetových stránkách poskytuje uživatelům přístup k 3 vizualizačním nástrojům, které se týkají vybraných tematických oblastí v BOZP:
Vizualizace dat - ekonomika BOZP
Tento nástroj zdůrazňuje klíčové poznatky z projektu několika evropských organizací (Mezinárodní organizace práce, Finské ministerstvo sociálních věcí a zdraví (MSAH), Finský institut pro ochranu zdraví při práci, Institut WSH v Singapuru, Mezinárodní komise pro ochranu zdraví při práci a EU-OSHA), který si kladl za cíl vypracovat aktualizované celosvětové odhady pracovních úrazů a nemocí z povolání. Statistiky jsou založeny na dostupných údajích na mezinárodní úrovni, přičemž se opírají hlavně o zdroje dat Světové zdravotnické organizace a Mezinárodní organizace práce.
Nástroj poskytuje vizuální prezentaci údajů o nákladech na léčení nemocí z povolání a následků pracovních úrazů, které pokrývají všechny regiony světa a nabízí více specifických údajů na úrovni členských států EU. Náklady na společnost jsou vyjádřeny pomocí monetárních údajů a jako procento hrubého domácího produktu (HDP).
Obr. 2: Graf z vizualizačního nástroje Ekonomika BOZP (zdroj: https://visualisation.osha.europa.eu/osh-costs#!/)
Interaktivní dashboard ESENER
Dalším vizualizačním nástrojem je interaktivní dashboard průzkumu nazvaného ESENER - Evropský průzkum podniků o nových a vznikajících rizicích (EU-OSHA’s European Survey of Enterprises on New and Emerging Risks). Jedná se o rozsáhlý průzkum, který se zabývá tím, jak jsou na evropských pracovištích řízena rizika v oblasti BOZP. Interaktivní přehledový panel umožňuje vizualizovat a sdílet data průzkumu ESENER a pomáhá podrobněji prozkoumat odpovědi na výběr otázek ESENER podle země, typu sektoru a velikosti společnosti. První průzkum byl realizován v roce 2009, druhý pak v roce 2014 (ESENER-2). Dashboard je tedy rozdělen dle výsledků obou průzkumů a dostupný je v 25 jazykových mutacích. K dispozici jsou 4 typy vizualizací:
Obr. 3: ESENER - Evropská mapa (zdroj: https://osha.europa.eu/en/surveys-and-statistics-osh/esener/)
Vizualizace dat – stárnutí a BOZP
Tento nástroj pro vizualizaci dat zdůrazňuje klíčová zjištění projektu EU-OSHA zaměřeného na porozumění bezpečnosti a ochrany zdraví při práci v souvislosti se stárnoucí pracovní sílou v EU.
Přináší vizuální prezentaci údajů o demografii, zaměstnanosti, pracovních podmínkách a zdraví v kontextu stárnoucí pracovní síly a o BOZP a souvisejících politikách.
Nástroj je interaktivní a uživatelé mohou:
Obr. 4: Úvodní graf vizualizačního nástroje stárnutí a BOZP (zdroj: https://visualisation.osha.europa.eu/ageing-and-osh#!/)
Eurofound je Evropská nadace pro zlepšení životních a pracovních podmínek. Jedná se o tripartitní agenturu Evropské unie, která poskytuje přehled poznatků s cílem přispívat k rozvoji lepších sociálních, zaměstnaneckých a pracovních politik. Cílem nadace je podporovat cíle strategie Evropa 2020 a zajišťovat, aby Evropa dosáhla inteligentního a udržitelného růstu podporujícího začlenění. Pomocí výzkumu, který zkoumá zkušenosti z praxe a určuje faktory pro úspěšné změny, se snaží Nadace Eurofound zdokumentovat i pochopit změny a rozvíjet myšlenky pro průběžné zlepšování životních a pracovních podmínek evropských občanů. Stejně jako agentura EU-OSHA disponuje i Nadace Eurofound velkým objemem dat a informací, které shromažďuje v rámci svých aktivit, a prezentuje některé výstupy pomocí vizualizace. Jedná se o:
Všechny tři vizualizace jsou vytvořené pomocí stejného vizualizačního nástroje. Uživatel si může volit různé typy výstupů dle definovaných parametrů – mapa Evropy, evropský sloupcový graf, národní sloupcový graf, porovnání mezi zeměmi, datová matice, skupiny zemí v lineárním zobrazení, skupiny zemí v radiálním zobrazení. Dále si uživatel pro svůj grafický výstup může definovat celou řadu dalších parametrů podle toho, ve kterém vizualizačním nástroji se právě nachází, např. geografické omezení, velikost podniku, odvětví, pohlaví, dle odpovědi na otázku z průzkumu atd. Samozřejmostí je i možnost srovnání dle zadaných parametrů. Níže uvádíme některé typy výstupů. Menu v levé části vizualizace naviguje uživatele podle otázek, které byly respondentům v průzkumu pokládány.
Obr. 5: Srovnání mezi zeměmi z Evropského průzkum kvality života 2016 (zdroj: https://www.eurofound.europa.eu/cs/data/european-quality-of-life-survey)
Obr. 6: Skupiny zemí v lineárním zobrazení z Evropského průzkumu podniků (zdroj: https://www.eurofound.europa.eu/cs/data/european-company-survey)
Tento článek přiblížil problematiku a možnosti využití otevřených dat v oblasti BOZP a představil již funkční řešení na evropské úrovni. Naším cílem je sběr dat a vytvoření aplikace, která bude demonstrovat data z BOZP na úrovni krajů.
Prvotním předpokladem pro vytvoření takovéto vizualizační aplikace jsou data. Tato data musí být veřejně dostupná, v odpovídajícím formátu a kompletní. Bohužel tato základní podmínka je pro některé typy dat zatím zásadní překážkou, kterou se nám, doufejme, podaří brzy překonat.
Po sběru a kompletaci dat se pustíme do samotného vývoje aplikace, která bude přínosem pro všechny zájemce o problematiku BOZP.
[1] EVROPSKÁ AGENTURA PRO BEZPEČNOST A OCHRANU ZDRAVÍ PŘI PRÁCI. Vizualizace dat [online]. EU-OSHA, c2018 [cit. 2019-12-11]. Dostupný z: https://osha.europa.eu/cs/data-visualisation.
[2] EUROFOUND. Data and resources [online]. Eurofound, 2018 [cit. 2019-12-11]. Dostupný z: https://www.eurofound.europa.eu/cs/data.
[3] Otevřená data v ČR: portál pro poskytovatele [online] [cit. 2019-12-11]. Dostupný z: https://opendata.gov.cz/start.
[4] Otevřený přístup k vědeckým informacím. Brno: Vysoké učení technické v Brně, VUTIUM, 2016. 265 s. ISBN 978-80-214-5282-4.
[5] Úvod k otevřeným datům: prezentace k projektu Implementace strategií v oblasti otevřených dat II [online]. Evropská unie, Evropský sociální fond, 2017 [cit. 2019-12-11]. Dostupný z: https://opendata.gov.cz/_media/edu:sk0_uvod_k_otevrenym_datum_2017.pdf.
Vzorová citace
ULMANOVÁ, Jiřina; MĚRKOVÁ, Veronika. Využití otevřených dat pro prezentaci a vizualizaci informací z oblasti BOZP. Časopis výzkumu a aplikací v profesionální bezpečnosti [online]. 2019, roč. 12, č. 3-4. Dostupný z: https://www.bozpinfo.cz/josra/vyuziti-otevrenych-dat-pro-prezentaci-vizualizaci-informaci-z-oblasti-bozp. ISSN 1803-3687.
[1] Otevřená data. Wikipedie: otevřená encyklopedie [online]. MediaWiki, stránka naposledy editována 13. 6. 2019 [cit. 2019-06-24]. Dostupný z: https://cs.wikipedia.org/wiki/Otev%C5%99en%C3%A1_data.