Using score for support of inspection organisations selection in practice
Jarmila Teskova1, Jan Šobora2
1Výzkumný ústav bezpečnosti práce, teskova@vubp-praha.cz
2Oblastní inspektorát práce Středočeský kraj, Jan.Sobora@oip.cz
V roce 2007 spolupracoval OIP4 s VÚBP při výběru organizací k provedení inspekce. OIP 4 dodal VÚBP svůj seznam vybraných subjektů, vycházející z úkolů SÚIP, který byl ve VÚBP zpracován a doplněn o výsledky dataminingu s daty ČSÚ (Pracovní neschopnost pro nemoc a úraz v ČR, dále NemÚr). Konkrétně byla modelována předpověď, zda v organizaci dojde k pracovním úrazům (dále PÚ). Původní seznam byl doplněn o počet datových modelů, předpovídajících výskyt PÚ v dané organizaci (hodnoty 0 až 6) a hodnotu "SCORE" v procentech, vycházející z předpovědi jednoho z použitých modelů. Čím vyšší je "SCORE“, tím vyšší je pravděpodobnost správné předpovědi – tj. výskytu PÚ. Vzhledem k časovému skluzu při publikaci výchozích dat statistiky NemÚr bylo možno použít k predikci pouze dat z roku 2005, čímž byla její spolehlivost mírně snížena. Protože se však situace v BOZP rok od roku dramaticky nemění, je tato aproximace přijatelná. Dalším zdrojem nepřesností jsou pak především chyby v údajích o OKEČ (jiné než skutečná činnost), jedná se však o neovlivnitelnou kvalitu vstupních dat z různých zdojů (ČSÚ, ministerstvo financí). Počet datových modelů a "SCORE" je nutno chápat jako podpůrnou pomůcku při rozhodování o provedení inspekce. VÚBP odevzdal OIP4 výstup ve formě excelového souboru s filtry pro IČ, název a velikost organizace, číslo a specifikaci úkolu SÚIP, odbor OIP, OKEČ a pro nové informace - "SCORE" a počet datových modelů předpovídajících výskyt PÚ.
V praxi jsou zkušenosti s dodaným výstupem dobré. Filtry umožňují rychlou orientaci v datech, vyhledávání a identifikaci duplicit. Z původního přehledu stovek vytipovaných subjektů, navržených k provedení kontroly, byly takto identifikovány, následně konzultovány a upřesněny „zdvojené“ návrhy z odborů inspekce. Doplněné nové informace slouží i k získání představy o dosud neznámém subjektu. Přestože řada firem je nových, malých a třeba ještě u nich ani nedošlo ke vzniku PÚ, "SCORE" a počet modelů předpovídajících výskyt PÚ jsou k dispozici, neboť při dataminingu jsou brána v úvahu i další hlediska - např. velikost, OKEČ, nemocnost apod. Celkově lze říci, že výsledky dataminingu jsou využitelné pro plánování a provádění inspekčních činností. Původní záměr vybírat pro inspekci organizace s možnou vyšší rizikovostí se potvrdil, navrhované subjekty měly střední a vyšší "SCORE".