Otevřená data s kontrolou osobních údajů

2 min čtení

30. 11. 2020

Význam otevřených dat roste s tím, jak se zvyšuje množství dat obsažených v informačních systémech státních a samosprávných institucí a poptávka veřejnosti po transparentnosti jejich hospodaření. OpenData jsou zveřejňována na specializovaných portálech nebo jsou přímo využitelná v nejrůznějších aplikacích, včetně těch opensourcových (např. CityVizor).

Platforma GINIS disponuje nástrojem k efektivnímu a bezpečnému získávání otevřených dat - OpenData Generátoru. Ten zpracovává data přímo z databáze, a to díky předpřipraveným algoritmům datových sad. Takto získaná data jsou následně přetransformována a uložena do strojově zpracovatelných formátů (CSV, XML, JSON). Mezi aktuálně dostupnými datovými sadami jsou například Rozpočet a jeho čerpání, Faktury, Smlouvy, Akce, atd.

Mnohé úřady si již vytvořily publikační plány a svá data aktivně „otvírají“. Ti, kteří váhají, tak činí často kvůli obavám, aby ve zveřejněných datech nebyly obsaženy osobní údaje. Kontrolu citlivých dat sice může uživatel provést přímo ve vygenerovaném výstupu, objem zpracovávaných informací je však mnohdy tak velký, že je tato kontrola velmi náročná, zdlouhavá a tím pádem neefektivní.

Proto byl OpenData Generátor doplněn volitelným rozšířením, které kontrolu výskytu provede automatizovaně v rámci procesu generování dat na základě uživatelem nastaveného rozsahu kontrol. Využito k tomu bylo jádro našeho nástroje Personal Data and Identity Lookup (PDIL), které na základě integrovaných bází dat dokáže efektivně a s vysokou přesností osobní údaje identifikovat.

Úspěšným příkladem zveřejňování dat jsou opendata portál hlavního města Prahy

Uživatel je s výsledkem kontroly seznámen ještě před jejich případným zveřejněním do opendata portálu nebo jiného cílového umístění. V případě, že jsou identifikovány „podezřelé údaje“, je uživatel informován formou protokolu s nalezenými hodnotami a jejich přesnými místy výskytu v kontrolovaném výstupu.

Kromě řízeného přístupu uživatelů ke generování OpenDat a zapouzdřeným algoritmům jednotlivých datových sad je kontrola osobních údajů dalším krokem, který velmi podstatně zvyšuje bezpečnost a efektivitu tvorby otevřených dat v rámci platformy GINIS.