Informační systémy pro data o životním prostředí (a zdraví) E-2000, seminář č.6, 27.března 2024 Ing. Kateřina Šebková, Ph.D, Richard Hůlek, Jana Borůvková, Jiří Kalina a další kolegyně a kolegové z výzkumné infrastruktury RECETOX - datové služby Kde/v kterých databázích byste hledali data o kvalitě životního prostředí? Podle čeho byste hledali? Kdo databáze spravuje a proč? Příklady? Sledování kvality prostředí a zdraví cíl monitoringu (ochrana zdraví nebo ŽP, plnění legislativy - EU nebo globální - rozdíly) výběr látek, které sledujeme (velkoobjemová výroba, chemické vlastnosti perzistence, toxicita, PBT…, politická prioritizace) kde sledujeme (podle zdrojů, fyzikálně chemických vlastností látek, expozičních cest) působení látek na člověka - externí vs. interní (propojení expozice a zdraví, které tkáně jsou důležité) dostupnost vzorkovacích a analytických metod, jejich omezení/variabilita/přesnost hodnocení rizik a modelování (dostupnost dat, náklady na monitoring) propojení stavu životního prostředí a kvality zdraví - externí i interní expozice (plnění cílů, strategií, politik či legislativních závazků) Sledování kvality prostředí a zdraví - možnosti se velmi liší Mezinárodní úmluvy - globální monitorovací plány a programy - cíl: ochrana životního prostředí a zdraví mezinárodní monitorovací programy - jednotný způsob sběru informací (porovnatelnost sad dat, protože harmonizace = všichni dělají stejně) EU - Evropská iniciativa k lidskému biomonitoringu (HBM4EU) - pokus o jednotné nastavení na EU úrovni národní úroveň - různé na úrovni jednotlivých institucí - podle zadání/legislativy/zaměření instituce = veliká různorodost a potíže při zpracovávání dat z různých zdrojů. Role vědy v procesu zpřístupňování dat je významná (a nezastupitelná?) např. FAIR a EOSC Příklady Kde se informace se o látkách v prostředí sbírají? “všechno” versus “je třeba si vybrat” - náklady podle zadání volíme “co” a “kde” tj. indikátor matrici Článek 16 • ukládá vyhodnotit změnu - jak se mění stav životního prostředí globálně (znečištění POPs) v čase: • zda se od posledního sledování odstranily či snížily úniky POPs z výroby a použití, z nezáměrné výroby a z nespotřebovaných odpadních zásob a odpadů • informace musejí být harmonizované, porovnatelné a validované = požadavky na globální sledování POPs = celosvětový monitoring Zadání: Vyhodnocování účinnosti (Stockholmské) úmluvy (čl.16) příklad globálního postupu vedoucí k sadám dat …. a databázi Kde a co? Skupina expertů/vědců připravila jednotné POKYNY: první verze Guidance Document on the Global Monitoring Plan for POPs (2007) (UNEP/POPS/COP.3/INF/14) - pravidelně se aktualizuje, nejnovější UNEP/POPS/COP.9/INF/36 Technické návody ohledně Sběru-nastavení monitorovací sítě, vzorkování, chemického zpracování/analýz, a zpracování data a informací - úložiště, databáze, statistika - reaguje na požadavky ve článku 16 = zajišťuje sjednocení postupů, abychom mohli připravit výsledné zprávy a vyhodnotit trendy = zvyšuje srovnatelnost a soudržnost/platnost dat pro hodnocení účinnosti úmluvy příklad globálního postupu vedoucí k databázi • ochrana ŽP a zdraví (cíl úmluvy) • Pozaďové lokality • změna v čase - frekvence sledování • hlavní matrice (3) volné ovzduší mateřské mléko/krev (WHO - spolupráce) voda (jen PFOs) - využití již existujících nástrojů/programů! V případě, že nejsou, doplňují se: - POKYNY k vzorkování - Standardní operační postupy - harmonizace, sladění, opakovatelnost, snižování chyb Sledování POPs v prostředí/POPs monitoring příklad globálního postupu vedoucí k databázi Jak se informace o látkách sbírají? WEOG GRULAC Africa CEEC Asia and Pacific aktivní vzorkování: volné ovzduší high volume active sampler PS1 Thermo and Digitel DH-77 (2011) active sampling in Czech Republic (10/1988) low volume active sampler MVS-6 (Sven-Leckel) - active sampling in Africa Ghana and Kenya since 2014 Jak se informace o látkách sbírají? WEOG GRULAC Africa CEEC Asia and Pacific PUF = polyurethane foam Sběr vzorku mateřského mléka • dle protokolu WHO (2007) • odevzdává se směsný vzorek = 50 individuálních (matka prvorodička, 1 dítě)/ na 10 mil lidí • vzorek se analyzuje v Německu - CVUA, Freiburg (protokol studie) • 1x za 5 let • data v … excelu?, v instituci? publikace ve vědeckých časopisech (zpoždění)… bezpečnost/citlivost údajů, ale také aktualizace/opravy dat… • hodnota/význam monitoringu s časem roste (nejen prostředky vynaloženými, ale množstvím informací, jež získáme a můžeme využít) WHO/UNEP monitoring of human milk pooled samples Jak se informace o látkách sbírají? WEOG GRULAC Africa CEEC Asia and Pacific pasivní vzorkování: voda PCB 153 Concentration[ng.g-1offat] Year of monitoring 0 100 200 300 400 500 1994 1996 1998 2000 2002 2005 2007 2009 0 100 200 300 400 500 1994 1996 1998 2000 2002 2005 2007 2009 75 th percentile 25 th percentile median 75 th percentile 25 th percentile median y = 254.7 - 7.7*x HCB Concentration[ng.g-1offat] Year of monitoring 0 200 400 600 800 1994 1996 1998 2000 2002 2005 2007 2009 0 200 400 600 800 1994 1996 1998 2000 2002 2005 2007 2009 75 th percentile 25 th percentile median 75 th percentile 25 th percentile median y = 328.7 – 23.2*x Long-term monitoring of human milk in the Czech RepublicDlouhodobý monitoring mateřského mléka v ČR (1) individuální vzorky věk matky výška, váha (BMI) povolání kouření užívání léků strava/konzumace ryb délka kojení 0 200 400 600 1994 1996 1998 2000 2002 2005 2007 2009 Concentration[ng.g-1offat] Year of monitoring 0 200 400 600 800 1000 1994 1996 1998 2000 2002 2005 2007 2009 Concentration[ng.g-1offat] Year of monitoring Age specific comparisonfor the oldest and youngest mothers Age up to 19 y. Age ≥ 35 y. Age up to 19 y. Age ≥ 35 y. Age up to 19 y. Age ≥ 35 y. Age up to 19 y. Age ≥ 35 y. HCBPCB 153 PCB 153 Concentration[ng.g-1offat] Year of monitoring 0 100 200 300 400 500 1994 1996 1998 2000 2002 2005 2007 2009 0 100 200 300 400 500 1994 1996 1998 2000 2002 2005 2007 2009 75 th percentile 25 th percentile median 75 th percentile 25 th percentile median y = 254.7 - 7.7*x HCB Concentration[ng.g-1offat] Year of monitoring 0 200 400 600 800 1994 1996 1998 2000 2002 2005 2007 2009 0 200 400 600 800 1994 1996 1998 2000 2002 2005 2007 2009 75 th percentile 25 th percentile median 75 th percentile 25 th percentile median y = 328.7 – 23.2*x Long-term monitoring of human milk in the Czech RepublicDlouhodobý monitoring mateřského mléka v ČR (2) individuální vzorky + porovnání expozice/věk matky 0 200 400 600 1994 1996 1998 2000 2002 2005 2007 2009 Concentration[ng.g-1offat] Year of monitoring 0 200 400 600 800 1000 1994 1996 1998 2000 2002 2005 2007 2009 Concentration[ng.g-1offat] Year of monitoring Age specific comparisonfor the oldest and youngest mothers Age up to 19 y. Age ≥ 35 y. Age up to 19 y. Age ≥ 35 y. Age up to 19 y. Age ≥ 35 y. Age up to 19 y. Age ≥ 35 y. HCBPCB 153 PCB 153 Concentration[ng.g-1offat] Year of monitoring 0 100 200 300 400 500 1994 1996 1998 2000 2002 2005 2007 2009 0 100 200 300 400 500 1994 1996 1998 2000 2002 2005 2007 2009 75 th percentile 25 th percentile median 75 th percentile 25 th percentile median y = 254.7 - 7.7*x HCB Concentration[ng.g-1offat] Year of monitoring 0 200 400 600 800 1994 1996 1998 2000 2002 2005 2007 2009 0 200 400 600 800 1994 1996 1998 2000 2002 2005 2007 2009 75 th percentile 25 th percentile median 75 th percentile 25 th percentile median y = 328.7 – 23.2*x Long-term monitoring of human milk in the Czech Republic RISK = 1 - exp (-CDI * SF) MOTHER DIET (CDI) Chronic Daily Intake in/exhalation outflux MILK Backward calculation of CDI Biomonitoring Human Health RISK Assessment Model for accumulation of POPs (Trapp et al. 2008) Dlouhodobý monitoring - interpretace dat/výsledků modely, zdravotní rizika, chronická denní dávka ̶Oficiální nástroj Stockholmské úmluvy ̶Specifické zaměření (matrice, chemické látky, typ lokalit) ̶Pouze agregovaná data – nižší „rozlišení“ ̶Striktní proces sběru a validace ̶Definovaný životní cyklus 6-ti letých kampaní sběru dat ̶ ale hlavně MADE and OPERATED BY RECETOX! Kde se můžu podívat na data Stockholmské úmluvy? = GMP Data Warehouse www.pops-gmp.org Informační a databázové systémy 
 pro podporu monitorovacích aktivit Jak se tvoří a jak vypadají? anebo od datových sad k databázi a vizualizacím Životní cyklus DATABÁZOVÉHO SYSTÉMU: ̶Sběr dat z různých zdrojů ̶Harmonizace datových sad ̶Sdílení výsledků ̶Srozumitelná prezentace Informační a databázové systémy 
 pro podporu monitorovacích aktivit Příklad: Sběr dat – kampaně v rámci GMP Stockholmské úmluvy GMP 1 GMP 2 GMP 3 ̶ 5 globálních regionů (ROG) ̶ 35 monitorovacích sítí ̶ 4 matrice ̶ 120 parametrů ̶ 110 zemí ̶ 633 lokalit + mořské plavby Sběr – zdroje dat 
 v rámci GMP Cíl: identifikace trendů koncentrací chem. látek • Matrice: Vzduch – aktivní monitoring • Chemická látka: suma 6PCB • Lokalita: Košetice EMEP Zdroj: GMP2 CEE Monitoring Report 
 http://www.pops.int/Implementation/GlobalMonitoringPlan/MonitoringReports/tabid/525/Default.aspx Mapa trendů – srovnání lokalit • Matrice: Vzduch • Chemická látka: HCB Legenda: • Zelená – klesající trend • Červená – rostoucí trend • Modrá – statisticky nevýznamný trend • Šedá – Trend nelze detekovat GMP DWH má dvě části GMP DWH Data Management Console https://dmc.pops-gmp.org authorized access for experts only at the moment of data imports (next in 2025-6) GMP DWH Data Visualizations https://www.pops-gmp.org once approved by ROG experts and officially released, then available 24/7 Everyone can browse GMP DWH: Data Management Console • Webová aplikace • Autentizace oprávněných uživatelů • Pro: Poskytovatele dat, data manažery, členy regionálních skupin, sekretariát • Dávkové importy dat • Automatické validace • Správa metadat • Databáze propojená s vizualizacemi ̶Sjednocení postupů při měření a chemické analýze ̶Metadatový popis získání dat ̶Definice minimální datové věty (povinné metadatové prvky) ̶Ontologie – mapování číselníků a deskriptorů Harmonizace dat I. ̶Identifikace překryvů v datových sadách z různých zdrojů ̶Korekce již nahlášených dat ̶Sjednocení metodických postupů ̶ Agregace dat ̶ Algoritmy pro identifikaci a kvantifikaci trendů Harmonizace dat II. ̶Geografické rozložení vzorkovacích míst ̶Dostupnost dat ̶ V čase – od kdy do kdy a v jakých intervalech ̶ Pro jednotlivé chemické látky ̶ Pro jednotlivé lokality ̶Sumární statistika ̶Identifikace a kvalifikace trendů Prezentace dat - vizualizace/portál Ukázka - prohlížeč dat: www.pops-gmp.org ̶navštívit https://www.pops-gmp.org/background.html ̶přečíst si Background a vizualizace a vypsat si klíčové body, k čemu web je (10 minut) Skupinový úkol ̶navštívit https://www.pops-gmp.org/background.html ̶přečíst si Background a vizualizace a vypsat si klíčové body, k čemu web je (10 minut) ̶společná kontrola klíčových bodů ̶konkrétní zadání a) nejdelší časová řada POPs na vzduchy, pro kterou látku/parametr to je? b) kolik sítí dává data z mateřského mléka a která je nejdelší datová řada? (která země)? c) jaká je nejvyšší a nejnižší koncentrace PCB 118 v Kanadě a jak se mění v čase? d) pro matrici voda najděte stanici s klesajícím trendem PFOA e) jaké jsou parametry stanice na Antarktidě? Které matrice/informace z ní získáváme? Skupinový úkol GMP DWH Data Visualizations FORMAT: 5 typů modulů • Spatial distribution • Data availability • Summary statistics • Trend analysis • Data exports Obsah 4 hlavní matrice 30 listed chemicals (POPs) 314 chemical parameters 111 monitorovací sítě/projekty 126 států 779 vzorkovacích míst + celkem 1159 míst pro vodu a oceánské plavby data v období: 1967-2021/2Spatial Distribution Module https://data.pops-gmp.org/2020/all/#/gmp3/spatial-distribution Data Availability Module Data Availability Module - time series - chemical parameter - matrices on site - parameters on site in time Summary Statistics Module - srovnání více míst Summary Statistics Module multiple sites or single site (per parameter) Trend analysis Trend analysis multiple sites in map, detail on a site Trend analysis module single site, trend characteristics and description GMP DWH pro politiky - nové mapy and grafy GMP DWH Visualizations Trend analysis - Regional Summaries GMP DWH Data Visualizations trend in maps and trend exports trend maps and charts are shown in several regional POPs monitoring reports and in the global one, too ̶Oficiální nástroj Stockholmské úmluvy ̶Specifické zaměření (matrice, chemické látky, typ lokalit) ̶Pouze agregovaná data – nižší „rozlišení“ ̶Striktní proces sběru a validace ̶Definovaný životní cyklus 6-ti letých kampaní sběru dat VÝSLEDEK = GMP Data Warehouse www.pops-gmp.org • visualization available 24/7 online free of charge to all stakeholders and the broad public • core matrices of the Stockholm Convention on POPs (air, human tissues, water) • fully harmonized data and information structure • POPs data format: annually aggregated concentrations • largest pool of global POPs data available on one place • user-friendly access • GMP DWH updates defined by the Stockholm Convention - 6 year interval • current content up to third regional reports (GMP3) - the latest information is 2022, the “oldest” data are 1960s or 1980s, depending on a matrix and a chemical. Summary of the GMP data warehouse visualizations https://www.pops-gmp.org Mezinárodní úmluvy - globální monitorovací plány a programy - cíl: ochrana životního prostředí a zdraví - účel: chceme vědět, zda přijatá globální opatření/omezení/zákazy fungují a prostředí a zdraví lépe chráníme (je tam méně zakázaných látek) - chceme znát stav a změny v čase EU - Evropská iniciativa k lidskému biomonitoringu (HBM4EU) - chceme harmonizace postupů a srovnatelnost dat a doplnit chybějící data - pro jednotnou interpretaci na úrovni EU, použití při hodnocení rizik národní úroveň - mnoho zapojených institucí a orgánů - národní legislativa, odpovědné instituce, inspekce Umíme/víme jak interpretovat data z různých zdrojů, či jak je alespoň současně zobrazit? Jsou vůbec veřejně dostupná? Jak? jsme ve 21.století - “text mining”, image mining, big data, AI - ale také tlaky na open science, FAIR data a v souladu s “právo na informace produkované za peníze daňových poplatníků” necílená analýza (NTS), směsi, jak vůbec data zpracovávat, máme dost výkonné počítače - jeden výsledek NTS se počítá dny/týdny? ROLE VĚDY JE NEZASTUPITELNÁ : POMÁHÁME SDÍLET, POROZUMĚT A ZNÁT. Shrnutí - současné výzvy u databázových systémů Máte otázky k dnešnímu tématu? Děkuji za pozornost!