Using QSAR tools to obtain ecotoxicological data
Pavel Forint1
1Ministerstvo životního prostředí, pavel.forint@mzp.cz
Abstrakt
V případě chemických havárií velkého rozsahu je nutno věnovat pozornost především látkám s akutní toxicitou, které představují bezprostřední environmentální riziko. Pro vyhodnocení následků úniků nebezpečných látek do ŽP a jejich mobilitu je potřeba znát fyzikálně chemické a ekotoxické vlastnosti látek. Především informace o ekotoxických vlastnostech nejsou standardně uváděny v bezpečnostních listech či databázích. Protože nebývá dostatek experimentálních dat, je většinou nutné použití dat náhradních a strategie Evropské unie i OECD tento postup podporují. Z používaných matematických metod získávání dat o fyzikálně chemických a ekotoxických vlastnostech látek nutno zmínit metody statistické analýzy dat QSAR. Rovnice QSAR (z ang. Quantitative Structure-Activity Relationships, kvantitativní vztah mezi chemickou strukturou a biologickou účinností) lze využít pro získání informací o toxických účincích chemických látek a jejich velikosti. Pro účely predikce toxicity určité látky pomocí QSAR existuje řada softwarových nástrojů, komerčních i volně dostupných. Nástroj VegaNIC je neinteraktivní klient pro běh modelů VEGA jako samostatná aplikace na platformě JAVA, která umožňuje spouštět modely VEGA na místním počítači, bez interaktivního rozhraní.
Klíčová slova: havárie, klasifikace, nebezpečné látky
Abstract
In case of large-scale chemical accidents must pay particular attention to the acute toxicity of substances which pose an immediate environmental risk. To evaluate the consequences of releases of hazardous substances into the environment and their mobility is necessary to know the physico-chemical and ecotoxicological properties of substances. First of all, information on ecotoxicity are not normally provided by safety data sheets or databases. Because usually not enough experimental data, it is necessary to use alternative data and strategy of the European Union and OECD support this procedure. The use of mathematical methods for collecting data on physico-chemical and ecotoxicological properties of substances necessary to mention the method of statistical analysis QSAR. QSAR equation (Quantitative Structure-Activity Relationships, quantitative relationship between chemical structure and biological activity) can be used to obtain information on the toxic effects of chemical substances and their size. For the purposes of prediction of the toxicity of a substance using QSAR there are a number of software tools, both commercial and freely available. VegaNIC tool is non-interactive client models running VEGA as standalone application on the Java platform, which allows you to run models VEGA on the local computer with no interactive interface.
Keywords: accidents, classification, hazardous substances
V případě chemických havárií velkého rozsahu je nutno věnovat pozornost především látkám s akutní toxicitou, které představují bezprostřední environmentální riziko [1,2]. Pro vyhodnocení následků úniků nebezpečných látek do ŽP a jejich mobilitu je potřeba znát fyzikálně chemické a ekotoxické vlastnosti látek. Nutnou podmínkou pro korektní odhad následků úniku toxických látek je znalost jejich nebezpečných účinků (působení na organismy) a dále dostupnost jednoznačných kritérií pro využívání toxikologických ukazatelů [3]. Především informace o ekotoxických vlastnostech nejsou standardně uváděny v bezpečnostních listech či databázích. Protože nebývá dostatek experimentálních dat, u méně známých nebezpečných látek by musela být provedena celá řada laboratorních testů, které jsou časově i finančně velmi náročné a navíc vyžadují diskutované používání laboratorních zvířat. Např. pro stanovení NPK je důležité nejprve provést testy akutní toxicity a navíc test detoxikace. Přechodnou kategorií mezi testy akutní a chronické toxicity jsou testy subchronické toxicity, založené na hodnocení fyziologických projevů a růstu s obdržením výsledků v krátké době (během 5 až 7 dní). Shrnutím všech uvedených charakteristik metodik, testů a vlastních testovacích organismů je využití testovacích organismů v následujících bateriích testů: v případě zjišťování ekologického rizika chemických látek a přípravků se používá baterie testů na řasách, perloočkách a rybách, v případě ekotoxicity a vyluhovatelnosti odpadů se používá baterie testů na řasách, semenech hořčice, perloočkách a rybách, v případě odpadních vod se doplňují baterie o stanovení na okřehku. Je proto většinou nutné použití dat náhradních a strategie Evropské unie i OECD tento postup podporují. [4] Z používaných matematických metod získávání dat o fyzikálně chemických a ekotoxických vlastnostech látek nutno zmínit metody statistické analýzy dat QSAR.
Rovnice QSAR (z ang. Quantitative Structure-Activity Relationships, kvantitativní vztah mezi chemickou strukturou a biologickou účinností) lze využít pro získání informací o toxických účincích chemických látek a jejich velikosti, o kinetických procesech, kterým chemické látky v organismu podléhají (absorpce, distribuce, metabolismus, vylučování), o distribuci a osudu chemických látek v životním prostředí a v neposlední řadě i o fyzikálně-chemických vlastnostech látek. [5] Analýza QSAR je analýzou souboru experimentálních údajů o velikosti biologických a fyzikálně - chemických vlastností látek metodami matematické statistiky. Soubor údajů se může týkat série látek strukturně podobných – homologická série, nebo strukturně různorodých – heterogenní série. Čím větší série, tím výhodnější je pro odvození QSAR modelu/rovnice. Rozsah hodnot biologických i fyzikálně chemických vlastností použitých k tvorbě modelu vymezují oblast jeho použitelnosti. Modely QSAR jsou matematické rovnice, jejichž levá strana představuje velikost biologické vlastnosti látky v logaritmickém tvaru, pravá strana představuje velikost vlastností fyzikálně chemických, topologických nebo kvantově chemických indexů (tzv. molekulové deskriptory). Příklady kvantifikovaných biologických aktivit:
MIC - minimální inhibiční koncentrace u antimikrobiálních látek;
LD50 - dávka, při níž zahyne 50 % zvířat z testovacího souboru (vyjadřuje akutní toxicitu);
ED50 - dávka, při níž se sledovaný účinek projeví u 50 % zvířat z testovacího souboru (účinek je sledován kvalitativně: ano-ne);
IC50 - koncentrace látky, která způsobí pokles aktivity enzymu na 50 %;
Ki - konstanta vyjadřující afinitu látky k receptoru;
log BB - logaritmus „rozdělovacího koeficientu“ v soustavě mozek-krev; vyjadřuje schopnost látky pronikat přes hematoencefalickou bariéru.
Klasické parametry mohou být hydrofobní, elektronové, sterické, ostatní - např.: kombinované z více výše zmíněných příspěvků (molární refrakce, parachor a jiné), topologické indexy a další. [6]
Pro účely predikce toxicity určité látky pomocí QSAR existuje řada softwarových nástrojů. Jedním z nich je např. T.E.S.T. (The Toxicity Estimation Software Tool), který byl vyvinut U.S. Environmental Protection Agency, a který umožňuje snadný odhad toxicity za použití škály různých metodik QSAR [7]. Z dalších volně dostupných nástrojů je třeba zmínit freeware EPI SUITE, vydaný rovněž US EPA, a obsahující sadu QSAR modelů pro odhad fyzikálně chemických a ekotoxikologických vlastností chemických látek [8]. Existují rovněž komerční QSAR nástroje. Mezi nejznámější patří MULTI-CASE [9], DEREK Lhasa limited, UK [10] a TOPKAT Accelrys Software Inc., USA [11].
VegaNIC je neinteraktivní klient pro běh modelů VEGA [12]. Je to samostatná aplikace na platformě JAVA, která umožňuje spouštět modely VEGA na místním počítači, bez interaktivního rozhraní. Nabízí možnost snadno spouštět jeden nebo více modelů a generované výsledky lokálně uložit. V současné době VegaNIC obsahuje 16 modelů, uvedených v tabulce 1 spolu s uvedením jejich původu.
Původ modelu | Model * verze ve vývoji |
CAESAR [13] | BCF - biokoncentrační faktor |
Mutagenita | |
Karcinogenita | |
Vývojová toxicita | |
Senzibilizace kůže | |
T.E.S.T. EPA Software [14] | Střevle LC50 (96h) |
Daphnia magna LC50 (48h) | |
DEMETRA [15] | Daphnia magna LC50 (48h) * |
ToxTree [16] | Benigni / Bossa pravidlo pro karcinogenitu |
Benigni / Bossa sada pravidel pro mutagenitu | |
SARpy Vega [17] | Mutagenita * |
Biodegradabilita * | |
Istituto di Ricerche Farmacologiche Mario Negri Milano [18] | LogP predikce |
BCF read-across | |
BCF (Meylanův model) | |
LC50 klasifikace pro ryby * |
Tab. 1: Přehled modelů nástroje VegaNIC
Pomocí VEGA můžeme přistupovat k sérii QSAR modelů pro regulační účely, nebo vytvořit svůj vlastní model pro výzkumné účely. Modely byly převzaty ze softwarů CAESAR[1] nebo T.E.S.T.[2], nebo byly vyvinuty v rámci VEGA. Modely mohou být použity k predikci vlastností chemické látky na základě informací o její struktuře. Modely QSAR pro regulatorní účely byly optimalizovány v souladu s požadavky nařízení REACH [19].
Ve srovnání s mnoha existujícími modely QSAR je kladen větší důraz na to, aby modely poskytovaly transparentní, srozumitelné, reprodukovatelné a ověřitelné výsledky. Proto byla řada nástrojů optimalizována, což příznivě ovlivnilo výsledky získané pro cílové chemické látky i výsledky získané pro strukturně podobné sloučeniny. Nástroje proto také poskytují reprodukovatelný postup read-across. Read-across je postup pro extrahování požadovaných hodnot pro cílovou sloučeninu na základě známých hodnot pro strukturně podobné látky.
V programu VEGA toho bylo dosaženo implementací algoritmů, které jsou nezávislé na QSAR modelech, a které umožňují screening podobných sloučenin postupem read-across. Tyto algoritmy se používají jak k identifikaci podobných sloučenin a analýze vlivu deskriptorů a fragmentů, tak i pro cílové chemické látky a jim podobné sloučeniny. Z tohoto důvodu je také možné použít VEGA samostatně pro read-across. Pro toto omezenější použití je třeba postupovat stejně jako pro postup predikce, ale následně ignorovat predikovanou hodnotu, a místo toho jednoduše analyzovat podobné sloučeniny na bázi chemometrické a podobné sloučeniny identifikované na základě mechanismů a deskriptorů. Tímto způsobem je možno analyzovat a posoudit podobnosti mezi cílovou chemickou látkou a příbuznými látkami. [20]
V prostředí VegaNIC byl aplikován model 96 hour fathead minnow LC50 na skupinu látek, které byly nově zařazeny jako vyjmenované do přílohy I směrnice Seveso III [1]. Jedná se o látky uvedené v tabulce 2.
Poř. č. | Látka | CAS | Smile |
1 | Anhydrous Ammonia | 7664-41-7 | N |
2 | Boron trifluoride | 7637-07-2 | FB(F)F |
3 | Hydrogen sulphide | 7783-06-4 | [H]S[H] |
4 | Piperidine | 110-89-4 | C1CCNCC1 |
5 | Bis(2-dimethylaminoethyl)(methyl)amine | 3030-47-5 | CN(C)CCN(C)CCN(C)C |
6 | 3-(2-Ethylhexyloxy)propylamine | 5397-31-9 | CCCCC(CC)COCCCN |
7 | Propylamine | 107-10-8 | CCCN |
8 | Tert-butyl acrylate | 1663-39-4 | CC(C)(C)OC(=O)C=C |
9 | 2-Methyl-3-butenenitrile | 16529-56-9 | N#CC(C)C=C |
10 | Tetrahydro-3,5-dimethyl-1,3,5,-thiadiazine-2-thione (Dazomet) | 533-74-4 | CN1CN(C(=S)SC1)C |
11 | Methyl acrylate | 96-33-3 | C=CC(OC)=O |
12 | 3-Methylpyridine | 108-99-6 | CC1=CN=CC=C1 |
13 | 1-Bromo-3-chloropropane | 109-70-6 | ClCCCBr |
Tab 2. Látky nově zařazené do Přílohy I směrnice Seveso III
V tabulce 3 jsou uvedeny výsledky predikce LC50 96h [-log (mol/l)] pro vybraných 13 látek a hodnocení spolehlivosti modelů.
Celkově z tohoto souboru 13 látek pět vykázalo nízkou spolehlivost modelu, pět střední a tři vysokou spolehlivost modelu.
Z analyzovaných látek byly pro dvě z nich (propylamin a 3-methylpyridin) k dispozici experimentální data; oba vypočtené výsledky vykazují minimální odchylku od experimentální hodnoty – viz tabulka 4.
Poř. č. | Predikce | Hodnocení modelu | Experimentální data | Směrodatná odchylka |
1 | 1,03 | nízká spolehlivost | ||
2 | 2,52 | nízká spolehlivost | ||
3 | 1,26 | nízká spolehlivost | ||
4 | 2,29 | střední spolehlivost | ||
5 | 1,51 | střední spolehlivost | ||
6 | 3,75 | vysoká spolehlivost | ||
7 | 2,12 | vysoká spolehlivost | 2,28 | 0,11313 |
8 | 3,48 | střední spolehlivost | ||
9 | 3,84 | střední spolehlivost | ||
10 | 3,23 | nízká spolehlivost | ||
11 | 2,70 | nízká spolehlivost | ||
12 | 2,74 | vysoká spolehlivost | 2,81 | 0,04949 |
13 | 3,33 | střední spolehlivost |
Tab. 3: Souhrn predikcí modelu Fathead Minnow LC50 96h [-log (mol/l)]
Sloučenina | propylamin | 3-methylpyridin |
Experimentální hodnota | 2.28 [-log (mol/l)] | 2.81 [-log (mol/l)] |
Predikce | 2.12 [-log (mol/l)] | 2.74 [-log (mol/l)] |
Predikce | 448.36 [mg/l] | 170.22 [mg/l] |
Experimentální hodnota | 308.24 [mg/l] | 143.8 [mg/l] |
Molekulová váha | 58.73 | 92.85 |
Spolehlivost modelu | Látka je v oblasti spolehlivosti | Látka je v oblasti spolehlivosti |
Tab. 4: Hodnocení modelu Fathead Minnow LC50 96h pro propylamin a 3-methylpyridin
Jako další z modelů nástroje VegaNIC byl použit model BCF - biokoncentrační faktor. Tento model poskytuje kvantitativní predikce biokoncentračního faktoru (BCF) u ryb, uvedené
v log (L/kg). Model byl aplikován na látku propylamin (CAS 107-10-8). Výsledky jsou uvedeny v tabulce 5.
Experimentální hodnota | - |
Predikce | 0.18 [log (L/kg)] |
Predikce | 2 [L/kg] |
Predikce modeul 1 (HM) | 0.2 [log (L/kg)] |
Predikce modelu 2 (GA) | 0.44 [log (L/kg)] |
Strukturální alerty | NH2 group (PG 07) |
Vypočtená LogP | 0.35 [log units] |
Spolehlivost | Látka je mimo oblast spolehlivosti modelu |
Poznámka k predikci | není |
Tab. 5: Výsledky predikce a analýzy oblasti použitelnosti modelu BCF
Hodnocení modelu: predikce je logBCF = 0,18, ale výsledek může být nespolehlivý.
Byly nalezeny pouze mírně podobné látky se známými experimentálními hodnotami v tréninkové sadě. Deskriptory této sloučeniny mají hodnoty mimo rozsah sloučenin tréninkové sady, jak je patrné z níže uvedených diagramů.
Na obr. 1 je uvedena analýza deskriptoru LogP, který je v přímé korelaci s hodnotou logBCF. Diagram MLogP proti hodnotám odezvy: experimentální hodnoty jsou uvedeny pro tréninkovou množinu, predikovaná hodnota pro testované látky. Světle modré tečky představují hodnoty látek z tréninkové sady, červená tečka je hodnota zkoumané látky.
Obr. 1: Diagram MLogP proti hodnotám odezvy
Na obrázku 2 je uveden diagram MLogP proti hodnotám odezvy pouze tří nejpodobnějších látek v tréninkové sadě. Červená tečka je hodnota sledované sloučeniny, černé kruhy představují experimentální hodnoty sloučenin z tréninkové sady, černé tečky představují predikovanou hodnotu stejné sloučeniny, velikost kruhu je úměrná podobnosti zkoumané sloučeniny.
Obr. 2
Nasazení nástroje VegaNIC představuje další významný krok v oblasti použití QSAR pro získávání dat o fyzikálně chemických a ekotoxických vlastnostech látek pro účely regulační i výzkumné. Použití vyžaduje pečlivé hodnocení spolehlivosti modelů a správnou interpretaci výsledků pro studované sloučeniny.
[1] Směrnice Rady 96/82/ES ze dne 9. prosince 1996 o kontrole nebezpečí závažných havárií s přítomností nebezpečných látek.
[2] Směrnice Evropského Parlamentu a Rady 2012/18/EU ze dne 4. července 2012 o kontrole nebezpečí závažných havárií s přítomností nebezpečných látek a o změně a následném zrušení směrnice Rady 96/82/ES.
[3] Nařízení Evropského parlamentu a Rady (ES) č. 1272/2008 ze dne 16. prosince 2008 o klasifikaci, označování a balení látek a směsí, o změně a zrušení směrnic 67/548/EHS a 1999/45/ES a o změně nařízení (ES) č. 1907/2006 (Text s významem pro EHP).
[4] OECD Environment Health and Safety Publications, Series on Testing and Assessment No. 69 : Guidance Document on the Validation of (Quantitative) Structure-Activity Relationship :QSAR Models. Paris : Environment Directorate ORGANISATION FOR ECONOMIC CO-OPERATION AND DEVELOPMENT, 2007.
[5] HANSCH, C. …[et al.]. Correlation of Biological Activity of Phenoxyacetic Acids with Hammett Substituent Constants and Partition Coefficients. Nature, 1962, 194, pp. 178-180.
[6] TICHÝ, M. Predikční toxikologie [online]. Státní zdravotní ústav, 14. březen 2008. Dostupný z WWW: <http://www.szu.cz/tema/pracovni-prostredi/predikcni-toxikologie#article >.
[7] EPA. Quantitative Structure Activity Relationship [online]. EPA. Dostupný z WWW: <http://www.epa.gov/nrmrl/std/qsar/qsar.html >.
[8] EPA. Estimation Program Interface (EPI) Suite [online]. EPA, c2000-2012. Dostupný z WWW: <http://www.epa.gov/oppt/exposure/pubs/episuite.htm >.
[9] Multicase Inc Software [online]. MultiCASE, Last modified: 02/13/13. Dostupný z WWW: <http://www.multicase.com>.
[10] DEREK Lhasa [online]. Dostupný z WWW: <https://www.lhasalimited.org/derek_nexus>.
[11] Laboratory of Mathematical Chemistry [online]. c2013. Dostupný z WWW: <http://www.oasis-lmc.org>.
[12] VEGA [online]. Milano : Istituto di Ricerche Farmacologiche Mario Negri. Dostupný z WWW: < http://www.vega-qsar.eu/index.php>.
[13] CAESAR : Conmputer Assisted Evaluation of Industrial Chemical Substances according to Regulations [online]. Milano : Istituto di Ricerche Farmacologiche Mario Negri. Dostupný z WWW: <www.caesar-project.eu>.
[14] QSARs [online]. U.S. EPA. Dostupný z WWW: <www.epa.gov/nrmrl/std/cppb/qsar>.
[15] DEMETRA : Development of Environmental Modules for Evaluation of Toxicity of pesticide Residues in Agriculture [online]. Dostupný z WWW: <www.demetra-tox.net>.
[16] Toxtree [online]. Ideaconsult, Last Published: 2013-07-10. Dostupný z WWW: <www.toxtree.sourceforge.net>.
[17] SARpy : User’s Manual [online]. Dostupný z WWW: <ftp://ftp.elet.polimi.it/users/Giuseppina.Gini/SARpy_v1.0/SARpy%20Manual-3.doc>.
[18] Istituto di Ricerche Farmacologiche Mario Negri [online]. Milano, Ultimo aggiornamento: 28 agosto 2013. Dostupný z WWW: <http://www.marionegri.it/mn/it/index.html>.
[19] Nařízení Evropského Parlamentu a Rady (ES) č. 1907/2006 ze dne 18. prosince 2006 o registraci, hodnocení, povolování a omezování chemických látek, o zřízení Evropské agentury pro chemické látky, o změně směrnice 1999/45/ES a o zrušení nařízení Rady (EHS) č. 793/93, nařízení Komise (ES) č. 1488/94, směrnice Rady 76/769/EHS a směrnic Komise 91/155/EHS, 93/67/EHS, 93/105/ES a 2000/21/ES.
Vzorová citace
FORINT, Pavel. Použití nástrojů QSAR k získávání ekotoxikologických dat. Časopis výzkumu a aplikací v profesionální bezpečnosti [online], 2013, roč. 6, č. 2. Dostupný z WWW: <http://www.bozpinfo.cz/josra/josra-02-2013/nastroje-qsar.html>. ISSN 1803-3687.
[1] Caesar - projekt financovaný z fondů ES (Projekt č. 022674 SSPI), speciálně věnován vývoji modelů QSAR pro nařízení REACH.
[2] T.E.S.T. (The Toxicity Estimation Software Tool) - software, který byl vyvinut U.S. Environmetal Protection Agency a umožňuje snadný odhad toxicity za použití škály metodik QSAR.