Kvantitatiivne struktuur-aktiivsussõltuvus

(Ümber suunatud leheküljelt Kvantitatiivne struktuur-aktiivsus sõltuvus)

Kvantitatiivne struktuuri-aktiivsuse/omaduse sõltuvus on mudel (QSAR või QSPR), mis seob omavahel suures andmekogumis aine

QSAR-mudeli loomise skeem

füsikokeemilise omaduse või bioloogilise aktiivsuse ja aine keemilise struktuuri. Korrektselt loodud QSAR-mudel võimaldab ennustada uute, seni mõõtmata keemiliste ühendite omadusi ja aktiivsusi.[1][2]

QSAR matemaatiline kuju avaldub:

Ajalugu

muuda

Üks esimesi struktuuraktiivsussuhte avastajaid oli A. F. A. Cros, kes 1863. aastal leidis seose primaarsete alifaatsete alkoholide toksilisuse ja nende vees lahustumise vahel. Aastatel 1868–1849 postuleerisid teadlased A. Crum-Brown ja T. R. Fraser seose aine keemilise ehituse ja füsioloogilise mõju vahel. Aastal 1893 avastas M. C. Richet lineaarse korrelatsiooni lihtsamate orgaaniliste molekulide ja nende toksiliste omaduste vahel. Mõni aasta hiljem avastasid H. Meyer ja C. E. Overton lineaarse korrelatsiooni ka orgaaniliste molekulide lipofiilsuse ja bioloogilise efekti vahel. Tänapäevaste (kvantkeemilistel arvutusi kasutavate) QSAR-mudelite väljatöötajaks peetakse keemikut C. H. Hanchi, kes arendas QSAR-mudeli, mille avaldamisel sai lõpu 15 aastat kestnud taimede kasvuregulaatorite struktuuri ja aktiivsuse suhte otsingutele.[2][3]

Mudeli loomine

muuda

QSAR-mudeli loomine algab suure hulga keemiliste ühendite (tavaliselt vähemalt 25 ühendi) bioloogiliste aktiivsuste kogumisest, ehk mudeli treeninguseeria loomisest. Aktiivsuste saamiseks tehakse kas laboratoorseid mõõtmisi ja/või kogutakse andmed kirjandusest. Kogutud ainete aktiivsuste juures on väga oluline uurida ka teostatud mõõtmiste määramatust ja keskkonda, kus mõõtmised sooritati, sest suure määramatuse korral on ka QSAR-mudel ebatäpne. Keskkond on oluline, kuna ained võivad reageerida ja toimida eri keskkondades erinevalt.[1][2]

Kui eelnevad sammud on tehtud, arvutatakse igale ainele nende struktuuri kirjeldavad parameetrid ehk deskriptorid. Ainele vastavate deskriptorite saamiseks joonistatakse tänapäeval üles aine struktuur ja tehakse sellele kvantkeemilisi meetodeid kasutades geomeetria optimeerimine, leidmaks ühendi termodünaamiliselt kõige stabiilsemat vormi. Deskriptoriteks on näiteks aatomite hulk ühendis, ühendi energia, ühendi mõõtmed jne.[1]

Kui deskriptorid on arvutatud ja bioloogilised omadused mõõdetud/kogutud, hakatakse neid modelleerima erinevatest statistilistest võrranditest lähtuvalt. Statistiliste meetoditena on laialdaselt kasutusel näiteks multilineaarne regressioon (MLR) ja osaline vähimruudu meetod (PLS). Tulemuseks saadakse sõltuvus bioloogilise aktiivsuse ja seda kirjeldavate struktuurist tulenevate parameetrite vahel.[1][3]

Mudelite tüübid

muuda

Ühedimensionaalsed mudelid

muuda

Ühedimensionaalsed QSAR-mudelid olid ühed esimesed, mis kasutusele võeti. Mudelis kasutatavad deskriptorid põhinevad keemilise ühendi molekul valemil. Kvantkeemilisi ja poolempiirilisi meetodeid kasutades arvutatakse näiteks kogu aatomi tuumalaeng, jaotuskoefitsient või madalaima okupeerimata molekulaarorbitaali (LUMO) energia ja kõrgeima okupeeritud molekulaarorbitaali (HOMO) energia.[4]

Multidimensionaalsed mudelid

muuda

Multidimensionaalsed QSAR-mudelid on tänapäevalt kõige laialdasemalt kasutust leidvad mudelid. Levinud on molekuli kahemõõtmelisel struktuuril ja kolmemõõtmelisel struktuuril põhinevad mudelid. Nende populaarsus peitub meetodi lihtsuses võrreldes traditsiooniliste struktuuraktiivsussõltuvustega. Multidimensionaalsete deskriptorite aluseks on keemilise ühendi struktuuri defineerimine, millele tehakse energia minimeerimise arvutused, kasutades selleks poolempiirilisi, molekulaarmehaanilisi või kvantmehaanilisi meetodeid. Seejärel arvutatakse ühendi struktuurist tulenevad deskriptorid, mis võivad olla konstitutsioonilised, topoloogilised ja kvantkeemilised.[4]

Konstitutsioonilised deskriptorid defineerivad keemilise ühendi loomupäraseid omadusi, jättes kõrvale ühendi geomeetria ja seotuse. Deskriptoriteks on molekulmass, aatomite arv ühendis, süsinike arv ühendis, vesinike arv ühendis jne.[4]

Topoloogilised deskriptorid defineerivad keemilises ühendis olevad asetused, näiteks keemilise sideme paiknemine, molekulaarne suurus ja kuju. Lisaks saab defineerida ka hargnemised ja heteroaatomite esinemise keemilises ühendis.[4]

Kvantkeemilised deskriptorid põhinevad kvantkeemilistel arvutustel, mille kaudu saadakse leida molekulide elektroonseid ja geomeetrilisi omadusi. Kvantkeemilised arvutused jätavad üldjuhul arvestamata solvendist tulenevad efektid, kuna enamik arvutusi tehakse gaasifaasilises taustsüsteemis. Põhiliselt kasutatavad kvantkeemilised deskriptorid on aatomlaengud, dipoolmomendid ja molekulaarne polariseeritavus.[4]

Fragmentidel põhinevad mudelid

muuda

Fragment- või ka grupipõhised QSAR-mudeleid on hakatud looma ravimi modifitseerimise suure arengu tõttu. Fragmendil põhinevad QSAR-mudelid annavad võrreldes teiste QSAR-mudelitega ühe olulise eelise. Terve ühendi asemel saab ennustada selle väiksemate fragmentide aktiivsusi või omadusi ning teades fragmentide aktiivsusi ja omadusi on võimalus fragmente vahetades luua efektiivsemaid ravimimolekule. Lisaks pole mudeli loomiseks alati vajadust teada ühendi kolmemõõtmelist struktuuri, mida teatud olukordades on raske defineerida või leida keemiliste ühendite andmebaasidest.[5]

Mudeli valideerimine

muuda

QSAR-mudeli valideerimine on üks olulisemaid samme QSAR-mudeli valmimisel. Selle käigus hinnatakse nii mudeli kasutusala kui ka ennustusvõimet. Hea mudeli omadusteks on tema robustsus (lai kasutusvaldkond eri tüüpi ainetele) ja statistiline korrektsus, võimalus ennustada ainete bioloogilisi aktiivsusi, mida mudeli loomisel ei kasutatud, ja kindla määramispiirkonna olemasolu, kus antud mudel on kasutatav. Kõige lihtsamad sõltuvuse olemasolu näitavad parameetrid on korrelatsioonikoefitsiendi ruut (R2), jääkliikmete standardhälve ja ennustav ruutkorrelatsiooni koefitsient Q2 (mis avaldub ennustatud väärtuste ja mõõdetud väärtuste suhtena). Valideerimiseks on kasutusel kaks meetodit: mudelisisene valideerimine ja väline valideerimine.[1]

Mudelisisese valideerimise puhul kasutatakse kahte meetodit. Esimese puhul jäetakse välja üks punkt ja teise puhul jäetakse välja kindel punktide kogum. Esimese meetodi puhul moodustatakse allesjäänud punktidest korrelatsioon deskriptorite ja bioloogilise aktiivsuse vahel ja korrelatsiooni kirjeldavat valemit kasutades ennustatakse väljajäetud punkti bioloogiline aktiivsus ning. Teise meetodi puhul moodustatakse jagatakse kõik punktid mitmesse gruppi ja seejärel kasutatakse kahte gruppi korrelatsiooni saamiseks ning seejärel ennustatakse korrelatsioonile vastava võrrandi abil järele jäänud punktikogumitele bioloogiline aktiivsus. Protsessi korratakse vahetades nii mudeli loomise andmegruppe kui ka valideerimise andmegruppe. Mõlema meetodi puhul arvutatakse ka neile vastav R2, standardhälve ja Q2.[1]

Välisel valideerimisel jagatakse andmed kahte seeriasse: treeninguseeriasse ja testseeriasse. Treeninguseeriasse kuuluvad andmepunktid, mida kasutatakse mudeli loomiseks. Testseeria on moodustatud andmepunktidest, mis antud mudeli loomisel ei kasutata. Seega tehakse testseeriale ennustus mudelist lähtuvalt ja võrreldakse tema korrelatsiooni koefitsiendi ruutu mudeli omaga. Korrelatsiooni koefitsiendi ruutude erinevus on antud meetodi puhul ka QSAR-mudeli usaldusväärsuse mõõdupuuks. Kui andmed on kogutud erinevatest allikatest, on oodata märgatavat R2 erinevust kahe andmegrupi vahel. Ennustus võime defineerivad veel ka ruutkeskmine viga ja Q2.[1]

Kasutusalad

muuda

QSAR-mudelid on tänapäeva ravimitööstuses tähtsal kohal. CAS (Chemical Abstract Service) kemikaalide andmebaasis on loetletud üle 90 miljoni kemikaali ja uusi kemikaale tuleb järjest juurde. Uute ravimite väljatöötamisel on seega hea alustada QSAR-mudeliga sobivate omadustega ainete otsimisest eelnevalt valideeritud mudeliga. Sel viisil selekteeritakse mõnest kemikaalide andmebaasist välja sobiva toimega ühend, millele eksperimentaalseid uurimisi tehes saadakse kätte tema sobivus ravimainena.[6][7]

QSAR-mudelite ennustustulemusi kasutatakse ka kemikaalide kohta käivates õigusaktides, eriti kui tegu on ohtlike kemikaalidega või kulukate mõõtmistega. QSAR-mudelite kasutamiseks regulatiivsetel eesmärkidel on OECD ja ECHA välja töötanud prognooside esitamise vormid QMRF ja QPRF. Seoses nanomaterjalide suure levikuga, kuid peaaegu olematu seadustikuga nende kohta on viimasel ajal hakatud uurima ka QSAR-i rakendatavust nanoosakestele.[2][8]

Viited

muuda
  1. 1,0 1,1 1,2 1,3 1,4 1,5 1,6 Katritzki, A. R.; Kuanar, M.; Slavov, S; Hall, C. D.; Karelson, M.; Kahn, I.; Dobchev, D. A. Quantitative correlation of physical and chemical properties with chemical structure: utility for prediction. Chem. Rev. 2010, 110, 5714–5789.
  2. 2,0 2,1 2,2 2,3 Cherkasov, A.;Muratov, E. N.; Fourches, D.; et al. QSAR Modeling: Where Have You Been? Where Are You Going To? J. Med. Chem. 2014, 57, 12, 4977–5010.
  3. 3,0 3,1 Nantasenamat, C.; Isarankura-Na-Ayudhya, C.; Naenna, T.; Prachayasittikul, V. A practical overview of quantitative structure-activity relationship. Excli J. 2009, 8, 74–88.
  4. 4,0 4,1 4,2 4,3 4,4 Damale, M. G.; Harke, S. N.; Kalam Khan, F. A.; Shinde, D. B.; Sangshetti, J. N. Recent advances in multidimensional QSAR (4D-6D): a critical review. Mini-Rev. Med. Chem. 2014, 14, 35–55.
  5. Speck-Planche, A.; Kleandrova, V. V.;Luan, F.; Cordeiro, M. N. D. S. Fragment-based QSAR model toward the selection of versatile anti-sarcoma leads. Eur. J. Med. Chem. 2011, 46, 12, 5910–5916.
  6. CAS REGISTRY. http://www.cas.org/. Kasutatud 05.10.2014.
  7. Handbook of Computational Chemistry (2nd edition) J. Leszczynski
  8. JRC QSAR Model Database and QSAR Model Reporting Formats. https://eurl-ecvam.jrc.ec.europa.eu. Kasutatud 05.10.2014