Kansainvälinen HapMap-projekti

Kansainvälinen HapMap-projekti on ihmisen genomin kartoitusprojekti, joka aloitettiin kansainvälisen tutkijaryhmän yhteistyönä lokakuussa 2002. Valmiiksi projekti saatiin vuonna 2009, jolloin sen viimeisen vaiheen tulokset valmistuivat. [1] HapMap -projektin tarkoituksena on ollut määrittää ihmisen haploryhmät sekä saattaa tämä informaatio ilmaiseksi kaikkien saataville. [2] Haploryhmällä tarkoitetaan yhden nukleotidin vaihteluita (SNP), jotka sijaitsevat kromosomissa lähekkäin ja periytyvät yhdessä. HapMap (”haplotype map”) on kartta, joka osoittaa, mitkä SNP:t periytyvät aina yhtenäisenä ryhmänä, toisiinsa kytkeytyneinä. Näin ollen yhden merkki-SNP:n avulla voidaan päätellä samalla kertaa myös useita muita genomisekvenssistä löytyviä alleeleja. HapMap -projekti perustettiin geneettisen tutkimuksen työkaluksi helpottamaan perinnöllisten sairauksien ymmärtämistä. Sen avulla tutkittavan geneettisen materiaalin määrä saatiin vähennettyä pienemmäksi kuin koskaan aikaisemmin. Tämä tekee tautimäärityksestä haploryhmän avulla nopeampaa, tehokkaampaa ja halvempaa. [3] Tautien määrityksen lisäksi HapMapista on hyötyä ennustettaessa ihmisten vastetta erilaisiin lääkkeisiin tai muihin ympäristötekijöihin, esim. toksiineihin. [1] HapMapia on käytetty hyödyksi myös tutkittaessa useita monimutkaisia sairauksia, kuten Alzheimerin tautia, diabetesta, niveltulehdusta, syöpää ja skitsofreniaa. [4]

Projekti jakautui kolmeen vaiheeseen, joista kahdessa ensimmäisessä näytteet olivat samat (ja nämä vaiheet täydentävät toisiaan). Kolmannessa vaiheessa näytteitä analysoitiin myös uusista populaatioista. [5]

DNA-näytteet valittiin jo tunnettujen erilaisten populaatioiden alleelimallien ja historiallisen diversiteetin perusteella. [6] Projektiin kerättiin 270 DNA-näytettä, joista 90 näytettä on Utahista (US, Pohjois- ja Länsi-Eurooppalaista syntyperää olevaa väestöä), 90 näytettä jorubalaisista (Ibadan, Nigeria), 45 näytettä japanilaisista (Tokio, Japani) sekä 45 näytettä Han-kiinalaisista (Peking, Kiina). [2]

Projekti vaati hyvin tiiviin SNP-kartan. Projektin alussa kandidaatti-SNP:a oli 2,6 miljoonaa, mutta lopulta projektin ansiosta tietokantaan lisättiin jopa 6 miljoonaa SNP:a. Saadakseen paljon SNP:a, projektissa hyödynnettiin ”haulikko-sekvensointia” genomikirjastoista. Geneettistä variaatiota tutkittiin hyödyntäen ENCODE-projektin DNA-alueita. Tutkimuksen avulla arvioitiin mm. G – ja C – emäksien määriä genomissa sekä rekombinaation nopeutta. Genotyypin määritys vaiheessa I suunniteltiin SNP-tietokannan avulla. Analyyseissa priorisoitiin SNP:t, jotka olivat jo vahvistettu tai ne olivat esiintyneet useammin kuin kerran sekä ei-synonyymiset SNP:t. [6]

Vaiheeseen II valittiin 4,7 miljoonaa SNP:a genotyypin määritykseen 6,9 miljoonasta vaihtoehdosta. 2,5 miljoonaa SNP:a hylättiin useista syistä, muun muassa SNP:t, joissa oli paljon toistoalueita. Genotyypin määritys suoritettiin käyttäen hyödyksi kustomoitua oligonukleotidijärjestelyä (high-density oligonucleotide array). Vaiheen I SNP:a määritettiin myös uudelleen vertailun vuoksi. Rekombinaationopeutta ja geenien ontologiaa analysoitiin Panther - tietokannan avulla. Ei-synonyymisia SNP:a tunnistettiin annotaatioiden kautta sekä valintaa tutkittiin long-range haplotyyppi (LRH) – testin avulla. [7]

Vaiheessa III projektia vielä jatkettiin, ja seitsemältä uudelta populaatiolta kerättiin näytteet: maasait Kinyawasta (Kenia), luhyat Webuyesta (Kenia), kiinalaiset Denveristä (CO, USA), gujarati-intialaiset Houstonista (TX, USA), toscanalaiset (Italia), afrikkalaista syntyperää oleva väestö (Lounais-USA) ja meksikolaista syntyperää oleva väestö Los Angelesissa (CA, USA). Näytteiden genotyypit määrättiin vasten 1,6 miljoonaa SNP:tä sekä pieni osa vasten ENCODE:n vaihe II:sta. [5]

Vaiheessa I löydettiin yli miljoona yhden nukleotidin polymorfismia (SNP) [6], vaiheessa II yli 3.1 miljoonaa [7] ja vaiheessa III noin 1,6 miljoonaa SNP:a. [8] Ne sisältävät noin 25–35 % yleisistä SNP-variaatioista tutkituista populaatioista. Haploryhmien alleelien välinen keskimääräinen maksimi r2, eli korrelaatiokerroin, on välillä 0.9 ja 0.96, afrikkalaisissa populaatioissa 0.8 ja ei-afrikkalaisissa populaatioissa 0.95. [7]

Aineisto vahvistaa rekombinaatiokeskittymien, pitkien ja vahvojen kytkentäepätasapaino-sekvenssien, sekä alhaisten haplotyyppien monimuotoisuuden yleisyyden. Tärkeimpänä havaintona on läheisten SNP:ien laaja redundanssi, jonka avulla voidaan kerätä laajaa tietoa genomisesta vaihtelusta ilman uudelleensekvensointia, sekä lisätä analyysien tehokkuutta. [6]

10–30 % populaation yksilöistä jakavat vähintään yhden viimeaikaisesta syntyperästä johtuvan laajentuneen geneettisen identiteetin alueen. Ei-synonyymisissä SNP:issa on lisääntynyttä erilaistumista verrattuna synonyymisiin SNP:in. Tämä johtuu populaatioihin vaikuttavan luonnonvalinnan voimakkuuden ja tehokkuuden eroista. [6]

Käyttö ja sovellutukset

[muokkaa | muokkaa wikitekstiä]

HapMap-aineistoa voidaan käyttää erityisesti geeniperäisten tautien tutkimiseen, ja geneettisten erojen löytämiseen, joiden avulla voidaan ennustaa eri ihmisten reaktiota lääkkeisiin ja ympäristötekijöihin. [1] Lisäksi sen avulla voidaan tutkia rekombinaatiota ja rakenteellista variaatiota, sekä luonnonvalinnan historiaa tunnistamalla lokuksia, joihin luonnonvalinta on voinut vaikuttaa. Aineistolla voidaan myös tunnistaa deleetion variantteja genomissa. [6]

HapMap-projektia ei enää käytetä aktiivisesti tutkimuksissa, mutta sen aineisto on kuitenkin vielä vapaasti avoinna tutkijoille. [1] Projekti oli aikanaan hyvin merkityksellinen, ja se oli tarpeellinen ponnahduslauta esimerkiksi 1000 Genomes projektille, joka on sittemmin jättänyt HapMapin varjoonsa. [9]

  1. a b c d What is the International HapMap Project? MedlinePlus. 21.9.2020. Viitattu 29.11.2020. (englanniksi)
  2. a b Belmont, J. W., Hardenbol, P., Willis, T. D., Yu, F., Yang, H., Ch’Ang, L.-Y., Huang, W., Liu, B., Shen, Y., Tam, P. K.-H., Stein, L. D., & Tanaka, T.: The international HapMap project. Nature, 2003, 426. vsk, nro 6968, s. 789–796. doi:https://doi.org/10.1038/nature02168 (englanniksi)
  3. International HapMap Project National Human Genome Research Institute. 1.5.2012. Viitattu 29.11.2020. (englanniksi)
  4. Benjamin Yang: HapMap is to benefit genetic research on complex diseases Discovery Medicine. 17.5.2009. Viitattu 29.11.2020. (englanniksi)
  5. a b HapMap Project Coriell Institute for Medical Research. Viitattu 9.11.2020. (englanniksi)
  6. a b c d e f Belmont, J. W., Boudreau, A., Leal, S. M., Hardenbol, P., Pasternak, S., Wheeler, D. A., Willis, T. D., Yu, F., Yang, H., Gao, Y., Jamieson, R., & Stewart, J.: A haplotype map of the human genome. Nature, 2005, 437. vsk, nro 7063, s. 1299–1320. doi:https://doi.org/10.1038/nature04226 (englanniksi)
  7. a b c Frazer, K. A., Ballinger, D. G., Cox, D. R., Hinds, D. A., Stuve, L. L., Gibbs, R. A., Belmont, J. W., Boudreau, A., Hardenbol, P., Leal, S. M., Jamieson, R., & Stewart, J.: A second generation human haplotype map of over 3.1 million SNPs. Nature, 2007, 449. vsk, nro 7164, s. 851–861. doi:https://doi.org/10.1038/nature06258 (englanniksi)
  8. Altshuler, D. M., Gibbs, R. A., Peltonen, L., Dermitzakis, E., Schaffner, S. F., Yu, F., Bonnen, P. E., de Bakker, P. I. W., Deloukas, P., Gabriel, S. B.: Integrating common and rare genetic variation in diverse human populations. Nature, 2010, 467. vsk, nro 7311, s. 1476-4687. doi:https://doi.org/10.1038/nature09298 (englanniksi)
  9. NCBI retiring HapMap Resource National Center for Biotechnology Information, U.S. National Library of Medicine. 16.6.2016. Viitattu 16.12.2020. (englanniksi)