Kansainvälinen HapMap-projekti on ihmisen genomin kartoitusprojekti, joka aloitettiin kansainvälisen tutkijaryhmän yhteistyönä lokakuussa 2002. Valmiiksi projekti saatiin vuonna 2009, jolloin sen viimeisen vaiheen tulokset valmistuivat. [1] HapMap -projektin tarkoituksena on ollut määrittää ihmisen haploryhmät sekä saattaa tämä informaatio ilmaiseksi kaikkien saataville. [2] Haploryhmällä tarkoitetaan yhden nukleotidin vaihteluita (SNP), jotka sijaitsevat kromosomissa lähekkäin ja periytyvät yhdessä. HapMap (”haplotype map”) on kartta, joka osoittaa, mitkä SNP:t periytyvät aina yhtenäisenä ryhmänä, toisiinsa kytkeytyneinä. Näin ollen yhden merkki-SNP:n avulla voidaan päätellä samalla kertaa myös useita muita genomisekvenssistä löytyviä alleeleja. HapMap -projekti perustettiin geneettisen tutkimuksen työkaluksi helpottamaan perinnöllisten sairauksien ymmärtämistä. Sen avulla tutkittavan geneettisen materiaalin määrä saatiin vähennettyä pienemmäksi kuin koskaan aikaisemmin. Tämä tekee tautimäärityksestä haploryhmän avulla nopeampaa, tehokkaampaa ja halvempaa. [3] Tautien määrityksen lisäksi HapMapista on hyötyä ennustettaessa ihmisten vastetta erilaisiin lääkkeisiin tai muihin ympäristötekijöihin, esim. toksiineihin. [1] HapMapia on käytetty hyödyksi myös tutkittaessa useita monimutkaisia sairauksia, kuten Alzheimerin tautia, diabetesta, niveltulehdusta, syöpää ja skitsofreniaa. [4]
Projekti jakautui kolmeen vaiheeseen, joista kahdessa ensimmäisessä näytteet olivat samat (ja nämä vaiheet täydentävät toisiaan). Kolmannessa vaiheessa näytteitä analysoitiin myös uusista populaatioista. [5]
DNA-näytteet valittiin jo tunnettujen erilaisten populaatioiden alleelimallien ja historiallisen diversiteetin perusteella. [6] Projektiin kerättiin 270 DNA-näytettä, joista 90 näytettä on Utahista (US, Pohjois- ja Länsi-Eurooppalaista syntyperää olevaa väestöä), 90 näytettä jorubalaisista (Ibadan, Nigeria), 45 näytettä japanilaisista (Tokio, Japani) sekä 45 näytettä Han-kiinalaisista (Peking, Kiina). [2]
Projekti vaati hyvin tiiviin SNP-kartan. Projektin alussa kandidaatti-SNP:a oli 2,6 miljoonaa, mutta lopulta projektin ansiosta tietokantaan lisättiin jopa 6 miljoonaa SNP:a. Saadakseen paljon SNP:a, projektissa hyödynnettiin ”haulikko-sekvensointia” genomikirjastoista. Geneettistä variaatiota tutkittiin hyödyntäen ENCODE-projektin DNA-alueita. Tutkimuksen avulla arvioitiin mm. G – ja C – emäksien määriä genomissa sekä rekombinaation nopeutta. Genotyypin määritys vaiheessa I suunniteltiin SNP-tietokannan avulla. Analyyseissa priorisoitiin SNP:t, jotka olivat jo vahvistettu tai ne olivat esiintyneet useammin kuin kerran sekä ei-synonyymiset SNP:t. [6]
Vaiheeseen II valittiin 4,7 miljoonaa SNP:a genotyypin määritykseen 6,9 miljoonasta vaihtoehdosta. 2,5 miljoonaa SNP:a hylättiin useista syistä, muun muassa SNP:t, joissa oli paljon toistoalueita. Genotyypin määritys suoritettiin käyttäen hyödyksi kustomoitua oligonukleotidijärjestelyä (high-density oligonucleotide array). Vaiheen I SNP:a määritettiin myös uudelleen vertailun vuoksi. Rekombinaationopeutta ja geenien ontologiaa analysoitiin Panther - tietokannan avulla. Ei-synonyymisia SNP:a tunnistettiin annotaatioiden kautta sekä valintaa tutkittiin long-range haplotyyppi (LRH) – testin avulla. [7]
Vaiheessa III projektia vielä jatkettiin, ja seitsemältä uudelta populaatiolta kerättiin näytteet: maasait Kinyawasta (Kenia), luhyat Webuyesta (Kenia), kiinalaiset Denveristä (CO, USA), gujarati-intialaiset Houstonista (TX, USA), toscanalaiset (Italia), afrikkalaista syntyperää oleva väestö (Lounais-USA) ja meksikolaista syntyperää oleva väestö Los Angelesissa (CA, USA). Näytteiden genotyypit määrättiin vasten 1,6 miljoonaa SNP:tä sekä pieni osa vasten ENCODE:n vaihe II:sta. [5]
Vaiheessa I löydettiin yli miljoona yhden nukleotidin polymorfismia (SNP) [6], vaiheessa II yli 3.1 miljoonaa [7] ja vaiheessa III noin 1,6 miljoonaa SNP:a. [8] Ne sisältävät noin 25–35 % yleisistä SNP-variaatioista tutkituista populaatioista. Haploryhmien alleelien välinen keskimääräinen maksimi r2, eli korrelaatiokerroin, on välillä 0.9 ja 0.96, afrikkalaisissa populaatioissa 0.8 ja ei-afrikkalaisissa populaatioissa 0.95. [7]
Aineisto vahvistaa rekombinaatiokeskittymien, pitkien ja vahvojen kytkentäepätasapaino-sekvenssien, sekä alhaisten haplotyyppien monimuotoisuuden yleisyyden. Tärkeimpänä havaintona on läheisten SNP:ien laaja redundanssi, jonka avulla voidaan kerätä laajaa tietoa genomisesta vaihtelusta ilman uudelleensekvensointia, sekä lisätä analyysien tehokkuutta. [6]
10–30 % populaation yksilöistä jakavat vähintään yhden viimeaikaisesta syntyperästä johtuvan laajentuneen geneettisen identiteetin alueen. Ei-synonyymisissä SNP:issa on lisääntynyttä erilaistumista verrattuna synonyymisiin SNP:in. Tämä johtuu populaatioihin vaikuttavan luonnonvalinnan voimakkuuden ja tehokkuuden eroista. [6]
HapMap-aineistoa voidaan käyttää erityisesti geeniperäisten tautien tutkimiseen, ja geneettisten erojen löytämiseen, joiden avulla voidaan ennustaa eri ihmisten reaktiota lääkkeisiin ja ympäristötekijöihin. [1] Lisäksi sen avulla voidaan tutkia rekombinaatiota ja rakenteellista variaatiota, sekä luonnonvalinnan historiaa tunnistamalla lokuksia, joihin luonnonvalinta on voinut vaikuttaa. Aineistolla voidaan myös tunnistaa deleetion variantteja genomissa. [6]
HapMap-projektia ei enää käytetä aktiivisesti tutkimuksissa, mutta sen aineisto on kuitenkin vielä vapaasti avoinna tutkijoille. [1] Projekti oli aikanaan hyvin merkityksellinen, ja se oli tarpeellinen ponnahduslauta esimerkiksi 1000 Genomes projektille, joka on sittemmin jättänyt HapMapin varjoonsa. [9]