Synkronointi (engl. synchronization) tietokoneen ohjelmoinnissa tarkoittaa hallittua synkronointimekanismia rinnakkaisten ohjelmien välisen jaetun tiedon käsittelyyn.[1]
Synkronointia tarvitaan, jotta kahden rinnakkain samanaikaisesti tapahtuvan muutoksen välillä ei synny kilpatilannetta (engl. race condition), jolloin ohjelmat voivat päivittää yhtä aikaa samaa muuttujaa tai tietorakennetta, mikä yleensä johtaa virheeseen. Tämän takia käyttöjärjestelmä tarjoaa mekanismeja resurssien hallittuun synkronointiin (engl. synchronization).
Kilpatilanne voi syntyä myös yhden suorittimen järjestelmässä riippuen säikeiden ja prosessien vuoronnuksesta (context switch) sekä laitteistokeskeytyksien käsittelystä.[2][3] Synkronoinnilla pyritään välttämään kilpatilanteita, mutta virheellinen synkronointi voi aiheuttaa nälkiintymisen tai lukkiutumisen. Ohjelmakoodin uudelleen käytettävyyttä voi haitata synkronoinnin ja muun ohjelmakoodin välinen keskinäinen riippuvuussuhde.[4]
Nykyisin käytettävät lukottomat synkronointimekanismit välttävät suuren osan aiemmin tunnetuista ongelmista. Lukottomia menetelmiä ovat atomiset operaatiot sekä Read-Copy-Update (RCU) mekanismi.[5][6]
Rinnakkaisuuden käsittely on perustavanlaatuinen ongelma, jossa objektien tilan on pysyttävä aina eheänä ja pääsy objekteihin on synkronoitava. Rinnakkaisessa käsittelyssä ei toimita enää sekventiaalisessa ohjelmoinnissa ja sarjamuotoisista ohjelmointimenetelmistä ei ole apua.[7] Menetelmiä synkronointiin on muun muassa lukituspohjainen synkronointi, joka tunnetaan myös poissulkemisena.[7] Atomisuus (linearisointi) on tärkeä konsepti yhtäaikaisesti ja hajautetusti toimiville ohjelmille (erona sarjamuotoisesta eli serialisoinnista).[7] Lukottomuudella tarkoitetaan menetelmiä, joissa kriittistä aluetta ei voi käyttää (mutex-free).[7]
Synkronointimekanismit tai synkronointiprimitiivit[8][9][10][11][12][13][14][15][16][17][18] ovat sopimuspohjaisia siten, että ohjelmakoodia tehtäessä on tunnistettava mitä muuttujia ei saa muokata lukituksen ollessa voimassa. Lukituksen käsittely tarvitaan sekä lukevalle että kirjoittavalle puolelle jotta molemmilla on käsitys milloin lukitus on voimassa.
Synkronointiin käytettäviä mekanismeja ovat spinlock, barrier, semaforit, (engl. semaphore) poissulkeminen (engl. mutual exclusion) ja kriittinen alue (engl. critical section, critical region), joilla varmistetaan, että vain yksi säie tai prosessi voi kerrallaan käsitellä yhteisiä muuttujia.
Eri mekanismeilla voi olla suorituskyvyn kannalta merkitystä lukituksen haastamisen (engl. contention) kannalta.[19]
Spinlock nimensä mukaisesti tarkastelee lukitusmuuttujaa kunnes se voi varata lukituksen (aktiivinen odotus). Tästä voi aiheutua busy-wait tilanne, mutta menetelmää yhä käytetään sen yksinkertaisuuden vuoksi.[20] Ratkaisu riippuu arkkitehtuurikohtaisesta atomisesta tarkista-ja-aseta -toiminnosta.[21] Tietokoneen suoritin voi tukea toimintoa ilman että laitteisto muuttaa tilaa kesken toiminnon.[22] Sekventiaaliset lukitukset (Seqlocks) ovat spinlockien variaatio, joka huomioi erikseen kirjoituksen ja lukituksen antaen kirjoitukselle korkeamman prioriteetin.[23] Lippupohjaiselle (ticket) ratkaisulle on vaihtoehtona kehitetty jonopohjainen (queue) suurissa NUMA-järjestelmissä käytettäväksi.[24]
Barrier on esto, joka rajaa mm. kääntäjän tai suorittimen tekemän uudelleenjärjestelyn[25] varmistaen että tietty ohjelmakoodi suoritetaan sitä ennen.[25][26] Tähän voidaan liittää myös välimuistin tyhjentäminen keskusmuistiin (ks. välimuistin yhtenäisyys) ja muita toimintoja. Etenkin moniprosessointi voi vaatia mekanismia.[27]
Semafori on kahden "suunnan" menettely, jossa lasketaan lukituksen ottaneet ja lukituksen vapauttaneet: kun lukituksen ottaneita on enemmän kuin lukituksen vapauttaneita muutoksia ei saa tehdä synkronoitavaan tietoon.[26] Linuxin toteutus laskee sekä lukituksen ottaneet että odottajat.[26][23]
Luku-kirjoitus-semaforit sallivat jaetun lukemisen, mutta vaativat yksityisen pääsyn kirjoittamista varten: menetelmä parantaa rinnakkaisuutta ja järjestelmän kokonaissuorituskykyä.[28] Semaforipohjainen ratkaisu on suunnattu "luku-kirjoitus-ongelman" (engl. reader-writer-problem) ratkaisemiseen.[29]
Tyypillinen semaforimekanismi ei ole sopiva reaaliaikaisten järjestelmien toteutukseen johtuen prioriteetti-inversion mahdollisuudesta.[30]
Edsger Dijkstra mainitsee alankomaalaisen fyysikon C. S. Scholtenin osoittaneen semaforien soveltamista.[31]
Turnstile tai kääntöportti on Solaris-käyttöjärjestelmän toteuttama synkronointimenetelmä.[32] Toteutus sisältää odotusjonot ja prioriteetin perintämekanismin.[32]
Fence (aita) on käytössä muun muassa grafiikkaprosessorin (GPU) ja suorittimen (CPU) välisessä synkronoinnissa.[33] Fence signaloidaan kun käsittely on valmis (GPU), jolla välin suoritin (CPU) voi tehdä työtä etukäteen.[34] Periaatteena on käsky, joka estää ohjelmointikielen kääntäjää ja laitteistoa järjestelemästä muistikäsittelyjä uudelleen: 1) fence valmistuu kun, sitä ennen annetut käsittelyt ovat valmiita; 2) fence on oltava valmis ennen kuin sen jälkeiset käsittelyt ovat näkyvissä muille prosessoreille.[35]
Poissulkeminen on yleinen prosessien välillä käytetty synkronointi. Monet menetelmät toimivat vain säikeiden välillä nopeusedun vuoksi, mutta yleiset tietokoneresurssit kuten sarjaportti voivat vaatia varmistuksen että muiden prosessien säikeet eivät myöskään pääse käsittelemään samaa resurssia samaan aikaan.[2] Linux toteuttaa mutex tyypin lisäksi futex poissulkemisen, joka on nopeampi mutta kernelin sisäisiin toimintoihin rajoitettu.[26] Poissulkemisella voidaan tarkoittaa myös yleistä termiä akateemisissa ja teoreettisissa teoksissa.[36]
Lukkiutumisen välttämiseen on kehitetty vaihtoehtona muun muassa wait/wound mutex (ww-mutex): tämä ratkaisee päinvastaisessa järjestyksessä varauksen "vahingoittamalla" myöhemmin tullutta vapauttamaan omansa, jotta ensin ehtinyt voi jatkaa.[37][38] Perinteisesti vastakkaisia järjestyksiä on vain vältettävä.[37] Wait/wound-mekanismia käytetään grafiikkaprosessorien kanssa (GPU), joissa on useita puskureita joiden järjestystä ei voi määrittää etukäteen: nämä puskurit voivat olla vuoroin GPU:n, laiteajurin, käyttäjäavaruuden tai mahdollisesti toisen ajurin käytössä (videokuvan kaappaus).[37] Relaatiotietokantoja käsittelevässä kirjallisuudessa transaktioiden käsittelyssä vastaavasta lukituksesta käytetään nimeä wait-die.[38]
Leslie Lamport on tutkinut ja todennut poissulkemisessa olevan useita ongelmia.[39] Lamport myös esitti ensimmäisen hajautettuihin järjestelmiin sopivan ratkaisun poissulkemisongelmaan.[39] Lamportin mukaan hajautetuissa järjestelmissä ja moniprosessointia käyttävissä järjestelmissä on samanlaisia ongelmia, joissa tapahtumien järjestys ei ole ennakoitavissa.[40] Petersonin algoritmia sanotaan standardinomaiseksi alhaisen tason algoritmiksi kahden säikeen väliseen poissulkemiseen.[41]
Poissulkeminen voi olla verrattain raskas ja hidas operaatio ja ohjelman sisäiseen synkronointiin käytetään tyypillisesti muita menetelmiä kuten kriittisiä alueita.[42][43]
Kiireinen odotus (engl. busy wait) -tekniikoita käytetään paljon poissulkemiseen, mutta tyypilliset toteutukset vaativat paljon muistia sekä kytkentäverkon kilpatilanteita, jotka aiheuttavat pullonkauloja suorituskyvylle.[44]
Kriittinen alue (engl. Critical Section) on ohjelmalohko, joka on suoritettava sen loppuun asti ennen luovuttamista toiselle suorittajalle.[23][45] Termiä käytetään synkronointiprimitiivin (Critical Section)[45] lisäksi myös synkronoinnilla suojatusta ohjelmalohkosta.[46] Synkronointiprimitiivi Critical Section Windowsissa eroaa poissulkemisesta muun muassa siten, että se toimii vain saman prosessin säikeiden välillä eikä voida jakaa eri prosessien kesken.[45]
Prosessin sisäisen suorituksen synkronointiin kriittinen alue voi olla tehokkaampi vaihtoehto kuin poissulkeva mutex.[43][47]
Atomisilla operaatioilla voidaan tehdä ohjelmointikielen (ja laitteiston) tukemana automaattisesti suojattuja (synkronoituja) tai lukottomia muuttujia, joilla voidaan välttää kilpatilanteita.[26][48][2]
Suorittimet sisältävät laitteistotasolla erilaisia atomisia primitiivejä, joita voidaan käyttää "rakennuspalikoina" muille synkronointimuunnelmille.[49] Laitteiston tukemia primitiivejä ovat esimerkiksi: test and set, compare and swap, fetch and increment ja load-link / store-conditional.[49]
Muun muassa C++11 lisää ohjelmointikieleen tuen atomisille operaatioille (ISO/IEC 14882:2011). Atomisilla operaatioilla voidaan toteuttaa korkeamman tason synkronointitoimintoja.[50]
Atomiset operaatiot voivat parantaa suorituskykyä huomattavasti verrattuna perinteisiin synkronointimenetelmiin.[51]
Microsoft on käyttänyt atomisista toiminnoista nimitystä lomittuvat toiminnot (engl. interlocked operations).[52]
Atomisuutta käytetään synkronointiprimitiivien lisäksi myös muualla kuten tietokantojen ACID-periaatteessa sekä tiedostojärjestelmän toimintaperiaatteiden kuvauksissa, jotka ovat eri tason käsitteitä.
ReaderWriterLock on Microsoftin synkronointiprivimitiivi, joka sallii useamman lukevan säikeen mutta vaatii kirjoittavan säikeen odottavan poissulkevaa lukitusta.[8][53]
Read-Copy-Update (RCU) mekanismi on Linuxissa käytetty skaalautuva mekanismi.[54] RCU:n etu on äärimmäisen nopea lukeminen harvoin päivitettäville tiedoille.[54][55]
RCU on immuuni deadlock tilanteelle ja se on lähtöisin Sequentin DYNIX/ptx ytimestä, jossa RCU:n käytöllä vähennettiin huomattavasti deadlockin välttämiseen tarkoitettua ohjelmakoodia.[56] Mekanismia on käytetty myös IBM:n tutkimusalustassa K42.[57]
Mekanismi käyttää elävän (luettavissa olevan) ja kuolleen (muokattavissa olevan) muuttujan periaatetta.[58]
Koska menetelmä käyttää eri operaatioita lukevalle ja kirjoittavalle puolelle tähän viitataan myös reader-writer locking konseptina, mutta sillä korvataan Linuxissa käytettyä read-write lock mekanismia (rwlock).[59]
RCU:sta on tehty esitys C++:n ISO-standardointiin liittyen.[60][61]
Myös käyttäjäavaruudessa käytettävää muunnosta on kehitetty.[62]
Lukottomalle Compare-and-Swap -mekanismille perustuen on toteutettu moniprosessointia tukeva Synthesis-ydin Sony NEWS -työasemalle.[63]
Laitteistokeskeytyksien pysäyttäminen kriittisen alueen ajaksi on yksi reaaliaikajärjestelmien käyttämä menetelmä.[1] Keskeytyksien ja moniajon pysäyttäminen ei ole lukitus, mutta se voi olla alhaisen tason koodin käyttämä tiedon serialisointiin suoritinkohtaisesti.[64]
Lukoton algoritmi voi vaihtaa (esimerkiksi linkitetyn listan kanssa) käytössä olevan alkion toiseen kun se on valmis häiritsemättä olemassa olevaa käyttöä.[5] Ohjelmointikielen kääntäjä on usein vapaa muuttamaan toimintojen järjestystä, joka voi aiheuttaa ongelmia.[65][5][66] Lisäksi suorittimet voivat käyttää myös spekuloivaa suoritusta.[54] Välimuistin yhtenäisyyden vuoksi suorittimet vaihtavat viestejä (QuickPath, HyperTransport) varmistaakseen järjestyksen.[6] Assembly-tasolla ohjelmoija näkee operaatioita kuten load-store-käskyjä viestivälityksen sijaan.[67]
Hazardiosoitin on eräs menetelmä, joka on kehitetty dynaamisien olioiden lukottomaan käsittelyyn.[68][69][70]
Rinnakkaiset ohjelmat voivat joutua myös odottamaan toisiaan jolloin säikeet estävät toisiaan (engl. block).
Väärin tehty ohjelma voi lukkiutua (engl. deadlock). Lukkiutumistilanteessa prosessit odottavat tosiaan, eikä yksikään niistä pääse etenemään.[2]
Nälkiintyminen tai nääntyminen (engl. starvation) on tilanne, jossa ainakin yksi säie jatkuvasti jää ilman riittävää suoritinaikaa, vaikka varsinaista lukkiutumista ei esiinnykään – järjestelmä siis ainakin osittain toimii kuten pitääkin.[71]
Livelock on deadlockin ja nälkiintymisen kaltainen tilanne, jossa säikeet jatkavat toimintaansa mutta eivät pääse etenemään: säikeet eivät ole pysäytettyjä kuten deadlockissa.[71] Käsitteen nimen esitti E. A. Ashcroft vuonna 1973 artikkelissaan Proving Assertions about Parallel Program.[72]
Priority inversion tilanne on ongelmallinen vuoronnetuissa järjestelmissä, joissa korkean prioriteetin säie voi joutua odottamaan matalan prioriteetin säiettä vapauttamaan varatun resurssin, mutta matalan prioriteetin säie ei saa riittävästi ajoaikaa.[1] Ongelman välttämiseksi Real-Time Linux tukee prioriteettien perintämekanismia.[73][74]
Käytetystä synkronointimenetelmästä riippuen järjestelmä voi olla myös herkkä busy-wait tilanteelle, jossa suoritinaikaa käytetään paljon odotettavan lukituksen tilan tarkisteluun. Etenkin spinlock synkronointi voi aiheuttaa tämän tilanteen.[20]
Itse alustakohtaisen tuen lisäksi eräissä ohjelmointikielissä on niiden standardikirjastossa toteutus alustakohtaiselle synkronointimekanismille, joka käyttää samaa rajapintaa eri alustoilla.
Esimerkiksi C++11 lisäsi std::mutex
toteutuksen kielen standardikirjastoon. C11 lisäsi säikeistyksen tuen mukaan lukien synkronointituen.
Esimerkki synkronoinnin käyttötapauksesta, jossa write_value()
kirjoittaa arvon ja read_value()
lukee arvon:
Sync valuelock;
int myValue;
void write_value(int scalarvalue)
{
valuelock->lock();
myValue = scalarvalue;
valuelock->release();
}
int read_value()
{
int current_value;
valuelock->lock();
current_value = myValue;
valuelock->release();
return current_value;
}
Huomaa, että tämä esimerkki olettaa synkronointiprimitiivin odottavan kunnes lukitus onnistuu ja voi pysäyttää säikeen suorituksen pitkäksi aikaa.
Esimerkki demonstroi miten lukittavan arvon käsittely on oltava sekä luku- että kirjoituspuolella sopimuskäytännön mukaisesti.