Yhdistyvä eli kombinoituva merkki on digitaalisessa typografiassa erityisenlainen kirjoitusmerkki, tyypillisesti tarke, jota käytetään jonkin toisen merkin lisukkeena. Se on teknisessä mielessä erillinen merkki, jolla on oma Unicode-tunnus, mutta se ei vie tekstirivillä lainkaan tilaa vaan asettuu edeltävän merkin – kantamerkin eli perusmerkin – kohdalle, niin että ne näyttävät muodostavan yhden kokonaisuuden. Yhdistyvä merkki voi pystysuunnassa asemoitua kantamerkin ylä- tai alapuolelle tai keskelle. Käytettävästä fontista ja ohjelmistosta riippuu, miten hyvin yhdistyvä merkki käytännössä osuu paikalleen.
Tietokonemerkistöissä on myös teknisesti yksinkertaisempia koostemerkkejä, joihin lähtökohtaisesti sisältyvät sekä tarke että kantamerkki. Muodollisesti koostemerkki tulkitaan samaksi kuin vastaava kantamerkin ja yhdistyvän merkin muodostama kokonaisuus eli niin sanottu hajotelma. Keskenään yhtäläisiksi on siis ymmärrettävä esimerkiksi koostemerkki š (U+0161 eli latinalainen pienaakkonen s ja hattu) ja hajotelma š (U+0073 U+030C eli latinalainen pienaakkonen s, jota seuraa yhdistyvä hattu).[1]
Yhdistyvät merkit edustavat verrattain uutta fonttitekniikkaa, joka ei aina toimi ongelmitta. Jotkin ohjelmat voivat pyrkiä kiertämään mahdolliset käytännön ongelmat korvaamalla kantamerkistä ja yhdistyvästä merkistä muodostuvan hajotelman vastaavalla koostemerkillä. Kaikki yhdistelmät eivät kuitenkaan ole saatavilla koostemerkkeinä. Unicode-merkistössä ei esimerkiksi ole akuuttiaksentilla varustettuja kyrillisiä vokaalikirjaimia, joten jos venäjänkielisessä tekstissä halutaan merkitä myös sanapainot (mikä tavallisesti tehdään vain sanakirjoissa ja kielen oppikirjoissa), kyrilliseen kirjaimeen pitää liittää yhdistyvä akuutti.
Seuraavassa esimerkissä on sukunimi Åström kirjoitettuna ensin tavanomaisesti käyttäen koostemerkkejä Å (U+00C5) ja ö (U+00F6) ja sitten hajotelmia, joissa tarkkeetonta A-kirjainta (U+0041) seuraa yhdistyvä yläpuolinen ympyrä (U+030A) ja o-kirjainta (U+006F) yhdistyvä treema (U+0308). Eron havainnollistamiseksi kumpikin vaihtoehto on tässä lisäksi esitetty kirjain kerrallaan siten, että koostemerkit näkyvät vihreinä ja kantamerkit mustina; yhdistyvät tarkkeet voivat selaimesta ja fontista riippuen näkyä oransseina tai mustina (tai joissain selaimissa eivät ehkä lainkaan):
Åström | Å | s | t | r | ö | m |
---|---|---|---|---|---|---|
U+ | 00C5 | 0073 | 0074 | 0072 | 00F6 | 006D |
Åström | Å | s | t | r | ö | m |
U+ | 0041 030A |
0073 | 0074 | 0072 | 006F 0308 |
006D |
Värityksen eroja lukuun ottamatta nämä vaihtoehdot ovat siis periaatteessa yhtäläisiä, ja niiden pitäisi näyttää samanlaisilta. Yhdistyvät tarkkeet eivät kuitenkaan aina näy oikein, ja pahimmassa tapauksessa ne voivat jäädä piiloon[2] tai kantamerkin kohdalla tai perässä voi näkyä neliskulmainen korvikekuvio osoittamassa, että tarke ei sisälly käytössä olevaan fonttiin.
Toisaalta koostemerkitkään eivät aina ole ongelmattomia, sillä kovin eksoottiset merkit eivät sisälly kaikkiin fontteihin. Seuraavassa esimerkissä on rekonstruoituna indoeurooppalaisen kantakielen sana ’koira’:
ḱṷṓn | ḱ | ṷ | ṓ | n |
---|---|---|---|---|
U+ | 1E31 | 1E77 | 1E53 | 006E |
ḱṷṓn | ḱ | ṷ | ṓ | n |
U+ | 006B 0301 |
0075 032D |
006F 0304 0301 |
006E |
Joissain tilanteissa ensimmäisen vaihtoehdon harvinaisilla tarkkeilla varustetut k ja u sekä o (jonka yläpuolella on kaksi tarketta) voivat typografisesti näyttää silmiinpistävän erilaisilta kuin tarkkeeton n, ja pahimmassa tapauksessa niiden paikalla näkyy pelkkä neliskulmainen korvikekuvio. Yhdistyviä tarkkeita käytettäessä ainakin kantamerkkien pitäisi olla tunnistettavissa, vaikka selain ei yhdistyviä tarkkeita osaisikaan esittää oikein.
Yhdistyvien merkkien kirjoittaminen vaatii usein erityistoimia. Suomalaiseen vakionäppäimistöön kuuluvat tarkenäppäimet on vanhastaan tarkoitettu koostemerkkien kirjoittamiseen, joten niillä ei suoraan voi tuottaa yhdistyviä tarkkeita.[2] Laajennetusta suomalaisesta näppäimistöasettelusta on tosin laadittu myös muunnelmia, joita käytettäessä tarkenäppäin tuottaakin yhdistyvän tarkkeen.[3] Joissain Linux-järjestelmissä (esimerkiksi Debianissa) yhdistyvän tarkkeen voi puolestaan kirjoittaa näpäyttämällä ensin erityistä yhdistelmänäppäintä (compose-näppäin, jollaiseksi usein on määritelty oikeanpuoleinen Windows-näppäin[4]) ja sen jälkeen asianmukaista tarkenäppäintä kaksi kertaa peräkkäin.
HTML-koodissa voi yhdistyvän merkin tuottaa Unicode-tunnukseen perustuvalla numeerisella merkkiviittauksella. Kun esimerkiksi yhdistyvän hatun tunnus on U+030C, voidaan käyttää vastaavaa merkkiviittausta ̌
(viittaus alkaa &-merkillä ja päättyy puolipisteeseen; tunnuksen alkunollaa ei HTML-viittaukseen tarvitse sisällyttää, mutta ristikkomerkin ja x-kirjaimen yhdistelmä #x
osoittaa, että kyse on heksadesimaalisesta viittauksesta). Merkkiviittaus tulee kirjoittaa välittömästi kantamerkin perään, jotta se asettuisi edeltävän merkin kohdalle:
ř
Eräät yhdistyvät tarkkeet ovat kahden kirjaimen levyisiä, niin että ne ylettyvät myös seuraavan kirjaimen päälle. Tällöin yhdistyvä merkki kirjoitetaan siis tavallaan kahden kantamerkin väliin (tosin varsinainen kantamerkki on aina nimenomaan edeltävä merkki):[5]
t͡s
Kantamerkkiin voi sekä sen ylä- että alapuolella liittyä useitakin yhdistyviä merkkejä, jolloin ne pinoutuvat (tai niiden pitäisi pinoutua) päällekkäin. Tällöin voi olla tarpeen kiinnittää huomiota siihen, missä järjestyksessä yhdistyvät merkit lisätään. Esimerkiksi suomalais-ugrilaisen tarkekirjoituksen ohjeistuksessa on linjattu, että ensin kuuluu kirjoittaa kirjaimen alapuoliset tarkkeet ja vasta niiden jälkeen yläpuoliset tarkkeet. Kummassakin tapauksessa ensin kirjoitetaan kantamerkkiä lähinnä oleva tarke ja sen jälkeen muut asteittain kantamerkistä loitontuen:[6]
ǡ͔
Seuraaviin taulukoihin on koottu yhdistyviä merkkejä ilman kantamerkkiä. Ne on järjestetty Unicode-tunnusten mukaisesti. Kaikki merkit eivät välttämättä näy selaimessa oikein.
Yhdistyviä tarkkeita[7][8] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+030x | ̀ | ́ | ̂ | ̃ | ̄ | ̅ | ̆ | ̇ | ̈ | ̉ | ̊ | ̋ | ̌ | ̍ | ̎ | ̏ |
U+031x | ̐ | ̑ | ̒ | ̓ | ̔ | ̕ | ̖ | ̗ | ̘ | ̙ | ̚ | ̛ | ̜ | ̝ | ̞ | ̟ |
U+032x | ̠ | ̡ | ̢ | ̣ | ̤ | ̥ | ̦ | ̧ | ̨ | ̩ | ̪ | ̫ | ̬ | ̭ | ̮ | ̯ |
U+033x | ̰ | ̱ | ̲ | ̳ | ̴ | ̵ | ̶ | ̷ | ̸ | ̹ | ̺ | ̻ | ̼ | ̽ | ̾ | ̿ |
U+034x | ̀ | ́ | ͂ | ̓ | ̈́ | ͅ | ͆ | ͇ | ͈ | ͉ | ͊ | ͋ | ͌ | ͍ | ͎ | ͏ |
U+035x | ͐ | ͑ | ͒ | ͓ | ͔ | ͕ | ͖ | ͗ | ͘ | ͙ | ͚ | ͛ | ͜ | ͝ | ͞ | ͟ |
U+036x | ͠ | ͡ | ͢ | ͣ | ͤ | ͥ | ͦ | ͧ | ͨ | ͩ | ͪ | ͫ | ͬ | ͭ | ͮ | ͯ |
Jos yhdistyviä ylä- tai alaviivamerkkejä (U+0305, U+0332, U+0333, U+033F) liitetään peräkkäisiin kantamerkkeihin, niistä pitäisi periaatteessa muodostua yhtenäinen ylle- tai alleviivaus, mutta tähän tarkoitukseen on suositeltavaa käyttää tavanomaisempia tyylitekniikoita.[5]
Täydennyksiä yhdistyviin tarkkeisiin[9] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1DCx | ᷀ | ᷁ | ᷂ | ᷃ | ᷄ | ᷅ | ᷆ | ᷇ | ᷈ | ᷉ | ᷊ | ᷋ | ᷌ | ᷍ | ᷎ | ᷏ |
U+1DDx | ᷐ | ᷑ | ᷒ | ᷓ | ᷔ | ᷕ | ᷖ | ᷗ | ᷘ | ᷙ | ᷚ | ᷛ | ᷜ | ᷝ | ᷞ | ᷟ |
U+1DEx | ᷠ | ᷡ | ᷢ | ᷣ | ᷤ | ᷥ | ᷦ | |||||||||
U+1DFx | ᷼ | ᷽ | ᷾ | ᷿ |
Harmaat merkkipaikat eivät toistaiseksi ole käytössä.
Yhdistyviä tarkkeita symboleille[10] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+20Dx | ⃐ | ⃑ | ⃒ | ⃓ | ⃔ | ⃕ | ⃖ | ⃗ | ⃘ | ⃙ | ⃚ | ⃛ | ⃜ | ⃝ | ⃞ | ⃟ |
U+20Ex | ⃠ | ⃡ | ⃢ | ⃣ | ⃤ | ⃥ | ⃦ | ⃧ | ⃨ | ⃩ | ⃪ | ⃫ | ⃬ | ⃭ | ⃮ | ⃯ |
U+20Fx | ⃰ |
Yhdistyviä puolikasmerkkejä[11] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+FE2x | ︠ | ︡ | ︢ | ︣ | ︤ | ︥ | ︦ |