TIS 620 (Thai Industrial Standard 620) er det vanligste tegnsettet for thai og det eneste som brukes i Thailand. Standarden gis ut av Thai Industrial Standards Institute (TISI), som er underlagt Thailands industridepartement. Standarden heter formelt «Standard for koding av thai-tegn for bruk med datamaskiner» (thai: รหัสสำหรับอักขระไทยที่ใช้กับคอมพิวเตอร์). Den nåværende standarden er TIS 620-2553, der 2553 er året den ble implementert, i henhold til den thailandske solkalenderen (1990 e.Kr.); TIS 620-2553 var en oppdatering av den tidligere TIS 620-2529 (1986).
TIS-620 er et utvidet ASCII-tegnsett som er kompatibelt med 7-bits ASCII. Det bruker 8-bits intervallet fra heksadesimale A1 til FB for å kode thai-skriften. Ettersom thai-skriften er mer kompleks enn f.eks. det latinske alfabetet, med diakritiske tegn og over- og underskrevne vokal-tegn, kan TIS 620 bare brukes for å sende informasjon, og det er nødvendig med videre språksøtte for å få skriften til å vises ordentlig.
TIS-620 ble tatt i bruk som ISO 8859-11 i 1999; den eneste forskjellen er at ISO 8859-11 definerer heksadesimale A0 som non-breaking space, mens TIS-620 har den som reservert, dog udefinert.
TIS-620 tegnsettet har også blitt tatt i bruk innenfor Unicode (ISO 10646). I Unicode kodes thai mellom U+0E01 og U+0E7F. Tegn fra TIS-620 kan konverteres til UTF-16 ved å legge 0E til foran, og trekke heksadesimale A0 fra.
TIS-620 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | ubrukt | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | ubrukt | |||||||||||||||
9x | ||||||||||||||||
Ax | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ | |
Bx | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
Cx | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
Dx | ะ | ั | า | ำ | ิ | ี | ึ | ื | ุ | ู | ฺ | ฿ | ||||
Ex | เ | แ | โ | ใ | ไ | ๅ | ๆ | ็ | ่ | ้ | ๊ | ๋ | ์ | ํ | ๎ | ๏ |
Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ |
I denne tabellen er 20 vanlig mellomrom. Kodepunktene 00-1F, 7F, 80-9F, A0, DB-DE og FC-FF har ingen verdi i TIS-620.
Kodepunktene D1, D4-DA, E7-EE (markert i lyseblått) er diakritiske tegn og over-/underskrevne vokaler.
Det finnes bare én rekkefølge for å lagre thai-skrift med denne standarden. Tegnene lagres i den rekkefølgen man ville skrevet dem, dersom man skrev ordet for hånd. Denne rekkefølgen er skjematisk satt opp nedenfor, med ordene เพื่อน ([pɯan] «venn») og คุ้ย ([kui] «å grave med klørne» (som en hund)) som eksempler. For å vise et mer komplisert ord vises også รามเกียรติ์.
Først skrives den forskrevne vokalen, så ordets første konsonant. Deretter kommer den over- eller underskrevne vokalen (ettersom det ikke finnes noen sammensatt vokal som består av både en over- og underskreven vokal, er begge disse det 3. man skriver). Det fjerde tegnet er et diakritisk tegn, typisk et tonemerke. Så kommer den etterskrevne vokalen, og til slutt stavelsens siste konsonant.
|
|
11 - ์ | |||||||
6 - ี | 10 - ิ | ||||||
1 - ร | 2 - า | 3 - ม | 4 - เ | 5 - ก | 7 - ย | 8 - น | 9 - ต |
Selv om ำ gjerne oppfattes som en delvis overskrevet vokal, anses den i TIS 620 for å være en etterskrevet vokal, og skal skrives etter diakritiske tegn. F.eks. i et ord som น้ำ ([nám] «vann») skal mai tho skrives før ำ.