テルグ文字 (Unicodeのブロック) | |
---|---|
Telugu | |
範囲 |
U+0C00..U+0C7F (128 個の符号位置) |
面 | 基本多言語面 |
用字 | テルグ文字 |
主な言語・文字体系 | |
割当済 | 98 個の符号位置 |
未使用 | 30 個の保留 |
Unicodeのバージョン履歴 | |
1.0.0 | 78 (+78) |
5.1 | 91 (+13) |
7.0 | 93 (+2) |
8.0 | 94 (+1) |
11.0 | 95 (+1) |
12.0 | 96 (+1) |
14.0 | 98 (+2) |
公式ページ | |
コード表 ∣ ウェブページ |
テルグ文字(テルグもじ、英語: Telugu)は、Unicodeの29個目のブロック。
インド南東部のアーンドラ・プラデーシュ州およびテランガーナ州で話されているドラヴィダ語族のテルグ語を表記するためのテルグ文字を収録している。
テルグ文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生したいわゆるブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるハラント(halant)という記号を子音字の上に付加したりする。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。
子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(テルグ数字)を有している。
Unicodeのバージョン1.0においても「テルグ文字(Telugu)」というブロック名で制定されていた。[1]
「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(および一部はIAST)に従う。
コード | 文字 | 文字名(英語) | 用例・説明 | ラテン文字転写 |
---|---|---|---|---|
各種記号 | ||||
U+0C00 | ఀ | TELUGU SIGN COMBINING CANDRABINDU ABOVE | ||
U+0C01 | ఁ | TELUGU SIGN CANDRABINDU | アヌナーシカ、或いはチャンドラビンドゥ。
文脈上省略された鼻音を示す。[2] 元々は母音字や母音記号に付き、母音を鼻母音で発音することを表していた。 |
n̆ |
U+0C02 | ం | TELUGU SIGN ANUSVARA | アヌスヴァーラ、或いはビンドゥ。 | ṁ |
U+0C03 | ః | TELUGU SIGN VISARGA | ヴィサルガ。
音節末に[h]を伴うことを表す。 |
ḥ |
U+0C04 | ఄ | TELUGU SIGN COMBINING ANUSVARA ABOVE | プラークリット語のテキストで言語上のアヌスヴァーラとして使用される | |
独立母音字 | ||||
U+0C05 | అ | TELUGU LETTER A | 短母音[ʌ]を表す。 | a |
U+0C06 | ఆ | TELUGU LETTER AA | 長母音[ɑː]を表す。 | ā |
U+0C07 | ఇ | TELUGU LETTER I | 短母音[ɪ]を表す。 | i |
U+0C08 | ఈ | TELUGU LETTER II | 長母音[iː]を表す。 | ī |
U+0C09 | ఉ | TELUGU LETTER U | 短母音[ʊ]を表す。 | u |
U+0C0A | ఊ | TELUGU LETTER UU | 長母音[uː]を表す。 | ū |
U+0C0B | ఋ | TELUGU LETTER VOCALIC R | 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。
現代のテルグ語では[ru]と発音される。 |
r̥[3] |
U+0C0C | ఌ | TELUGU LETTER VOCALIC L | 音節主音化した短母音としてのL(IPA:[l̩])を表す。 | l̥[4] |
U+0C0D | (予約済) | ê | ||
U+0C0E | ఎ | TELUGU LETTER E | 短母音[e]を表す。 | e |
U+0C0F | ఏ | TELUGU LETTER EE | 長母音[eː]を表す。 | ē |
U+0C10 | ఐ | TELUGU LETTER AI | 二重母音[aɪ]を表す。 | ai |
U+0C11 | (予約済) | ô | ||
U+0C12 | ఒ | TELUGU LETTER O | 短母音[o]を表す。 | o |
U+0C13 | ఓ | TELUGU LETTER OO | 長母音[oː]を表す。 | ō |
U+0C14 | ఔ | TELUGU LETTER AU | 二重母音[aʊ]を表す。 | au |
子音字 | ||||
U+0C15 | క | TELUGU LETTER KA | 子音[k]を表す。 | k |
U+0C16 | ఖ | TELUGU LETTER KHA | 子音[kʰ]を表す。 | kh |
U+0C17 | గ | TELUGU LETTER GA | 子音[ɡ]を表す。 | g |
U+0C18 | ఘ | TELUGU LETTER GHA | 子音[ɡʱ]を表す。 | gh |
U+0C19 | ఙ | TELUGU LETTER NGA | 子音[ŋ]を表す。 | ṅ |
U+0C1A | చ | TELUGU LETTER CA | 子音[c]を表す。 | c |
U+0C1B | ఛ | TELUGU LETTER CHA | 子音[cʰ]を表す。 | ch |
U+0C1C | జ | TELUGU LETTER JA | 子音[ɟ]を表す。 | j |
U+0C1D | ఝ | TELUGU LETTER JHA | 子音[ɟʱ]を表す。 | jh |
U+0C1E | ఞ | TELUGU LETTER NYA | 子音[ɲ]を表す。 | ñ |
U+0C1F | ట | TELUGU LETTER TTA | 子音[ʈ]を表す。 | ṭ |
U+0C20 | ఠ | TELUGU LETTER TTHA | 子音[ʈʰ]を表す。 | ṭh |
U+0C21 | డ | TELUGU LETTER DDA | 子音[ɖ]を表す。 | ḍ |
U+0C22 | ఢ | TELUGU LETTER DDHA | 子音[ɖʱ]を表す。 | ḍh |
U+0C23 | ణ | TELUGU LETTER NNA | 子音[ɳ]を表す。 | ṇ |
U+0C24 | త | TELUGU LETTER TA | 子音[t]を表す。 | t |
U+0C25 | థ | TELUGU LETTER THA | 子音[tʰ]を表す。 | th |
U+0C26 | ద | TELUGU LETTER DA | 子音[d]を表す。 | d |
U+0C27 | ధ | TELUGU LETTER DHA | 子音[dʱ]を表す。 | dh |
U+0C28 | న | TELUGU LETTER NA | 子音[n]を表す。 | n |
U+0C29 | (予約済) | ṉ | ||
U+0C2A | ప | TELUGU LETTER PA | 子音[p]を表す。 | p |
U+0C2B | ఫ | TELUGU LETTER PHA | 子音[pʰ]を表す。 | ph |
U+0C2C | బ | TELUGU LETTER BA | 子音[b]を表す。 | b |
U+0C2D | భ | TELUGU LETTER BHA | 子音[bʱ]を表す。 | bh |
U+0C2E | మ | TELUGU LETTER MA | 子音[m]を表す。 | m |
U+0C2F | య | TELUGU LETTER YA | 子音[j]を表す。 | y |
U+0C30 | ర | TELUGU LETTER RA | 子音[r]を表す。 | r |
U+0C31 | ఱ | TELUGU LETTER RRA | 子音[r]を表す。
元々は[ɽ]で発音されていたが、現在のテルグ語では両者の発音が同化しており、現在はあまり使われなくなっている。 |
ṟ |
U+0C32 | ల | TELUGU LETTER LA | 子音[l]を表す。 | l |
U+0C33 | ళ | TELUGU LETTER LLA | 子音[ɭ]を表す。 | ḷ |
U+0C34 | ఴ | TELUGU LETTER LLLA | 子音[ɻ]を表していた。10世紀ごろまでは使用されていたが、現在は用いられていない。[5] | ḻ |
U+0C35 | వ | TELUGU LETTER VA | 子音[ʋ]を表す。 | v |
U+0C36 | శ | TELUGU LETTER SHA | 子音[ɕ]を表す。 | ś |
U+0C37 | ష | TELUGU LETTER SSA | 子音[ɕ]を表す。
元々は反り舌音の[ʂ]を表していた。 |
ṣ |
U+0C38 | స | TELUGU LETTER SA | 子音[s]を表す。 | s |
U+0C39 | హ | TELUGU LETTER HA | 子音[h]を表す。 | h |
各種記号 | ||||
U+0C3C | ఼ | TELUGU SIGN NUKTA | ヌクター。子音字を拡張して新たな発音を表す際に用いられる。
タミル文字や、ペルシャ文字およびアラビア文字の翻字に使用される。[2][6] 大きな点として現れることもあるが、気息マーカーとの混同や衝突を避けるために子音のベースラインより十分下に配置する必要がある。[2] |
|
サンスクリット語用の追加 | ||||
U+0C3D | ఽ | TELUGU SIGN AVAGRAHA | アヴァグラハ。連音(サンディ)によって語頭の母音 a が消えたことを表す。 | ’ |
従属母音記号 | ||||
U+0C3E | ా | TELUGU VOWEL SIGN AA | 長母音[ɑː]を表す。 | ā |
U+0C3F | ి | TELUGU VOWEL SIGN I | 短母音[ɪ]を表す。 | i |
U+0C40 | ీ | TELUGU VOWEL SIGN II | 長母音[iː]を表す。 | ī |
U+0C41 | ు | TELUGU VOWEL SIGN U | 短母音[ʊ]を表す。 | u |
U+0C42 | ూ | TELUGU VOWEL SIGN UU | 長母音[uː]を表す。 | ū |
U+0C43 | ృ | TELUGU VOWEL SIGN VOCALIC R | 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。
現代のテルグ語では[ru]と発音される。 |
r̥[3] |
U+0C44 | ౄ | TELUGU VOWEL SIGN VOCALIC RR | 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。
現在のテルグ語では[ruː]と発音される。 |
r̥̄[7] |
U+0C45 | (予約済) | ê | ||
U+0C46 | ె | TELUGU VOWEL SIGN E | 短母音[e]を表す。 | e |
U+0C47 | ే | TELUGU VOWEL SIGN EE | 長母音[eː]を表す。 | ē |
U+0C48 | ై | TELUGU VOWEL SIGN AI | 二重母音[aɪ]を表す。 | ai |
U+0C49 | (予約済) | ô | ||
U+0C4A | ొ | TELUGU VOWEL SIGN O | 短母音[o]を表す。 | o |
U+0C4B | ో | TELUGU VOWEL SIGN OO | 長母音[oː]を表す。 | ō |
U+0C4C | ౌ | TELUGU VOWEL SIGN AU | 二重母音[aʊ]を表す。 | au |
ヴィラーマ | ||||
U+0C4D | ్ | TELUGU SIGN VIRAMA | ハラント(halant)、或いはヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。[2]
レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にヴィラーマ記号が子音字の下に書かれることもある。 |
|
各種記号 | ||||
U+0C55 | ౕ | TELUGU LENGTH MARK | ||
U+0C56 | ౖ | TELUGU AI LENGTH MARK | ||
歴史的な音声記号用異体字 | ||||
U+0C58 | ౘ | TELUGU LETTER TSA | 子音[t͡s]を表す。古い文法書や辞書などに見られる。[8] | ĉ |
U+0C59 | ౙ | TELUGU LETTER DZA | 子音[d͡z]を表す。古い文法書や辞書などに見られる。[8] | z |
U+0C5A | ౚ | TELUGU LETTER RRRA | 正確な音声値が不明な歯茎音の子音を表す文字。[2][9] | ṯ/ḏ[9] |
子音字 | ||||
U+0C5D | ౝ | TELUGU LETTER NAKAARA POLLU | 随伴母音/-a/を伴わない子音[n]を表す。[2] | |
サンスクリット語用の追加母音字 | ||||
U+0C60 | ౠ | TELUGU LETTER VOCALIC RR | 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。
現在のテルグ語では[ruː]と発音される。 |
r̥̄[7] |
U+0C61 | ౡ | TELUGU LETTER VOCALIC LL | 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 | l̥̄[10] |
従属母音記号 | ||||
U+0C62 | ౢ | TELUGU VOWEL SIGN VOCALIC L | 音節主音化した短母音としてのL(IPA:[l̩])を表す。 | l̥[4] |
U+0C63 | ౣ | TELUGU VOWEL SIGN VOCALIC LL | 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 | l̥̄[10] |
予約済 | ||||
U+0C64 | (予約済) | . | ||
U+0C65 | (予約済) | |||
数字 | ||||
U+0C66 | ౦ | TELUGU DIGIT ZERO | テルグ文字における数字の0。 | 0 |
U+0C67 | ౧ | TELUGU DIGIT ONE | テルグ文字における数字の1。 | 1 |
U+0C68 | ౨ | TELUGU DIGIT TWO | テルグ文字における数字の2。 | 2 |
U+0C69 | ౩ | TELUGU DIGIT THREE | テルグ文字における数字の3。 | 3 |
U+0C6A | ౪ | TELUGU DIGIT FOUR | テルグ文字における数字の4。 | 4 |
U+0C6B | ౫ | TELUGU DIGIT FIVE | テルグ文字における数字の5。 | 5 |
U+0C6C | ౬ | TELUGU DIGIT SIX | テルグ文字における数字の6。 | 6 |
U+0C6D | ౭ | TELUGU DIGIT SEVEN | テルグ文字における数字の7。 | 7 |
U+0C6E | ౮ | TELUGU DIGIT EIGHT | テルグ文字における数字の8。 | 8 |
U+0C6F | ౯ | TELUGU DIGIT NINE | テルグ文字における数字の9。 | 9 |
記号 | ||||
U+0C77 | ౷ | TELUGU SIGN SIDDHAM | テキストの冒頭で祈りの言葉として使用される。[2] | |
テルグ分数および重量単位記号 | ||||
U+0C78 | ౸ | TELUGU FRACTION DIGIT ZERO FOR ODD POWERS OF FOUR | 「4の奇数乗分の0」を表す。1/4よりも小さな値を記述する際に用いられる。[8] | |
U+0C79 | ౹ | TELUGU FRACTION DIGIT ONE FOR ODD POWERS OF FOUR | 「4の奇数乗分の1」(1/4, 1/64, 1/1024, ...)を表す。[8] | |
U+0C7A | ౺ | TELUGU FRACTION DIGIT TWO FOR ODD POWERS OF FOUR | 「4の奇数乗分の2」(2/4, 2/64, 2/1024, ...)を表す。[8] | |
U+0C7B | ౻ | TELUGU FRACTION DIGIT THREE FOR ODD POWERS OF FOUR | 「4の奇数乗分の3」(3/4, 3/64, 3/1024, ...)を表す。[8] | |
U+0C7C | ౼ | TELUGU FRACTION DIGIT ONE FOR EVEN POWERS OF FOUR | 「4の偶数乗分の1」(1/16, 1/256, 1/4096 ...)を表す。[8] | |
U+0C7D | ౽ | TELUGU FRACTION DIGIT TWO FOR EVEN POWERS OF FOUR | 「4の偶数乗分の2」(2/16, 2/256, 2/4096 ...)を表す。[8] | |
U+0C7E | ౾ | TELUGU FRACTION DIGIT THREE FOR EVEN POWERS OF FOUR | 「4の偶数乗分の3」(3/16, 3/256, 3/4096 ...)を表す。[8] | |
U+0C7F | ౿ | TELUGU SIGN TUUMU | tuumuという伝統的な体積或いは重量の単位を表す記号。[8] |
このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「サンスクリット語用の追加」(Addition for Sanskrit)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「歴史的な音声記号用異体字」(Historic phonetic variants)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「記号」(Sign)、「テルグ分数および重量単位記号」(Telugu fractions and weights)の12個となっている。[11]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
この小分類にはテルグ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
この小分類にはテルグ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
この小分類にはテルグ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
この小分類にはテルグ文字のうち、サンスクリット語の翻字に用いられる記号1つのみが収録されている。
この小分類にはテルグ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字を形成することがある。
この小分類にはテルグ文字のうち、ハラント(halant)(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。
なお文字名および小分類名の「ヴィラーマ(virama)」とはデーヴァナーガリーにおける同様の機能を持つ記号の名称である。
この小分類にはテルグ文字のうち、かつて音声記号として用いられていた拡張子音字が3つ収録されている。
この小分類にはテルグ文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。
この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点(Generic punctuation for scripts of India)」に相当する。
なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。[2]
この小分類にはテルグ文字で用いられる固有の数字が収録されている。
この小分類にはテルグ文字のうち、テキストの冒頭で祈りの言葉(invocation)として用いられる記号1つのみが収録されている。
この小分類にはテルグ文字において分数や重量の単位を表すための記号が収録されている。
テルグ文字(Telugu)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0C0x | ఀ | ఁ | ం | ః | ఄ | అ | ఆ | ఇ | ఈ | ఉ | ఊ | ఋ | ఌ | ఎ | ఏ | |
U+0C1x | ఐ | ఒ | ఓ | ఔ | క | ఖ | గ | ఘ | ఙ | చ | ఛ | జ | ఝ | ఞ | ట | |
U+0C2x | ఠ | డ | ఢ | ణ | త | థ | ద | ధ | న | ప | ఫ | బ | భ | మ | య | |
U+0C3x | ర | ఱ | ల | ళ | ఴ | వ | శ | ష | స | హ | ఼ | ఽ | ా | ి | ||
U+0C4x | ీ | ు | ూ | ృ | ౄ | ె | ే | ై | ొ | ో | ౌ | ్ | ||||
U+0C5x | ౕ | ౖ | ౘ | ౙ | ౚ | ౝ | ||||||||||
U+0C6x | ౠ | ౡ | ౢ | ౣ | ౦ | ౧ | ౨ | ౩ | ౪ | ౫ | ౬ | ౭ | ౮ | ౯ | ||
U+0C7x | ౷ | ౸ | ౹ | ౺ | ౻ | ౼ | ౽ | ౾ | ౿ | |||||||
注釈
|
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | ドキュメント |
---|---|---|---|---|
1.0.0 | 61 | (to be determined) | ||
5.1 | U+0C3D,0C58..0C59,0C78..0C7F | 11 | L2/06-250 | Michael Everson; Sure¯s. Kolica¯la; Na¯ga¯rjuna Venna (28 July 2006), Proposal to add eighteen characters for Telugu to the BMP (WG2 N3116) (英語) |
L2/06-267 | N. Ganesan (1 August 2006), Comments on L2/06-250, Proposal to add eighteen characters for Telugu (英語) | |||
7.0 | U+0C00 | 1 | (to be determined) | |
U+0C34 | 1 | L2/12-015 | Shriramana Sharma; Suresh Kolichala; Nagarjuna Venna; Vinodh Rajan (23 January 2012), Proposal to encode 0C34 TELUGU LETTER LLLA (WG2 N4214) (英語) | |
L2/12-076 | Andhra Pradesh (6 February 2012), Govt. of Andhra Pradesh's inputs on document no. L2/12-015 (Telugu LLLA) (英語) | |||
8.0 | U+0C5A | 1 | L2/12-016 | Shriramana Sharma; Suresh Kolichala; Nagarjuna Venna; Vinodh Rajan (23 January 2012), Proposal to encode 0C5A TELUGU LETTER RRRA (WG2 N4215) (英語) |
L2/13-121 | Suresh Kolichala (9 May 2013), Letter from Andhra Pradesh re Telugu RRRA (英語) | |||
11.0 | U+0C04 | 1 | L2/16-285 | Srinidhi A; Sridatta A (20 October 2016), Proposal to encode the TELUGU SIGN COMBINING ANUSVARA ABOVE (英語) |
12.0 | U+0C77 | 1 | L2/17-218 | Srinidhi A; Sridatta A (11 August 2017), Proposal to encode the TELUGU SIGN SIDDHAM (revised) (英語) |
14.0 | U+0C3C | 1 | L2/19-401 | Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (17 December 2019), Proposal to Encode Telugu Sign Nukta (英語) |
L2/19-405 | Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (29 December 2019), Additional evidence for the use of Nukta sign in Telugu (英語) | |||
L2/20-085 | Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (18 March 2020), Revised Proposal to Encode Telugu Sign Nukta (英語) | |||
U+0C5D | 1 | L2/11-409 | Shriramana Sharma; Suresh Kolichala; Nagarjuna Venna; Vinodh Rajan (27 October 2011), On the Telugu nakaara-pollu (英語) | |
L2/20-084 | Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (18 March 2020), Revised Proposal to Encode Telugu Letter Nakaara Pollu (英語) | |||
|