ブラーフミー文字 (Unicodeのブロック)

ブラーフミー文字 (Unicodeのブロック)
Brahmi
範囲 U+11000..U+1107F
(128 個の符号位置)
追加多言語面
用字 ブラーフミー文字
主な言語・文字体系
割当済 115 個の符号位置
未使用 13 個の保留
Unicodeのバージョン履歴
6.0 108 (+108)
7.0 109 (+1)
14.0 115 (+6)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

ブラーフミー文字(ブラーフミーもじ、英語: Brahmi)は、Unicodeブロックの一つ。

解説

[編集]

10世紀以前に主に北インドで話されていた、インド・ヨーロッパ語族インド・イラン語派インド語群に属するプラークリットを表記するためのブラーフミー文字を収録している。プラークリットは複数の言語の総称であり、パーリ語マガダ語マハーラーシュトラ語ガンダーラ語が下位区分として属している。ブラーフミー文字は南アジア東南アジアの多くの文字体系の祖先にあたる。

また、いくつかの拡張文字を加えて現在南インドタミル・ナードゥ州スリランカなどで話されているドラヴィダ語族タミル語の古代語である古タミル語の表記にも用いられた。この拡張字母を加えたブラーフミー文字を特にタミル・ブラーフミー文字英語版(英語: Tamil-Brahmi)と呼ぶ。

インドアーンドラ・プラデーシュ州で見つかったバティプロル英語版という村で発見された碑文においてプラークリットの記述に用いられていたブラーフミー文字の派生の文字体系であるバティプロル文字英語版も同じ文字体系として本ブロックに統合されている[1]

また、一部の母音字などの字形が異なるものもあるが、4 世紀から 6 世紀にかけてグプタ朝で用いられていたブラーフミー文字の変種の一つであるグプタ文字も、ブラーフミー文字の書体の一つとして符号位置を統合されている。

ブラーフミー文字は音素文字のうち子音字単独では暗黙の随伴母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。ラテン文字などと同様に左から右への横書き(左横書き)であり、単語毎に分かち書きをする。

加えて、アラビア文字タイ文字などと同様に独自の数字体系(ブラーフミー数字)を有している。現代の位取り記数法を取る10進法の数字はこのブラーフミー数字に由来している。

符号位置の順序はおおむね伝統的なブラーフミー文字の順序に従っている。

Unicodeのバージョン6.0において初めて追加された。

収録文字

[編集]

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(及び一部はIAST)に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
各種記号
U+11000 𑀀 BRAHMI SIGN CANDRABINDU アヌナーシカ。

母音字や母音記号に付き、母音を鼻母音で発音することを表す。

U+11001 𑀁 BRAHMI SIGN ANUSVARA アヌスヴァーラ

直後に音節が後続する子音字に付き、直後の子音と同じ調音点鼻音が挿入されることを表す。日本語における「」に相当する。

U+11002 𑀂 BRAHMI SIGN VISARGA ヴィサルガ

音節末に[h]を伴うことを表す。

U+11003 𑀃 BRAHMI SIGN JIHVAMULIYA 無声軟口蓋摩擦音(IPA:[x])を表す。子音字が後続するとその子音字の真上に書かれ、ダイアクリティカルマークのように機能する[2] [2]
U+11004 𑀄 BRAHMI SIGN UPADHMANIYA 無声両唇摩擦音(IPA:[ɸ])を表す。子音字が後続するとその子音字の真上に書かれ、ダイアクリティカルマークのように機能する[2] [2]
独立母音字
U+11005 𑀅 BRAHMI LETTER A 短母音[a]を表す。 a
U+11006 𑀆 BRAHMI LETTER AA 長母音[aː]を表す。 ā
U+11007 𑀇 BRAHMI LETTER I 短母音[i]を表す。 i
U+11008 𑀈 BRAHMI LETTER II 長母音[iː]を表す。 ī
U+11009 𑀉 BRAHMI LETTER U 短母音[u]を表す。 u
U+1100A 𑀊 BRAHMI LETTER UU 長母音[uː]を表す。 ū
U+1100B 𑀋 BRAHMI LETTER VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。 [3]
U+1100C 𑀌 BRAHMI LETTER VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。 r̥̄[4]
U+1100D 𑀍 BRAHMI LETTER VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。 [5]
U+1100E 𑀎 BRAHMI LETTER VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 l̥̄[6]
U+1100F 𑀏 BRAHMI LETTER E 長母音[eː]を表す。 e
U+11010 𑀐 BRAHMI LETTER AI 長母音二重母音[ai̯]を表す。 ai
U+11011 𑀑 BRAHMI LETTER O 長母音[oː]を表す。 o
U+11012 𑀒 BRAHMI LETTER AU 二重母音[au̯]を表す。 au
子音字
U+11013 𑀓 BRAHMI LETTER KA 子音[k]を表す。 k
U+11014 𑀔 BRAHMI LETTER KHA 子音[kʰ]を表す。 kh
U+11015 𑀕 BRAHMI LETTER GA 子音[ɡ]を表す。 g
U+11016 𑀖 BRAHMI LETTER GHA 子音[ɡʱ]を表す。 gh
U+11017 𑀗 BRAHMI LETTER NGA 子音[ŋ]を表す。
U+11018 𑀘 BRAHMI LETTER CA 子音[c]を表す。 c
U+11019 𑀙 BRAHMI LETTER CHA 子音[cʰ]を表す。 ch
U+1101A 𑀚 BRAHMI LETTER JA 子音[ɟ]を表す。 j
U+1101B 𑀛 BRAHMI LETTER JHA 子音[ɟʱ]を表す。 jh
U+1101C 𑀜 BRAHMI LETTER NYA 子音[ɲ]を表す。 ñ
U+1101D 𑀝 BRAHMI LETTER TTA 子音[ʈ]を表す。
U+1101E 𑀞 BRAHMI LETTER TTHA 子音[ʈʰ]を表す。 ṭh
U+1101F 𑀟 BRAHMI LETTER DDA 子音[ɖ]を表す。
U+11020 𑀠 BRAHMI LETTER DDHA 子音[ɖʱ]を表す。 ḍh
U+11021 𑀡 BRAHMI LETTER NNA 子音[ɳ]を表す。
U+11022 𑀢 BRAHMI LETTER TA 子音[t]を表す。 t
U+11023 𑀣 BRAHMI LETTER THA 子音[tʰ]を表す。 th
U+11024 𑀤 BRAHMI LETTER DA 子音[d]を表す。 d
U+11025 𑀥 BRAHMI LETTER DHA 子音[dʱ]を表す。 dh
U+11026 𑀦 BRAHMI LETTER NA 子音[n]を表す。 n
U+11027 𑀧 BRAHMI LETTER PA 子音[p]を表す。 p
U+11028 𑀨 BRAHMI LETTER PHA 子音[pʰ]を表す。 ph
U+11029 𑀩 BRAHMI LETTER BA 子音[b]を表す。 b
U+1102A 𑀪 BRAHMI LETTER BHA 子音[bʱ]を表す。 bh
U+1102B 𑀫 BRAHMI LETTER MA 子音[m]を表す。 m
U+1102C 𑀬 BRAHMI LETTER YA 子音[j]を表す。 y
U+1102D 𑀭 BRAHMI LETTER RA 子音[r]を表す。 r
U+1102E 𑀮 BRAHMI LETTER LA 子音[l]を表す。 l
U+1102F 𑀯 BRAHMI LETTER VA 子音[ʋ]を表す。 v
U+11030 𑀰 BRAHMI LETTER SHA 子音[ɕ]を表す。 ś
U+11031 𑀱 BRAHMI LETTER SSA 子音[ʂ]を表す。
U+11032 𑀲 BRAHMI LETTER SA 子音[s]を表す。 s
U+11033 𑀳 BRAHMI LETTER HA 子音[h]を表す。 h
U+11034 𑀴 BRAHMI LETTER LLA 子音[ɭ]を表す。

字母/ḍa/(U+1101F 𑀟 BRAHMI LETTER DDA)から派生した文字である。

U+11035 𑀵 BRAHMI LETTER OLD TAMIL LLLA タミル・ブラーフミー文字英語版で子音[ɻ]を表す。
U+11036 𑀶 BRAHMI LETTER OLD TAMIL RRA タミル・ブラーフミー文字で子音[r]を表す。

なお、タミル・ブラーフミー文字では通常の字母ra(U+1102D 𑀭)は子音[ɾ]を表す。

U+11037 𑀷 BRAHMI LETTER OLD TAMIL NNNA タミル・ブラーフミー文字で子音[n](歯茎音のn、拡張IPA:[n͇])を表す。

なお、タミル・ブラーフミー文字では通常の字母na()は歯音の[]を表す。

従属母音記号
U+11038 𑀸 BRAHMI VOWEL SIGN AA 長母音[aː]を表す。 ā
U+11039 𑀹 BRAHMI VOWEL SIGN BHATTIPROLU AA バティプロル文字英語版における長母音記号aaの字形。 ā
U+1103A 𑀺 BRAHMI VOWEL SIGN I 短母音[i]を表す。 i
U+1103B 𑀻 BRAHMI VOWEL SIGN II 長母音[iː]を表す。 ī
U+1103C 𑀼 BRAHMI VOWEL SIGN U 短母音[u]を表す。 u
U+1103D 𑀽 BRAHMI VOWEL SIGN UU 長母音[uː]を表す。 ū
U+1103E 𑀾 BRAHMI VOWEL SIGN VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。 [3]
U+1103F 𑀿 BRAHMI VOWEL SIGN VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。 r̥̄[4]
U+11040 𑁀 BRAHMI VOWEL SIGN VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。 [5]
U+11041 𑁁 BRAHMI VOWEL SIGN VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 l̥̄[6]
U+11042 𑁂 BRAHMI VOWEL SIGN E 長母音[eː]を表す。 e
U+11043 𑁃 BRAHMI VOWEL SIGN AI 長母音二重母音[ai̯]を表す。 ai
U+11044 𑁄 BRAHMI VOWEL SIGN O 長母音[oː]を表す。 o
U+11045 𑁅 BRAHMI VOWEL SIGN AU 二重母音[au̯]を表す。 au
ヴィラーマ
U+11046 𑁆 BRAHMI VIRAMA ヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。

レンダー上は、子音連続を表す場合次の文字と縦に並べて繋がったような合字を形成するための不可視の制御文字として機能する。

約物
U+11047 𑁇 BRAHMI DANDA ダンダ。句点やラテン文字などにおけるピリオド(.)に相当する。韻文では半詩節の終わり(パダ)を表す。 .
U+11048 𑁈 BRAHMI DOUBLE DANDA 段落の終わりを表す記号。韻文においてスタンザ(詩節)の終わりを表す。
U+11049 𑁉 BRAHMI PUNCTUATION DOT
U+1104A 𑁊 BRAHMI PUNCTUATION DOUBLE DOT
U+1104B 𑁋 BRAHMI PUNCTUATION LINE
U+1104C 𑁌 BRAHMI PUNCTUATION CRESCENT BAR
U+1104D 𑁍 BRAHMI PUNCTUATION LOTUS
数値
U+11052 𑁒 BRAHMI NUMBER ONE 単位数字の1
U+11053 𑁓 BRAHMI NUMBER TWO 単位数字の2
U+11054 𑁔 BRAHMI NUMBER THREE 単位数字の3
U+11055 𑁕 BRAHMI NUMBER FOUR 単位数字の4
U+11056 𑁖 BRAHMI NUMBER FIVE 単位数字の5
U+11057 𑁗 BRAHMI NUMBER SIX 単位数字の6
U+11058 𑁘 BRAHMI NUMBER SEVEN 単位数字の7
U+11059 𑁙 BRAHMI NUMBER EIGHT 単位数字の8
U+1105A 𑁚 BRAHMI NUMBER NINE 単位数字の9
U+1105B 𑁛 BRAHMI NUMBER TEN 単位数字の10
U+1105C 𑁜 BRAHMI NUMBER TWENTY 単位数字の20
U+1105D 𑁝 BRAHMI NUMBER THIRTY 単位数字の30
U+1105E 𑁞 BRAHMI NUMBER FORTY 単位数字の40
U+1105F 𑁟 BRAHMI NUMBER FIFTY 単位数字の50
U+11060 𑁠 BRAHMI NUMBER SIXTY 単位数字の60
U+11061 𑁡 BRAHMI NUMBER SEVENTY 単位数字の70
U+11062 𑁢 BRAHMI NUMBER EIGHTY 単位数字の80
U+11063 𑁣 BRAHMI NUMBER NINETY 単位数字の90
U+11064 𑁤 BRAHMI NUMBER ONE HUNDRED 単位数字の100
U+11065 𑁥 BRAHMI NUMBER ONE THOUSAND 単位数字の1,000
数字
U+11066 𑁦 BRAHMI DIGIT ZERO 数字の0 0
U+11067 𑁧 BRAHMI DIGIT ONE 数字の1 1
U+11068 𑁨 BRAHMI DIGIT TWO 数字の2 2
U+11069 𑁩 BRAHMI DIGIT THREE 数字の3 3
U+1106A 𑁪 BRAHMI DIGIT FOUR 数字の4 4
U+1106B 𑁫 BRAHMI DIGIT FIVE 数字の5 5
U+1106C 𑁬 BRAHMI DIGIT SIX 数字の6 6
U+1106D 𑁭 BRAHMI DIGIT SEVEN 数字の7 7
U+1106E 𑁮 BRAHMI DIGIT EIGHT 数字の8 8
U+1106F 𑁯 BRAHMI DIGIT NINE 数字の9 9
ヴィラーマ
U+11070 𑁰 BRAHMI SIGN OLD TAMIL VIRAMA 古タミル語のヴィラーマおよび下記のその他の古代タミル語文字は、ブラーフミー文字で古タミル語を表記するときに使用される拡張機能である[7]

通常のヴィラーマ(U+11046 𑁆 BRAHMI VIRAMA)とは異なり、複雑な合字形成をせずただ文字の右上に点が打たれる[8]

独立母音字
U+11071 𑁱 BRAHMI LETTER OLD TAMIL SHORT E タミル・ブラーフミー文字において短母音[e]を表す。 ĕ
U+11072 𑁲 BRAHMI LETTER OLD TAMIL SHORT O タミル・ブラーフミー文字において短母音[o]を表す。 ŏ
従属母音記号
U+11073 𑁳 BRAHMI VOWEL SIGN OLD TAMIL SHORT E タミル・ブラーフミー文字において短母音[e]を表す。 ĕ
U+11074 𑁴 BRAHMI VOWEL SIGN OLD TAMIL SHORT O タミル・ブラーフミー文字において短母音[o]を表す。 ŏ
子音字
U+11075 𑁵 BRAHMI LETTER OLD TAMIL LLA U+11034 𑀴 BRAHMI LETTER LLAのタミル・ブラーフミー文字における字形。

字母/la/(U+1102E 𑀮 BRAHMI LETTER LA)から派生した文字である[8]

数字接合子
U+1107F 𑁿 BRAHMI NUMBER JOINER 乗算を表すブラーフミー数字の連結を形成するために使用されるヴィラーマ[7]

ブラーフミー文字が単位数字を用いていた時期には100の位の数値を表すために100を表すU+11064 𑁤 BRAHMI NUMBER ONE HUNDREDの後に1の位の数値を繋げて書くことで表現していた。例えば400は𑁤𑁿𑁕(100×4)となる。一方、離して書くと加算と解釈され、例えば𑁤𑁕は100+4=104を意味していた。

この乗算における合字を表現するため元々ゼロ幅接合子(ZWJ; U+200D)が用いられていたが、結合子が意味的に重要になる(制御記号の有無によって意味、この場合は数値が変化する)ため、Unicodeの原則に反するという指摘があり、新たに別の接合子として符号位置が割り当てられることとなった[9]

小分類

[編集]

このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「約物」(Punctuation)、「数値」(Numbers)、「数字」(Digits)、「数字接合子」(Number joiner)の9つとなっている[7]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。また、収録文字が1文字しかない小分類については小分類名が単数形で表現されているが、本記事では単数形か複数形かによる小分類名の表記ゆれについては別の小分類として扱わず、同一の小分類として扱うこととする。

各種記号(Various signs

[編集]

この小分類にはブラーフミー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字(Independent vowels

[編集]

この小分類にはブラーフミー文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字(Consonants

[編集]

この小分類にはブラーフミー文字のうち、基本的な子音字が収録されている。

従属母音記号(Dependent vowel signs

[編集]

この小分類にはブラーフミー文字のうち、子音字に結合する母音記号が収録されている。

ヴィラーマ(Virama

[編集]

この小分類にはブラーフミー文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ暗黙の随伴母音/-a/を読まずに子音のみを発音することを表す記号が収録されている。

約物(Punctuation

[編集]

この小分類にはブラーフミー文字で用いられる句読点などの約物類が収録されている。

数値(Numbers

[編集]

この小分類にはブラーフミー文字のうち、位取り記数法を用いず、単位数字を並べて表現する数値記号(Unicode上では10進法の位取り記数法を用いる"digit"とは区別される)が収録されている。

数字(Digits

[編集]

この小分類にはブラーフミー文字で用いられる、10進法の位取り記数法を取る固有の数字が収録されている。

欧文などで用いられる算用数字アラビア文字で用いられるアラビア・インド数字はこのブラーフミー数字から派生したものである。

数字接合子(Number joiner

[編集]

この小分類にはブラーフミー文字のうち、乗算を表すブラーフミー数字の連結を形成するために使用されるヴィラーマ[7]が収録されている。

文字コード

[編集]
ブラーフミー文字(Brahmi)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1100x 𑀀 𑀁 𑀂 𑀃 𑀄 𑀅 𑀆 𑀇 𑀈 𑀉 𑀊 𑀋 𑀌 𑀍 𑀎 𑀏
U+1101x 𑀐 𑀑 𑀒 𑀓 𑀔 𑀕 𑀖 𑀗 𑀘 𑀙 𑀚 𑀛 𑀜 𑀝 𑀞 𑀟
U+1102x 𑀠 𑀡 𑀢 𑀣 𑀤 𑀥 𑀦 𑀧 𑀨 𑀩 𑀪 𑀫 𑀬 𑀭 𑀮 𑀯
U+1103x 𑀰 𑀱 𑀲 𑀳 𑀴 𑀵 𑀶 𑀷 𑀸 𑀹 𑀺 𑀻 𑀼 𑀽 𑀾 𑀿
U+1104x 𑁀 𑁁 𑁂 𑁃 𑁄 𑁅 𑁆 𑁇 𑁈 𑁉 𑁊 𑁋 𑁌 𑁍
U+1105x 𑁒 𑁓 𑁔 𑁕 𑁖 𑁗 𑁘 𑁙 𑁚 𑁛 𑁜 𑁝 𑁞 𑁟
U+1106x 𑁠 𑁡 𑁢 𑁣 𑁤 𑁥 𑁦 𑁧 𑁨 𑁩 𑁪 𑁫 𑁬 𑁭 𑁮 𑁯
U+1107x 𑁰 𑁱 𑁲 𑁳 𑁴 𑁵 𑁿
注釈
1.^バージョン16.0時点


履歴

[編集]

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
6.0 U+11000..1104D,11052..1106F 108 L2/08-277 Michael Everson (8 August 2008), Progressing the encoding of Brahmi in the SMP (WG2 N3490R) (英語)
L2/10-260 Andrew Glass; Stefan Baums (27 July 2010), Proposal to change the glyph for Brahmi Number One Thousand (U+11065) (英語)
L2/10-330 Shriramana Sharma (15 September 2010), Concerning the Brahmi and Sharada characters for jihvamuliya and upadhmaniya (revised) (英語)
7.0 U+1107F 1 L2/10-340 Shriramana Sharma (15 September 2010), Using ZWJ in the encoded representation of Brahmi numbers (英語)
L2/11-357 Andrew Glass; Shriramana Sharma (4 November 2011), Proposal to encode 1107F Brahmi Number Joiner (revised) (英語)
14.0 U+11070..11075 6 L2/12-165 Naga Ganesan (2 May 2012), Brahmi Letter LLA glyph in TUS (英語)
L2/12-226 Shriramana Sharma (10 July 2012), Proposal to add two characters for Brahmi (英語)
L2/12-236 Shriramana Sharma (20 July 2012), Update on Brahmi and other Indic unification issues (英語)
L2/19-402 Vinodh Rajan; Shriramana Sharma (18 December 2019), Proposal to Encode 6 Characters in the Brahmi Block (英語)
L2/20-037 Andrew Glass (9 January 2020), Comments on L2/19-402 Proposal to Encode 6 Characters in the Brahmi Block (英語)
L2/20-069 Vinodh Rajan; Shriramana Sharma (24 February 2020), Proposal to Annotate Brahmi Sign Anusvara (英語)
L2/20-129 Naga Ganesan (1 June 2020), Comments on L2/20-069: Encoding of Tamil Brahmi Virama (U+11070) (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

[編集]
  1. ^ Michael Everson (2008年8月8日). “Progressing the encoding of Brahmi in the SMP (WG2 N3490R)” (英語). Unicode. 2025年5月30日閲覧。
  2. ^ a b c d Shriramana Sharma (2010年9月15日). “Concerning the Brahmi and Sharada characters for jihvamuliya and upadhmaniya (revised)” (英語). Unicode. 2025年5月30日閲覧。
  3. ^ a b IASTではṛと表記される。
  4. ^ a b IASTではṝと表記される。
  5. ^ a b IASTではḷと表記される。
  6. ^ a b IASTではḹと表記される。
  7. ^ a b c d “The Unicode Standard, Version 15.1 - U11000.pdf” (PDF). The Unicode Standard (英語). 2025年5月30日閲覧.
  8. ^ a b Vinodh Rajan, Shriramana Sharma (2019年12月18日). “Proposal to Encode 6 Characters in the Brahmi Block” (英語). Unicode. 2025年5月30日閲覧。
  9. ^ Andrew Glass, Shriramana Sharma (2011年11月4日). “Proposal to encode 1107F Brahmi Number Joiner (revised)” (英語). Unicode. 2025年5月30日閲覧。

関連項目

[編集]