区域指示符

区域指示符(英語:regional indicator symbols)是一组用以对ISO 3166-1二位字母代码标准的二字母國家地區代碼进行编码的26个Unicode字符。这种编码允许对于特定地区的符号进行特殊处理。

2010年10月,Unicode 6.0的发布为国家地区旗帜的繪文字表示提供了区域指示符,作为「对每一面旗帜都进行编码」的替代方案。除了作为拉丁字母显示外,这些符号的部分组合还可以在一些设备上渲染成符号对应的国家地区旗帜[1][2]Unicode FAQ页面存档备份,存于互联网档案馆)表明,国家与地区的旗帜不会在Unicode中直接编码到单独的码位上去,而应当以此法编码。[3]

在Unicode编码中,这些符号位于U+1F1E6 🇦 REGIONAL INDICATOR SYMBOL LETTER AU+1F1FF 🇿 REGIONAL INDICATOR SYMBOL LETTER Z之间,在第一辅助平面带圈字母数字补充区段英语Enclosed Alphanumeric Supplement[4]

绘文字旗帜列表

[编辑]

在一些系统中,旗帜的绘文字可能会显示为二位国家地区代码。[5]

一组区域指示符称为一个「绘文字旗帜序列」,虽然其代码代表的是地区而非旗帜。[6]

在所有的26 × 26 = 676个双字母组合中只有270个是合法的Unicode地区代码,包含了通用當地數據儲存庫(CLDR)的以下子集:[6][7][8]

  • CLDR中全部的256个常规的地区代码序列
  • CLDR中的两个宏观区域(macroregion)的代码序列(EU与UN)
  • CLDR中全部12个已弃用的地区代码序列(仅作向前兼容用)
当前的绘文字旗帜列表
旗帜 代码 区域[9] 可能的渲染
🇦🇨 AC 阿森松岛
🇦🇩 AD 安道尔
🇦🇪 AE 阿联酋
🇦🇫 AF 阿富汗
🇦🇬 AG 安提瓜和巴布达
🇦🇮 AI 安圭拉
🇦🇱 AL 阿尔巴尼亚
🇦🇲 AM 亚美尼亚
🇦🇴 AO 安哥拉
🇦🇶 AQ 南极洲
🇦🇷 AR 阿根廷
🇦🇸 AS 美属萨摩亚
🇦🇹 AT 奥地利
🇦🇺 AU 澳大利亚
🇦🇼 AW 阿鲁巴
🇦🇽 AX 奥兰
🇦🇿 AZ 阿塞拜疆
🇧🇦 BA 波黑
🇧🇧 BB 巴巴多斯
🇧🇩 BD 孟加拉国
🇧🇪 BE 比利时
🇧🇫 BF 布基纳法索
🇧🇬 BG 保加利亚
🇧🇭 BH 巴林
🇧🇮 BI 布隆迪
🇧🇯 BJ 贝宁
🇧🇱 BL 圣巴泰勒米
🇧🇲 BM 百慕大
🇧🇳 BN 文莱
🇧🇴 BO 玻利维亚
🇧🇶 BQ 荷兰加勒比区
🇧🇷 BR 巴西
🇧🇸 BS 巴哈马
🇧🇹 BT 不丹
🇧🇻 BV 布韦岛
🇧🇼 BW 博茨瓦纳
🇧🇾 BY 白俄罗斯
🇧🇿 BZ 伯利兹
🇨🇦 CA 加拿大
🇨🇨 CC 科科斯(基林)群岛
🇨🇩 CD 刚果民主共和国
🇨🇫 CF 中非
🇨🇬 CG 刚果共和国
🇨🇭 CH 瑞士
🇨🇮 CI 科特迪瓦
🇨🇰 CK 库克群岛
🇨🇱 CL 智利
🇨🇲 CM 喀麦隆
🇨🇳 CN 中國[註 1]
🇨🇴 CO 哥伦比亚
🇨🇵 CP 克利珀顿岛
🇨🇶 CQ 薩克
🇨🇷 CR 哥斯达黎加
🇨🇺 CU 古巴
🇨🇻 CV 佛得角
🇨🇼 CW 库拉索
🇨🇽 CX 圣诞岛
🇨🇾 CY 塞浦路斯
🇨🇿 CZ 捷克
🇩🇪 DE 德国
🇩🇬 DG 迪戈加西亚岛
🇩🇯 DJ 吉布提
🇩🇰 DK 丹麦
🇩🇲 DM 多米尼克
🇩🇴 DO 多米尼加
🇩🇿 DZ 阿尔及利亚
🇪🇦 EA 休达梅利利亚
🇪🇨 EC 厄瓜多尔
🇪🇪 EE 爱沙尼亚
🇪🇬 EG 埃及
🇪🇭 EH 西撒哈拉
🇪🇷 ER 厄立特里亚
🇪🇸 ES 西班牙
🇪🇹 ET 埃塞俄比亚
🇪🇺 EU 欧盟
🇫🇮 FI 芬兰
🇫🇯 FJ 斐济
🇫🇰 FK 福克兰群岛
🇫🇲 FM 密克罗尼西亚联邦
🇫🇴 FO 法罗群岛
🇫🇷 FR 法国
🇬🇦 GA 加蓬
🇬🇧 GB 英国
🇬🇩 GD 格林纳达
🇬🇪 GE 格鲁吉亚
🇬🇫 GF 法属圭亚那
🇬🇬 GG 根西
🇬🇭 GH 加纳
🇬🇮 GI 直布罗陀
🇬🇱 GL 格陵兰
🇬🇲 GM 冈比亚
🇬🇳 GN 几内亚
🇬🇵 GP 瓜德罗普
🇬🇶 GQ 赤道几内亚
🇬🇷 GR 希腊
🇬🇸 GS 南乔治亚和南桑威奇群岛
🇬🇹 GT 危地马拉
🇬🇺 GU 关岛
🇬🇼 GW 几内亚比绍
🇬🇾 GY 圭亚那
🇭🇰 HK 香港
🇭🇲 HM 赫德岛和麦克唐纳群岛
🇭🇳 HN 洪都拉斯
🇭🇷 HR 克罗地亚
🇭🇹 HT 海地
🇭🇺 HU 匈牙利
🇮🇨 IC 加纳利群岛
🇮🇩 ID 印尼
🇮🇪 IE 爱尔兰
🇮🇱 IL 以色列
🇮🇲 IM 马恩岛
🇮🇳 IN 印度
🇮🇴 IO 英属印度洋领地
🇮🇶 IQ 伊拉克
🇮🇷 IR 伊朗
🇮🇸 IS 冰岛
🇮🇹 IT 意大利
🇯🇪 JE 泽西
🇯🇲 JM 牙买加
🇯🇴 JO 约旦
🇯🇵 JP 日本
🇰🇪 KE 肯尼亚
🇰🇬 KG 吉尔吉斯斯坦
🇰🇭 KH 柬埔寨
🇰🇮 KI 基里巴斯
🇰🇲 KM 科摩罗
🇰🇳 KN 圣基茨和尼维斯
🇰🇵 KP 朝鲜
🇰🇷 KR 南韓
🇰🇼 KW 科威特
🇰🇾 KY 开曼群岛
🇰🇿 KZ 哈萨克斯坦
🇱🇦 LA 老挝
🇱🇧 LB 黎巴嫩
🇱🇨 LC 圣卢西亚
🇱🇮 LI 列支敦士登
🇱🇰 LK 斯里兰卡
🇱🇷 LR 利比里亚
🇱🇸 LS 莱索托
🇱🇹 LT 立陶宛
🇱🇺 LU 卢森堡
🇱🇻 LV 拉脱维亚
🇱🇾 LY 利比亚
🇲🇦 MA 摩洛哥
🇲🇨 MC 摩纳哥
🇲🇩 MD 摩尔多瓦
🇲🇪 ME 黑山
🇲🇫 MF 法属圣马丁
🇲🇬 MG 马达加斯加
🇲🇭 MH 马绍尔群岛
🇲🇰 MK 北马其顿
🇲🇱 ML 马里
🇲🇲 MM 缅甸
🇲🇳 MN 蒙古国
🇲🇴 MO 澳门
🇲🇵 MP 北马里亚纳群岛
🇲🇶 MQ 马提尼克
🇲🇷 MR 毛里塔尼亚
🇲🇸 MS 蒙特塞拉特
🇲🇹 MT 马耳他
🇲🇺 MU 毛里求斯
🇲🇻 MV 马尔代夫
🇲🇼 MW 马拉维
🇲🇽 MX 墨西哥
🇲🇾 MY 马来西亚
🇲🇿 MZ 莫桑比克
🇳🇦 NA 纳米比亚
🇳🇨 NC 新喀里多尼亚
🇳🇪 NE 尼日尔
🇳🇫 NF 诺福克岛
🇳🇬 NG 尼日利亚
🇳🇮 NI 尼加拉瓜
🇳🇱 NL 荷兰
🇳🇴 NO 挪威
🇳🇵 NP 尼泊尔
🇳🇷 NR 瑙鲁
🇳🇺 NU 纽埃
🇳🇿 NZ 新西兰
🇴🇲 OM 阿曼
🇵🇦 PA 巴拿马
🇵🇪 PE 秘鲁
🇵🇫 PF 法属波利尼西亚
🇵🇬 PG 巴布亚新几内亚
🇵🇭 PH 菲律宾
🇵🇰 PK 巴基斯坦
🇵🇱 PL 波兰
🇵🇲 PM 圣皮埃尔和密克隆
🇵🇳 PN 皮特凯恩群岛
🇵🇷 PR 波多黎各
🇵🇸 PS 巴勒斯坦
🇵🇹 PT 葡萄牙
🇵🇼 PW 帕劳
🇵🇾 PY 巴拉圭
🇶🇦 QA 卡塔尔
🇷🇪 RE 留尼旺
🇷🇴 RO 罗马尼亚
🇷🇸 RS 塞尔维亚
🇷🇺 RU 俄罗斯
🇷🇼 RW 卢旺达
🇸🇦 SA 沙特阿拉伯
🇸🇧 SB 所罗门群岛
🇸🇨 SC 塞舌尔
🇸🇩 SD 苏丹
🇸🇪 SE 瑞典
🇸🇬 SG 新加坡
🇸🇭 SH 圣赫勒拿
🇸🇮 SI 斯洛文尼亚
🇸🇯 SJ 斯瓦尔巴和扬马延
🇸🇰 SK 斯洛伐克
🇸🇱 SL 塞拉利昂
🇸🇲 SM 圣马力诺
🇸🇳 SN 塞内加尔
🇸🇴 SO 索马里
🇸🇷 SR 苏里南
🇸🇸 SS 南苏丹
🇸🇹 ST 圣多美和普林西比
🇸🇻 SV 萨尔瓦多
🇸🇽 SX 荷属圣马丁
🇸🇾 SY 叙利亚
🇸🇿 SZ 斯威士兰
🇹🇦 TA 特里斯坦-达库尼亚
🇹🇨 TC 特克斯和凯科斯群岛
🇹🇩 TD 乍得
🇹🇫 TF 法属南部和南极领地
🇹🇬 TG 多哥
🇹🇭 TH 泰国
🇹🇯 TJ 塔吉克斯坦
🇹🇰 TK 托克劳
🇹🇱 TL 东帝汶
🇹🇲 TM 土库曼斯坦
🇹🇳 TN 突尼斯
🇹🇴 TO 汤加
🇹🇷 TR 土耳其
🇹🇹 TT 特立尼达和多巴哥
🇹🇻 TV 图瓦卢
🇹🇼 TW 臺灣[註 2]
🇹🇿 TZ 坦桑尼亚
🇺🇦 UA 乌克兰
🇺🇬 UG 乌干达
🇺🇲 UM 美国本土外小岛屿
🇺🇳 UN 联合国
🇺🇸 US 美国
🇺🇾 UY 乌拉圭
🇺🇿 UZ 乌兹别克斯坦
🇻🇦 VA 梵蒂冈
🇻🇨 VC 圣文森特和格林纳丁斯
🇻🇪 VE 委内瑞拉
🇻🇬 VG 英属维尔京群岛
🇻🇮 VI 美属维尔京群岛
🇻🇳 VN 越南
🇻🇺 VU 瓦努阿图
🇼🇫 WF 瓦利斯和富图纳
🇼🇸 WS 萨摩亚
🇽🇰 XK 科索沃
🇾🇪 YE 也门
🇾🇹 YT 马约特
🇿🇦 ZA 南非
🇿🇲 ZM 赞比亚
🇿🇼 ZW 津巴布韦
已弃用的文字序列
已弃用的文字序列 取而代之的文字序列[10][11]
代码 区域 旗帜 代码 区域 JoyPixels可能的渲染结果
AN 荷属安的列斯 🇨🇼 CW 库拉索
🇸🇽 SX 荷属圣马丁
🇧🇶 BQ 荷兰加勒比区
BU 缅甸 🇲🇲 MM 缅甸
CS 塞尔维亚和黑山 🇷🇸 RS 塞尔维亚
🇲🇪 ME 黑山
DD 东德 🇩🇪 DE 德国
FX 法国本土 🇫🇷 FR 法国
NT 沙特阿拉伯-伊拉克中立区 🇸🇦 SA 沙特阿拉伯
🇮🇶 IQ 伊拉克
QU 欧盟 🇪🇺 EU 欧盟
SU 苏联 🇷🇺 RU 俄罗斯
🇦🇲 AM 亚美尼亚
🇦🇿 AZ 阿塞拜疆
🇧🇾 BY 白俄罗斯
🇪🇪 EE 爱沙尼亚
🇬🇪 GE 格鲁吉亚
🇰🇿 KZ 哈萨克斯坦
🇰🇬 KG 吉尔吉斯斯坦
🇱🇻 LV 拉脱维亚
🇱🇹 LT 立陶宛
🇲🇩 MD 摩尔多瓦
🇹🇯 TJ 塔吉克斯坦
🇹🇲 TM 土库曼斯坦
🇺🇦 UA 乌克兰
🇺🇿 UZ 乌兹别克斯坦
TP 东帝汶 🇹🇱 TL 东帝汶
YD 南也门 🇾🇪 YE 也门
YU 塞尔维亚和黑山 🇷🇸 RS 塞尔维亚
🇲🇪 ME 黑山
ZR 扎伊尔 🇨🇩 CD 刚果民主共和国

Unicode区段

[编辑]
带圈字母数字补充区段英语Enclosed Alphanumeric Supplement[1]的区域指示符部分

Unicode联盟官方码表页面存档备份,存于互联网档案馆) (PDF)

  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1F1Ex (U+1F100–U+1F1E5 已省略)   🇦     🇧     🇨     🇩     🇪     🇫     🇬     🇭     🇮     🇯  
U+1F1Fx   🇰     🇱     🇲     🇳     🇴     🇵     🇶     🇷     🇸     🇹     🇺     🇻     🇼     🇽     🇾     🇿  
Notes
1.^ 依据Unicode 13.0

背景

[编辑]

在2007年,Unicode收到了一份对于广泛使用的绘文字编码提案,这份提案上的绘文字主要出自日本通讯公司NTT DOCOMOKDDI软银集团之手。[12]提案中的符号包含了下列十面旗帜[13] 中国(🇨🇳)、 德国(🇩🇪)、 西班牙(🇪🇸)、 法國(🇫🇷)、 英国(🇬🇧)、 義大利(🇮🇹)、 日本(🇯🇵)、 韩国(🇰🇷)、 俄羅斯(🇷🇺)和 美国(🇺🇸)。有观点认为,仅仅对于这十面旗帜编码这一做法包含偏见。[14]一个被驳回的编码提案是,在保留旗帜的情况下,称它们为「绘文字兼容字符-n」(EMOJI COMPATIBILITY SYMBOL-n)并以标准「EC n」显示,而不展示它们代表的旗帜;[15]另一个被驳回的提案为676种双字母组合中每一种都分配了码位,以ISO 3166标准(如FR代表法国)或国家和地区顶级域(如EU代表欧盟)与旗帜对应。[16]

最终被接受的方案添加了与拉丁字母相对应的26个字符以表示区域指示符,当其按照上文的序列出现时会呈现出对应的旗帜,同时为绘文字的扩充预留了空间以供后续添加。[2]根据Unicode标准,“此类[区域指示符的]组合的主要目的是,为表情符号核心集合中使用的特定字符提供明确双向映射”(the main purpose of such [regional indicator symbol] pairs is to provide unambiguous roundtrip mappings to certain characters used in the emoji core sets[17],此处特指以下十面国旗:[18]🇨🇳、🇩🇪、🇪🇸、🇫🇷、🇬🇧、🇮🇹、🇯🇵、🇰🇷、🇷🇺和🇺🇸。

由于Unicode的区域指示符只提供地区代码、不提供旗帜,特定的系统可以采取不渲染字符的方式以避免引起非议。如在台湾问题中,对于实际统治台湾地区台北政府北京政府拒绝承认,因此在中国大陆的新闻媒体报道中,中华民国国旗会被作马赛克处理,而在大陆法律下的电子产品,「🇹🇼」也会显示为字符缺失或不作为旗帜显示。[19][20]

参见

[编辑]

註釋

[编辑]

参考文献

[编辑]
  1. ^ Andrew West. What's new in Unicode 6.0. Babelstone. [2014-08-18]. (原始内容存档于2014-04-06). 
  2. ^ 2.0 2.1 Michael Everson and Ken Whistler. N3727: Proposal to encode Regional Indicator Symbols in the UCS (PDF). Working Group Document, ISO/IEC JTC1/SC2/WG2 and UTC. [2014-08-18]. (原始内容存档 (PDF)于2015-07-31). 
  3. ^ Unicode FAQ: Emoji and Dingbats. The Unicode Consortium. 2009-10-28 [2014-08-18]. (原始内容存档于2014-07-26). 
  4. ^ Enclosed Alphanumeric Supplement, Range 1F100 - 1F1FF, The Unicode Standard, Version 6.0 (PDF). Unicode Consortium. 2010 [2014-08-18]. (原始内容存档 (PDF)于2015-07-30). 
  5. ^ Flags. emojipedia.com. [2020-02-04]. (原始内容存档于2020-01-31). 
  6. ^ 6.0 6.1 UTR #51: Unicode Emoji, Annex B: Valid Emoji Flag Sequences, Unicode Consortium web, 2020-02-11 [2020-07-11], (原始内容存档于2020-06-30) 
  7. ^ UTR #35: Unicode Locale Data Markup Language (LDML), Validity Data. Unicode Consortium. [2020-07-11]. (原始内容存档于2020-07-14). 
  8. ^ CLDR v37 Region Validity Data. Unicode Common Locale Data Repository (CLDR). 2020-04-23. [失效連結]
  9. ^ UCD: Emoji Sequence Data for UTR #51. Unicode Consortium. 2020-01-28 [2020-07-11]. (原始内容存档于2024-03-27). 
  10. ^ UTR #35: Unicode Locale Data Markup Language (LDML), Supplemental Metadata. Unicode Consortium. [2020-07-11]. (原始内容存档于2020-07-11). 
  11. ^ CLDR v37 Supplemental Metadata. Unicode Common Locale Data Repository (CLDR). 2020-04-23. [失效連結]
  12. ^ Momoi, Kat; Davis, Mark; Scherer, Markus. L2/07-257: Working Draft Proposal for Encoding Emoji Symbols. 2007-08-03 [2014-08-18]. (原始内容存档于2014-07-12). 
  13. ^ Unicode Mapping for Emoji with Reference to Japanese Carriers, AU/KDDI, DoCoMo, and Softbank (ZIP archive file format). [2014-08-18]. (原始内容存档于2015-07-31). 
  14. ^ L2/09-114 N3607: Towards an encoding of symbol characters used as emoji (PDF). 2009-04-06 [2014-08-18]. (原始内容存档 (PDF)于2015-07-31). 
  15. ^ INCITS/L2/09-304: Comments accompanying the U.S. negative vote on PDAM 8 to ISO/IEC 10646:2003 (SC2 N4078) (PDF). 2009-08-15 [2014-08-18]. (原始内容存档 (PDF)于2015-07-31). 
  16. ^ Pentzlin, Karl. L2/08-305: Some suggestions about the encoding of national flags as requested by the Emoji proposal (PDF). 2008-08-09 [2014-08-18]. (原始内容存档 (PDF)于2015-05-01). 
  17. ^ The Unicode Standard, Version 6.2, Chapter 15: Symbols (PDF). Unicode, Inc. September 2012: 534 [2020-07-11]. ISBN 978-1-936213-07-8. (原始内容存档 (PDF)于2020-08-09). 
  18. ^ Emoji Sources (plain text). Unicode, Inc. 2013-12-17 [2014-08-18]. (原始内容存档于2014-08-23). 
  19. ^ 法制网数十家世界500强外企官网错误标识我国港澳台地区 专家建议依法处置错误标识中国领土行为页面存档备份,存于互联网档案馆
  20. ^ 港澳iOS 13中華民國國旗被「河蟹」消失無蹤 港網民議論 - 科技. 中時新聞網. 2019-10-08 [2023-05-24]. (原始内容存档于2020-07-11) (中文(臺灣)).