Bộ gõ Thương Hiệt | |||||||||||||||||||||||
Cách nhập chữ 倉頡輸入法 (Hán-Việt: Thương Hiệt du nhập pháp, nghĩa: Bộ gõ Thương Hiệt) bằng chữ Hán phồn thể | |||||||||||||||||||||||
Phồn thể | 倉頡輸入法 | ||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Giản thể | 仓颉输入法 | ||||||||||||||||||||||
|
Bộ gõ Thương Hiệt (tiếng Anh: Cangjie input method hoặc Tsang-chieh input method, tiếng Trung: 倉頡輸入法) là bộ gõ chữ Hán, giúp người dùng có thể nhập chữ Hán vào máy tính thông qua bàn phím tiêu chuẩn. Được Châu Bang Phục (朱邦復, Chu Bong-Foo) sáng tạo năm 1976, bộ gõ này được đặt theo tên của Thương Hiệt, nhân vật thần thoại được xem là sáng tạo ra chữ Hán; theo gợi ý của Tưởng Vĩ Quốc (蔣緯國), khi ấy là Bộ trưởng Bộ Quốc phòng Trung Hoa Dân Quốc. Ban đầu, bộ gõ chỉ hỗ trợ chữ Hán phồn thể, nhưng hiện nay bộ gõ Thương Hiệt đã được nâng cấp để hỗ trợ cả chữ giản thể.
Thương Hiệt là bộ gõ chữ Hán đầu tiên có dạng bàn phím QWERTY, trong khi các phương thức nhập chữ Hán trước đó đều có từ 40-2.400 phím, ngoại trừ phương pháp mã hóa 3 góc (Three Corner coding method, 三角編碼索引) chỉ sử dụng bàn phím số. Châu Bang Phục nhận thấy rằng bàn phím QWERTY sẽ ngày một phổ biến và trở thành tiêu chuẩn quốc tế, và cho rằng nên lấy nó làm phương tiện nhập liệu văn bản chữ Hán.[1] Năm 1982, Châu Bang Phục từ bỏ bằng sáng chế Bộ gõ Thương Hiệt bởi ông cho rằng nó thuộc về di sản văn hóa Trung Hoa.[2] Kể từ đó, bộ gõ này được cung cấp miễn phí, bất kỳ ai cũng được quyền sử dụng và hiệu chỉnh tùy ý, khiến Thương Hiệt trở thành một bộ gõ thông dụng trên các hệ máy hỗ trợ chữ Hán phồn thể.
Trong tên các tập tin và những nơi khác, tên của bộ gõ thường được viết tắt là cj.
Bộ gõ Thương Hiệt dựa vào tự dạng (tức hình dạng của chữ Hán) để đánh chữ, khác hẳn với bộ gõ Bính âm vốn lấy ngữ âm làm cơ sở. Mỗi một đồ họa cơ bản có một “tự căn” (字根) làm đại diện, tổng số là 24, ứng với mỗi ký tự Latinh trên bàn phím QWERTY tiêu chuẩn. Phím X dùng để nhập các "chữ khó" không gõ được bằng mã thông thường. Trong các biểu diễn phím-ký tự, chúng được chia thành bốn nhóm nhỏ: Philosophical Set (tương ứng các ký tự từ 'A' đến 'G' và đại diện cho mặt trời, mặt trăng và ngũ hành), Strokes Set (tương ứng các ký tự từ 'H' đến 'N' thể hiện các nét ngắn và tinh tế), Body-Related Set (tương ứng các ký tự từ 'O' đến 'R' đại diện cho các bộ phận khác nhau trong giải phẫu cơ thể người), và Shapes Set (tương ứng các ký tự từ 'S' đến 'Y' và thể hiện các nét phức tạp và bao hàm).
Thành phần tạo chữ cơ bản trong bộ gõ Thương Hiệt thường được gọi là "tự căn" (字根), thành phần dựa trên phép dựng hình; chứ không phải bộ thủ truyền thống, cũng không dựa trên thứ tự nét bút.
Có 24 tự căn nhưng có đến 26 phím; 24 tự căn liên kết với 76 phụ trợ tự hình (輔助 字形), trong nhiều trường hợp là các phiên bản xoay hoặc hoán vị của các tự căn. Ví dụ, phím A (日) có thể đại diện cho chính nó, rộng hơn một chút 曰 hoặc xoay 90°.
24 phím được xếp thành 4 nhóm
Nhóm | Phím | Tên | Nghĩa chính |
---|---|---|---|
Triết lý | A | 日 nhật |
|
B | 月 nguyệt |
| |
C | 金 kim |
| |
D | 木 mộc |
| |
E | 水 thủy | 氵, 又, 氺 | |
F | 火 hỏa |
| |
G | 土 thổ | 土, 士 | |
Bút hoạch | H | 竹 trúc |
|
I | 戈 qua |
| |
J | 十 thập | 十, 宀 | |
K | 大 đại | Nét hình chữ X: 乂ㄨナ犭疒廴 | |
L | 中 trung |
| |
M | 一 nhất |
| |
N | 弓 cung | Nét hình cung, móc câu: フ, ク, 乙, 亅,ㄱ | |
Nhân thể | O | 人 nhân |
|
P | 心 tâm |
| |
Q | 手 thủ | 手, ヰ,扌 | |
R | 口 khẩu | Bộ khẩu 口 | |
Tự hình | S | 尸 thi |
|
T | 廿 trấp |
| |
U | 山 sơn | Ba mặt đóng, mở bên trên: ㄩ, 乚, 屮 | |
V | 女 nữ |
| |
W | 田 điền |
| |
Y | 卜 bốc |
| |
Phím trùng, đặc biệt | X | 重/難 trùng/nan |
|
Kí tự đặc biệt | Z | Xem ghi chú | Các kí hiệu đặc biệt, các dấu chấm câu (như 。,、,「 」,『 』) |
Kí tự đại diện | *(Shift+8) | Kí tự đại diện | Có thể thay thế bất kì phím nào tự vị trí thứ 2 đến 5 và trả về danh sách tổ hợp. Hữu ích cho những lần đoán khi chắc chắn về phím đầu và cuối (VD: Nhập 竹 * 竹 sẽ cho ra danh sách 身, 物, 秒, 第 |
Người đánh máy phải quen với một số quy tắc phân tách để lấy mã Thương Hiệt:
Các quy tắc tuân theo các nguyên tắc sau:
Một số chữ được tách theo cùng 1 cách cho dù các quy tắc nói rằng chúng có được tách theo cách này hay không. Có ít các trường hợp như vậy
Chữ | Cách tách cố định |
---|---|
門 môn | 日弓 (AN) |
目 mục | 月山 (BU) |
鬼 quỷ | 竹戈 (HI) |
几 kỉ | 竹弓 (HN) |
贏 doanh | 卜弓月山金 (YNBUC) |
吂 mang | 卜女口 (YVR) |
隹 chuy | 人土 (OG) |
气 khí | 人一弓 (OMN) |
畿 (kỳ) bỏ 田 (điền) | 女戈 (VI) |
鬥 đấu | 中弓 (LN) |
阝phụ | 弓中 (NL) |
Một số chữ không thể tách. Chúng được biểu thị bằng phím X 難 trên bàn phím
Chữ | Cách tách cố định |
---|---|
臼 cữu | 竹難 (HX) |
與 dữ, dư, dự | 竹難卜金 (HXYC) |
興 hưng, hứng | 竹難月金 (HXBC) |
盥 quán | 竹難月廿 (HXBT) |
姊 tỷ | 女中難竹 (VLXH) |
齊 tề | 卜難 (YX) |
兼 kiêm | 廿難金 (TXC) |
鹿 lộc | 戈難心 (IXP) |
身 thân, quyên | 竹難竹 (HXH) |
卍 vạn | 弓難 (NX) |
黽 mãnh, mẫn | 口難山 (RXU) |
龜 quy | 弓難山 (NXU) |
廌 trãi, trĩ | 戈難火 (IXF) |
慶 khánh | 戈難水 (IXE) |
淵 uyên | 水中難中 (ELXL) |
肅 túc | 中難 (LX) |
Bộ gõ Thương Hiệt được thiết kế để trở thành một hệ thống dễ sử dụng giúp thúc đẩy việc sử dụng máy tính của Trung Quốc. Tuy nhiên, nhiều người dùng thấy Thương Hiệt rất khó học và sử dụng, gặp nhiều khó khăn do hướng dẫn kém.
Nếu thực hành đủ, người dùng có thể khắc phục các vấn đề trên. Những người đánh máy cảm ứng điển hình có thể gõ tiếng Trung với tốc độ 25 kí tự mỗi phút (cpm) hoặc tốt hơn khi dùng Thương Hiệt, mặc dù họ gặp khó khăn trong việc nhớ danh sách các phụ trợ tự hình hoặc các quy tắc phân tách. Theo báo cáo, những người đánh máy Thương Hiệt có kinh nghiệm có thể đạt được tốc độ đánh máy từ 60 cpm đến hơn 200 cpm.
Sự phân rã của một ký tự phụ thuộc vào một tập hợp tiêu chuẩn tự hình (標準 字形) được xác định trước. Tuy nhiên, vì có nhiều biến thể của Thương Hiệt tồn tại ở các quốc gia khác nhau, tiêu chuẩn tự hình của một kí tự nhất định trong Thương Hiệt không phải lúc nào cũng được người dùng học trước đó. Việc học Thương Hiệt đòi hỏi phải học không chỉ bản thân Thương Hiệt mà còn cả những tiêu chuẩn tự hình không phổ biến đối với một số ký tự. Trình chỉnh sửa phương thức nhập Thương Hiệt (IME) không xử lý các lỗi trong phân tích ngoại trừ thông báo cho người dùng rằng có sai sót (thường là bằng tiếng bíp). Tuy nhiên, Thương Hiệt ban đầu được thiết kế để gán các mã khác nhau cho các biến thể khác nhau của một ký tự. Ví dụ: trong Thương Hiệt được cung cấp trên Windows, mã cho 產 là YHHQM, không tương ứng với hình dạng của ký tự này mà là một biến thể khác, 産. Đây là sự cố do triển khai Thương Hiệt trên Windows. Trong Thương Hiệt gốc, 產 phải là YKMHM (phần đầu tiên là 文) trong khi 産 là YHHQM (phần đầu tiên là 产).
Các dấu câu không được phân tách theo hình học, mà được cung cấp các mã được xác định trước bắt đầu bằng ZX theo sau là một chuỗi 3 phím liên quan đến thứ tự của các ký tự trong mã Big5 . (Bộ mã này đã được thêm vào Thương Hiệt trên phiên bản tiếng Trung phồn thể của Windows 95. Trên Windows 3.1, Thương Hiệt không có bộ mã cho dấu câu.) Nhập dấu câu trong Thương Hiệt do đó trở thành một bài tập khó chịu liên quan đến việc ghi nhớ hoặc chọn. Tuy nhiên, điều này được giải quyết trên các hệ thống hiện đại thông qua việc truy cập bàn phím ảo trên màn hình (Trên Windows, điều này được kích hoạt bằng cách nhấn Ctrl + Alt + phím dấu phẩy).
Các lỗi thường gặp bao gồm không được coi là mã thay thế. Ví dụ: nếu một người không phân tách 方 từ trên xuống dưới thành YHS, mà thay vào đó nhập YSH theo thứ tự nét, Thương Hiệt sẽ không trả về ký tự 方 như một lựa chọn.
Vì Thương Hiệt yêu cầu tất cả 26 phím của bàn phím QWERTY , nó không thể được sử dụng để nhập chữ Hán trên điện thoại phổ thông vốn chỉ có 12 phím . Các phương thức nhập thay thế, chẳng hạn như Zhuyin , 5-strokes (hoặc 9- của Motorola ) và Q9 được sử dụng thay thế.
[Dịch]
Điều này là không có vấn đề, cũng có phụ hình thức để bổ sung cho những thiếu sót của các gốc. Phụ hình thức được biến thành hình dạng của chính gốc, và vì vậy] dễ nhớ.
[Dịch]
Từ điển nối [để cuốn sách này] được dựa trên 4800 tiêu chuẩn, thường được sử dụng vật như tuyên bố của Bộ Giáo dục. Thêm vào đó là nhân vật đó đang tự tạo ra số của nhân vật là 15.000 (sử dụng Khang hy từ điển như là một cơ sở).