CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÍ TỰ TIẾNG VIỆT 16-BIT
Information Technology - 16-bit Coded Vietnamese Character Set
Lời nói đầu
TCVN 6909 : 2001 phù hợp với ISO/IEC 10646-1 : 2000;
TCVN 6909 : 2001 do Tiểu ban kỹ thuật Tiêu chuẩn TCVN/JTC1/SC2 Công nghệ Thông tin - Các tập ký tự và mã hóa thông tin biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị, Bộ Khoa học, Công nghệ và Môi trường ban hành
CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÍ TỰ TIẾNG VIỆT 16-BIT
...
...
...
1.1. Tiêu chuẩn này qui định bộ mã 16-bit phục vụ việc biểu diễn, lưu trữ và trao đổi các ký tự tiếng Việt trong công nghệ thông tin.
1.2. Tiêu chuẩn này quy định cấu trúc của bộ mã kí tự tiếng Việt 16-bit thông qua việc mô tả các tập kí tự thành phần và qui ước mã hóa từng kí tự trong bảng mã.
1.3. Tiêu chuẩn này không quy định hình dạng cố định và kích thước của các kí tự tiếng Việt, kỹ thuật hiển thị và xử lí những kí tự này.
2.1. Các kí tự tiếng Việt trong tiêu chuẩn này phù hợp với ISO/IEC 10646-1:2000 và UNICODE 3.0 về vị trí trong mặt phẳng đa ngữ cơ bản (BMP); các kí tự khác cần được tham chiếu theo hai tiêu chuẩn trên.
2.2. Việc mã hóa kí tự văn bản tiếng Việt trong một hệ thống công nghệ thông tin được coi là phù hợp với tiêu chuẩn này nếu có sử dụng các tập kí tự qui định trong điều 5 và mã của những kí tự được sử dụng tuân theo đúng điều 6 của tiêu chuẩn này.
ISO/IEC 10646-1:2000 Công nghệ Thông tin - Bộ kí tự tổng hợp mã hóa bằng nhiều octet (UCS) - Phần 1: Cấu trúc và mặt phẳng đa ngữ cơ bản (BMP)
...
...
...
UNICODE phiên bản 3.0
4.1. Kí tự: một thành viên của một tập chứa các phần tử được dùng để biểu diễn, tổ chức hoặc điều khiển dữ liệu. [TCVN 6695-1:2000].
4.2. Chức năng điều khiển: chức năng tác động đến việc ghi lưu, xử lí, truyền phát hoặc diễn đạt dữ liệu và có biểu diễn mã hóa bằng một hoặc một số octet.
4.3. Bit: chữ số 0 hoặc 1 dùng trong hệ đếm nhị phân. [TCVN 6695-1:2000].
4.4. Byte: một xâu bao gồm một số bit được xử lý như một đơn vị và thường biểu diễn cho một kí tự hoặc một bộ phận của kí tự. [TCVN 6695-1: 2000].
4.5. Octet: một byte chứa 8 bit; cụm 8. [TCVN 6695-1:2000].
4.6. Kí tự khả hiện: kí tự có hình dáng đồ họa ở dạng viết tay, dạng in hoặc hiển thị và không có chức năng điều khiển (những hình dáng đồ họa thể hiện trong tiêu chuẩn này là một minh họa ở dạng in).
4.7. Mã kí tự: giá trị số của một xâu các bit sắp xếp có thứ tự trong biểu diễn một kí tự mã hóa (mã kí tự trong tiêu chuẩn này có độ dài 16 bit và giá trị nằm trong khoảng từ 0000 đến FFFF theo cơ số 16).
...
...
...
4.9. Bộ mã kí tự: một hoặc một số tập kí tự mã hóa được xác định rõ ràng về thành phần cấu trúc và bảng mã của chúng.
4.10. Bảng mã: bảng trình bày các kí tự được sắp xếp trong các ô có tọa độ tương ứng với mã của chúng.
4.11. Kí tự dấu thanh: thành phần của nhóm kí tự dấu thanh điệu, có khả năng tổ hợp với một số kí tự nguyên âm thành những kí tự có thanh điệu khác.
4.12. Kí tự dấu nguyên âm: thành phần của nhóm kí tự dấu nguyên âm, có khả năng tổ hợp với một số kí tự nguyên âm (như A, E, O, U, a, e, o, u) thành những kí tự nguyên âm khác.
Các tập kí tự được quy định trong tiêu chuẩn này bao gồm tập kí tự cơ bản và tập kí tự mở rộng.
5.1. Tập kí tự cơ bản
Tập kí tự cơ bản gồm 119 kí tự khả hiện nằm trong sáu nhóm: nhóm chữ cái, nhóm dấu thanh, nhóm dấu nguyên âm, nhóm chữ số, nhóm kí hiệu và nhóm dấu câu.
5.1.1. Nhóm chữ cái
...
...
...
Mỗi chữ cái có hai dạng: chữ hoa và chữ thường.
Nhóm chữ cái bao gồm 33 chữ hoa và 33 chữ thường (xem bảng 1 và bảng 2).
Mô tả của những kí tự nói trên xem trong bảng 14.
Bảng 1 - Các kí tự nguyên âm
Chữ hoa
A
Ă
Â
E
...
...
...
I
O
Ô
Ơ
U
Ư
Y
Chữ thường
a
...
...
...
â
e
ê
i
o
ô
ơ
u
ư
...
...
...
Bảng 2 - Các kí tự phụ âm
Chữ hoa
B
C
D
Đ
F
G
H
...
...
...
K
L
M
Chữ thường
b
c
d
đ
f
...
...
...
h
j
k
l
m
Chữ hoa
N
P
...
...
...
R
S
T
V
W
X
Z
Chữ thường
...
...
...
p
q
r
s
t
v
w
x
z
...
...
...
5.1.2. Nhóm dấu thanh
Nhóm dấu thanh gồm có 5 kí tự (xem bảng 3), mô tả của những kí tự này xem trong bảng 14.
Bảng 3 - Các dấu thanh

5.1.3. Nhóm dấu nguyên âm
Nhóm dấu nguyên âm gồm 3 kí tự (xem bảng 4), mô tả của những kí tự này xem trong bảng 14.
Bảng 4 - Các dấu nguyên âm

5.1.4. Nhóm chữ số
...
...
...
Bảng 5 - Các chữ số
0
1
2
3
4
5
6
7
...
...
...
9
5.1.5. Nhóm kí hiệu
Nhóm kí hiệu gồm có 20 kí tự (xem bảng 6), mô tả của những kí tự này xem trong bảng 14.
Bảng 6 - Các kí hiệu
“
#
$
%
&
...
...
...
*
+
-
/
<
=
>
@
\
...
...
...
_
|
̉
~
5.1.6. Nhóm dấu câu
Nhóm các dấu câu gồm có 15 kí tự (xem bảng 7), mô tả của những kí tự này xem trong bảng 14.
Bảng 7 - Các dấu câu
SP
!
...
...
...
)
,
.
:
;
?
[
]
{
...
...
...
“
”
5.2. Tập kí tự mở rộng
Tập kí tự mở rộng gồm có 120 kí tự nguyên âm mang dấu thanh (xem bảng 8).
Tập kí tự này gồm có 60 kí tự chữ hoa và 60 kí tự chữ thường. Mô tả của những kí tự này xem trong bảng 14.
Bảng 8 - Các kí tự nguyên âm mang dấu thanh
Chữ hoa
À
Ả
...
...
...
Á
Ạ
Ằ
Ẳ
Ẵ
Ắ
Ặ
Chữ thường
à
...
...
...
ã
á
ạ
ằ
ẳ
ẵ
ắ
ặ
...
...
...
Ầ
Ẩ
Ẫ
Ấ
Ậ
È
Ẻ
Ẽ
É
...
...
...
Chữ thường
ầ
ẩ
ẫ
ấ
ậ
è
ẻ
ẽ
...
...
...
ẹ
Chữ hoa
Ề
Ể
Ễ
Ế
Ệ
Ì
...
...
...
Ĩ
Í
Ị
Chữ thường
ề
ể
ễ
ế
ệ
...
...
...
ỉ
ĩ
í
ị
Chữ hoa
Ò
Ỏ
Õ
...
...
...
Ọ
Ồ
Ổ
Ỗ
Ố
Ộ
Chữ thường
ò
ỏ
...
...
...
ó
ọ
ồ
ổ
ỗ
ố
ộ
Chữ hoa
...
...
...
Ở
Ỡ
Ớ
Ợ
Ù
Ủ
Ũ
Ú
Ụ
...
...
...
ờ
ở
ỡ
ớ
ợ
ù
ủ
ũ
ú
...
...
...
Chữ hoa
Ừ
Ử
Ữ
Ứ
Ự
Ỳ
Ỷ
...
...
...
Ý
Ỵ
Chữ thường
ừ
ử
ữ
ứ
ự
ỳ
...
...
...
ỹ
ý
ỵ
6.1. Bộ mã kí tự tiếng Việt 16-bit được quy định trong năm bảng mã từ bảng 9 đến bảng 13.
6.2. Vị trí mỗi ô trong bảng mã được biểu thị bằng tọa độ (x, y) theo cơ số 16, trong đó x chỉ số cột và y chỉ số hàng; xy cũng là giá trị số (mã) của kí tự trong ô.
6.3. Mã và mô tả của các kí tự được qui định trong bảng 14.
Bảng 9 - Bảng mã kí tự trong vùng 0000 - 00FF

...
...
...

Bảng 11 - Bảng mã kí tự trong vùng 0300 - 03FF

Bảng 12 - Bảng mã kí tự trong vùng 1E00 - 1EFF

Bảng 13 - Bảng mã kí tự trong vùng 2000 - 20FF

Bảng 14 - Bảng mô tả các kí tự
Mã
...
...
...
Mô tả kí tự
0020
SP
Dấu cách (SPACE)
0021
!
Dấu chấm than
0022
“
...
...
...
0023
#
Dấu rào
0024
$
Dấu đô la
0025
%
Dấu phần trăm
...
...
...
&
Dấu và
0027
‘
Dấu nháy đơn
0028
(
Dấu mở ngoặc đơn
0029
...
...
...
Dấu đóng ngoặc đơn
002A
*
Dấu hoa thị
002B
+
Dấu cộng
002C
,
...
...
...
002D
-
Dấu trừ, dấu gạch ngang
002E
.
Dấu chấm
002F
/
Dấu chia, dấu sổ thuận
...
...
...
0
Số không
0031
1
Số một
0032
2
Số hai
0033
...
...
...
Số ba
0034
4
Số bốn
0035
5
Số năm
0036
6
...
...
...
0037
7
Số bảy
0038
8
Số tám
0039
9
Số chín
...
...
...
:
Dấu hai chấm
003B
;
Dấu chấm phẩy
003C
<
Dấu nhỏ hơn
003D
...
...
...
Dấu bằng
003E
>
Dấu lớn hơn
003F
?
Dấu chấm hỏi
0040
@
...
...
...
0041
A
Chữ A hoa
0042
B
Chữ B hoa
0043
C
Chữ C hoa
...
...
...
D
Chữ D hoa
0045
E
Chữ E hoa
0046
F
Chữ F hoa
0047
...
...
...
Chữ G hoa
0048
H
Chữ H hoa
0049
I
Chữ I hoa
004A
J
...
...
...
004B
K
Chữ K hoa
004C
L
Chữ L hoa
004D
M
Chữ M hoa
...
...
...
N
Chữ N hoa
004F
O
Chữ O hoa
0050
P
Chữ P hoa
0051
...
...
...
Chữ Q hoa
0052
R
Chữ R hoa
0053
S
Chữ S hoa
0054
T
...
...
...
0055
U
Chữ U hoa
0056
V
Chữ V hoa
0057
W
Chữ W hoa
...
...
...
X
Chữ X hoa
0059
Y
Chữ Y hoa
005A
Z
Chữ Z hoa
005B
...
...
...
Dấu mở ngoặc vuông
005C
\
Dấu sổ ngược
005D
]
Dấu đóng ngoặc vuông
005E
^
...
...
...
005F
_
Dấu gạch dưới
0060
`
Dấu trầm
0061
a
Chữ a thường
...
...
...
b
Chữ b thường
0063
c
Chữ c thường
0064
d
Chữ d thường
0065
...
...
...
Chữ e thường
0066
f
Chữ f thường
0067
g
Chữ g thường
0068
h
...
...
...
0069
i
Chữ i thường
006A
j
Chữ j thường
006B
k
Chữ k thường
...
...
...
l
Chữ l thường
006D
m
Chữ m thường
006E
n
Chữ n thường
006F
...
...
...
Chữ o thường
0070
p
Chữ p thường
0071
q
Chữ q thường
0072
r
...
...
...
0073
s
Chữ s thường
0074
t
Chữ t thường
0075
u
Chữ u thường
...
...
...
v
Chữ v thường
0077
w
Chữ w thường
0078
x
Chữ x thường
0079
...
...
...
Chữ y thường
007A
z
Chữ z thường
007B
{
Dấu mở ngoặc nhọn
007C
|
...
...
...
007D
}
Dấu đóng ngoặc nhọn
007E
~
Dấu sóng
00A0
NBSP
Dấu cách phi dãn (NO - BREAK SPACE)
...
...
...
À
Chữ A hoa với dấu huyền
00C1
Á
Chữ A hoa với dấu sắc
00C2
Â
Chữ Â hoa
00C3
...
...
...
Chữ A hoa với dấu ngã
00C8
È
Chữ E hoa với dấu huyền
00C9
É
Chữ E hoa với dấu sắc
00CA
Ê
...
...
...
00CC
Ì
Chữ I hoa với dấu huyền
00CD
Í
Chữ I hoa với dấu sắc
00D2
Ò
Chữ O hoa với dấu huyền
...
...
...
Ó
Chữ O hoa với dấu sắc
00D4
Ô
Chữ Ô hoa
00D5
Õ
Chữ O hoa với dấu ngã
00D9
...
...
...
Chữ U hoa với dấu huyền
00DA
Ú
Chữ U hoa với dấu sắc
00DD
Ý
Chữ Y hoa với dấu sắc
00E0
à
...
...
...
00E1
á
Chữ a thường với dấu sắc
00E2
â
Chữ â thường
00E3
ã
Chữ a thường với dấu ngã
...
...
...
è
Chữ e thường với dấu huyền
00E9
é
Chữ e thường với dấu sắc
00EA
ê
Chữ ê thường
00EC
...
...
...
Chữ i thường với dấu huyền
00ED
í
Chữ i thường với dấu sắc
00F2
ò
Chữ o thường với dấu huyền
00F3
ó
...
...
...
00F4
ô
Chữ ô thường
00F5
õ
Chữ o thường với dấu ngã
00F9
ù
Chữ u thường với dấu huyền
...
...
...
ú
Chữ u thường với dấu sắc
00FD
ý
Chữ y thường với dấu sắc
0102
Ă
Chữ Ă hoa
0103
...
...
...
Chữ ă thường
0110
Đ
Chữ Đ hoa
0111
đ
Chữ đ thường
0128
Ĩ
...
...
...
0129
ĩ
Chữ i thường với dấu ngã
0168
Ũ
Chữ U hoa với dấu ngã
0169
ũ
Chữ u thường với dấu ngã
...
...
...
Ơ
Chữ O hoa
01A1
ơ
Chữ ơ thường
01AF
Ư
Chữ Ư hoa
01B0
...
...
...
Chữ ư thường
0300
![]()
Dấu huyền
0301
![]()
Dấu sắc
0302
![]()
...
...
...
0303
![]()
Dấu ngã
0306
![]()
Dấu võng
0309
![]()
Dấu hỏi
...
...
...
![]()
Dấu móc
0323
![]()
Dấu nặng
1EA0
Ạ
Chữ A hoa với dấu nặng
1EA1
...
...
...
Chữ a thường với dấu nặng
1EA2
Ả
Chữ A hoa với dấu hỏi
1EA3
ả
Chữ a thường với dấu hỏi
1EA4
Ấ
...
...
...
1EA5
ấ
Chữ â thường với dấu sắc
1EA6
Ầ
Chữ Â hoa với dấu huyền
1EA7
ầ
Chữ â thường với dấu huyền
...
...
...
Ẩ
Chữ Â hoa với dấu hỏi
1EA9
ẩ
Chữ â thường với dấu hỏi
1EAA
Ẫ
Chữ Â hoa với dấu ngã
1EAB
...
...
...
Chữ â thường với dấu ngã
1EAC
Ậ
Chữ Â hoa với dấu nặng
1EAD
ậ
Chữ â thường với dấu nặng
1EAE
Ắ
...
...
...
1EAF
ắ
Chữ ă thường với dấu sắc
1EB0
Ằ
Chữ Ă hoa với dấu huyền
1EB1
ằ
Chữ ă thường với dấu huyền
...
...
...
Ẳ
Chữ Ă hoa với dấu hỏi
1EB3
ẳ
Chữ ă thường với dấu hỏi
1EB4
Ẵ
Chữ Ă hoa với dấu ngã
1EB5
...
...
...
Chữ ă thường với dấu ngã
1EB6
Ặ
Chữ Ă hoa với dấu nặng
1EB7
ặ
Chữ ă thường với dấu nặng
1EB8
Ẹ
...
...
...
1EB9
ẹ
Chữ e thường với dấu nặng
1EBA
Ẻ
Chữ E hoa với dấu hỏi
1EBB
ẻ
Chữ e thường với dấu hỏi
...
...
...
Ẽ
Chữ E hoa với dấu ngã
1EBD
ẽ
Chữ e thường với dấu ngã
1EBE
Ế
Chữ Ê hoa với dấu sắc
1EBF
...
...
...
Chữ ê thường với dấu sắc
1EC0
Ề
Chữ Ê hoa với dấu huyền
1EC1
ề
Chữ ê thường với dấu huyền
1EC2
Ể
...
...
...
1EC3
ể
Chữ ê thường với dấu hỏi
1EC4
Ễ
Chữ Ê hoa với dấu ngã
1EC5
ễ
Chữ ê thường với dấu ngã
...
...
...
Ệ
Chữ Ê hoa với dấu nặng
1EC7
ệ
Chữ ê thường với dấu nặng
1EC8
Ỉ
Chữ I hoa với dấu hỏi
1EC9
...
...
...
Chữ i thường với dấu hỏi
1ECA
Ị
Chữ I hoa với dấu nặng
1ECB
ị
Chữ i thường với dấu nặng
1ECC
Ọ
...
...
...
1ECD
ọ
Chữ o thường với dấu nặng
1ECE
Ỏ
Chữ O hoa với dấu hỏi
1ECF
ỏ
Chữ o thường với dấu hỏi
...
...
...
Ố
Chữ Ô hoa với dấu sắc
1ED1
ố
Chữ ô thường với dấu sắc
1ED2
Ồ
Chữ Ô hoa với dấu huyền
1ED3
...
...
...
Chữ ô thường với dấu huyền
1ED4
Ổ
Chữ Ô hoa với dấu hỏi
1ED5
ổ
Chữ ô thường với dấu hỏi
1ED6
Ỗ
...
...
...
1ED7
ỗ
Chữ ô thường với dấu ngã
1ED8
Ộ
Chữ Ô hoa với dấu nặng
1ED9
ộ
Chữ ô thường với dấu nặng
...
...
...
Ớ
Chữ Ơ hoa với dấu sắc
1EDB
ớ
Chữ ơ thường với dấu sắc
1EDC
Ờ
Chữ Ơ hoa với dấu huyền
1EDD
...
...
...
Chữ ơ thường với dấu huyền
1EDE
Ở
Chữ Ơ hoa với dấu hỏi
1EDF
ở
Chữ ơ thường với dấu hỏi
1EE0
Ỡ
...
...
...
1EE1
ỡ
Chữ ơ thường với dấu ngã
1EE2
Ợ
Chữ Ơ hoa với dấu nặng
1EE3
ợ
Chữ ơ thường với dấu nặng
...
...
...
Ụ
Chữ U hoa với dấu nặng
1EE5
ụ
Chữ u thường với dấu nặng
1EE6
Ủ
Chữ U hoa với dấu hỏi
1EE7
...
...
...
Chữ u thường với dấu hỏi
1EE8
Ứ
Chữ Ư hoa với dấu sắc
1EE9
ứ
Chữ ư thường với dấu sắc
1EEA
Ừ
...
...
...
1EEB
ừ
Chữ ư thường với dấu huyền
1EEC
Ử
Chữ Ư hoa với dấu hỏi
1EED
ử
Chữ ư thường với dấu hỏi
...
...
...
Ữ
Chữ Ư hoa với dấu ngã
1EEF
ữ
Chữ ư thường với dấu ngã
1EF0
Ự
Chữ Ư hoa với dấu nặng
1EF1
...
...
...
Chữ ư thường với dấu nặng
1EF2
Ỳ
Chữ Y hoa với dấu huyền
1EF3
ỳ
Chữ y thường với dấu huyền
1EF4
Ỵ
...
...
...
1EF5
ỵ
Chữ y thường với dấu nặng
1EF6
Ỷ
Chữ Y hoa với dấu hỏi
1EF7
ỷ
Chữ y thường với dấu hỏi
...
...
...
Ỹ
Chữ Y hoa với dấu ngã
1EF9
ỹ
Chữ y thường với dấu ngã
201C
“
Dấu mở ngoặc kép
201D
...
...
...
Dấu đóng ngoặc kép

