Tìm hiểu về bộ mã kí tự tiếng Việt 16 bit (quy định trong TCVN 6909:2001) ...
Câu 2: Tìm hiểu về bộ mã kí tự tiếng Việt 16 bit (quy định trong TCVN 6909:2001), em xác định mã thập lục phân của các kí tự (từ U+0020 đến U+201D) và mã hoá dòng văn bản sau:
Em học sách Tin học Chân trời Sáng tạo
- Tìm hiểu về bộ mã kí tự tiếng Việt 16 bit (TCVN 6909:2001)
TCVN 6909:2001 là tiêu chuẩn quốc gia của Việt Nam quy định bộ mã kí tự 16 bit để biểu diễn tiếng Việt trong tin học.
Tiêu chuẩn này dựa trên Unicode, một bảng mã quốc tế, nhưng có bổ sung thêm các kí tự tiếng Việt đặc thù.
Mỗi kí tự được gán một mã số 16 bit, thường được biểu diễn dưới dạng thập lục phân (ví dụ: U+0020).
- Xác định mã thập lục phân
Vì yêu cầu xác định mã thập lục phân từ U+0020 đến U+201D. Đây là một dải mã rất lớn, vì vậy tôi sẽ cung cấp một vài mã ví dụ, và giải thích cách tra cứu.
U+0020: Dấu cách (space)
U+0041: Kí tự A
U+0061: Kí tự a
U+00C2: Kí tự Â
U+00E2: Kí tự â
U+00D5: Kí tự Õ
U+00F5: Kí tự õ
Để tra cứu đầy đủ, bạn có thể tham khảo các bảng mã Unicode trực tuyến hoặc các tài liệu về TCVN 6909:2001.
- Mã hóa dòng văn bản "Em học sách Tin học Chân trời Sáng tạo"
Để mã hóa dòng văn bản này, ta sẽ chuyển đổi từng kí tự sang mã thập lục phân tương ứng.
Em: U+0045 U+006D
Học: U+0048 U+1ECD U+0063
Sách: U+0053 U+00E1 U+0063+0068
Tin: U+0054 U+0069 U+006E
Học: U+0048 U+1ECD U+0063
Chân: U+0043 U+0068 U+00E2 U+006E
Trời: U+0054 U+0072 U+1EDD U+0069
Sáng: U+0053 U+00E1 U+006E U+0067
Tạo: U+0054 U+1EA1 U+006F
Dấu cách: U+0020
Vì vậy, chuỗi mã thập lục phân hoàn chỉnh sẽ là:
U+0045 U+006D U+0020 U+0048 U+1ECD U+0063 U+0020 U+0053 U+00E1 U+0063+0068 U+0020 U+0054 U+0069 U+006E U+0020 U+0048 U+1ECD U+0063 U+0020 U+0043 U+0068 U+00E2 U+006E U+0020 U+0054 U+0072 U+1EDD U+0069 U+0020 U+0053 U+00E1 U+006E U+0067 U+0020 U+0054 U+1EA1 U+006F
Bình luận