Tìm hiểu về bộ mã kí tự tiếng Việt 16 bit (quy định trong TCVN 6909:2001) ...

Câu 2: Tìm hiểu về bộ mã kí tự tiếng Việt 16 bit (quy định trong TCVN 6909:2001), em xác định mã thập lục phân của các kí tự (từ U+0020 đến U+201D) và mã hoá dòng văn bản sau:

Em học sách Tin học Chân trời Sáng tạo


- Tìm hiểu về bộ mã kí tự tiếng Việt 16 bit (TCVN 6909:2001)

  • TCVN 6909:2001 là tiêu chuẩn quốc gia của Việt Nam quy định bộ mã kí tự 16 bit để biểu diễn tiếng Việt trong tin học.

  • Tiêu chuẩn này dựa trên Unicode, một bảng mã quốc tế, nhưng có bổ sung thêm các kí tự tiếng Việt đặc thù.

  • Mỗi kí tự được gán một mã số 16 bit, thường được biểu diễn dưới dạng thập lục phân (ví dụ: U+0020).

- Xác định mã thập lục phân

  • Vì yêu cầu xác định mã thập lục phân từ U+0020 đến U+201D. Đây là một dải mã rất lớn, vì vậy tôi sẽ cung cấp một vài mã ví dụ, và giải thích cách tra cứu.  

  • U+0020: Dấu cách (space)

  • U+0041: Kí tự A

  • U+0061: Kí tự a

  • U+00C2: Kí tự Â

  • U+00E2: Kí tự â

  • U+00D5: Kí tự Õ

  • U+00F5: Kí tự õ

  • Để tra cứu đầy đủ, bạn có thể tham khảo các bảng mã Unicode trực tuyến hoặc các tài liệu về TCVN 6909:2001.

- Mã hóa dòng văn bản "Em học sách Tin học Chân trời Sáng tạo"

  • Để mã hóa dòng văn bản này, ta sẽ chuyển đổi từng kí tự sang mã thập lục phân tương ứng.

  • Em: U+0045 U+006D

  • Học: U+0048 U+1ECD U+0063

  • Sách: U+0053 U+00E1 U+0063+0068

  • Tin: U+0054 U+0069 U+006E

  • Học: U+0048 U+1ECD U+0063

  • Chân: U+0043 U+0068 U+00E2 U+006E

  • Trời: U+0054 U+0072 U+1EDD U+0069

  • Sáng: U+0053 U+00E1 U+006E U+0067

  • Tạo: U+0054 U+1EA1 U+006F

  • Dấu cách: U+0020

  • Vì vậy, chuỗi mã thập lục phân hoàn chỉnh sẽ là: 

U+0045 U+006D U+0020 U+0048 U+1ECD U+0063 U+0020 U+0053 U+00E1 U+0063+0068 U+0020 U+0054 U+0069 U+006E U+0020 U+0048 U+1ECD U+0063 U+0020 U+0043 U+0068 U+00E2 U+006E U+0020 U+0054 U+0072 U+1EDD U+0069 U+0020 U+0053 U+00E1 U+006E U+0067 U+0020 U+0054 U+1EA1 U+006F


Bình luận

Giải bài tập những môn khác