Slide bài giảng tin học 10 kết nối bài 3: Một số kiểu dữ liệu và dữ liệu văn bản

Slide điện tử bài 3: Một số kiểu dữ liệu và dữ liệu văn bản. Trình bày với các hiệu ứng hiện đại, hấp dẫn. Giúp học sinh hứng thú học bài. Học nhanh, nhớ lâu. Có tài liệu này, hiệu quả học tập của môn Tin học 10 Cánh diều sẽ khác biệt

Bạn chưa đủ điều kiện để xem được slide bài này. => Xem slide bài mẫu

Tóm lược nội dung

BÀI 3. MỘT SỐ KIỂU DỮ LIỆU VÀ DỮ LIỆU VĂN BẢN (2 TIẾT)

KHỞI ĐỘNG

- GV yêu cầu HS thảo luận và trả lời:

Thông tin đưa vào bộ nhớ máy tính dưới dạng các dãy bit. Các thông tin phải được mã hoá thành dữ liệu nhị phân. Tuỳ theo bản chất của thông tin được mã hoá mà dữ liệu tương ứng có cách biểu diễn riêng, từ đó hình thành nên các kiểu dữ liệu khác nhau. Theo em, có các kiểu dữ liệu nào trong máy tính?

NỘI DUNG BÀI HỌC GỒM

  • PHÂN LOẠI THÔNG TIN VÀ BIỂU DIỄN DỮ LIỆU TRONG MÁY TÍNH.  
  • ĐƠN VỊ LƯU TRỮ DỮ LIỆU.  
  • Bảng mã ASCII.  
  • Bảng mã Unicode và tiếng Việt trong Unicode.
  • Số hóa văn bản.

HÌNH THÀNH KIẾN THỨC

HOẠT ĐỘNG I. PHÂN LOẠI THÔNG TIN VÀ BIỂU DIỄN DỮ LIỆU TRONG MÁY TÍNH

- Trên căn cước công dân có những thông tin gì?

Hãy chia những thông tin đó thành các nhóm, ví dụ nhóm các thông tin có thể tách ghép được hay so sánh được để tìm kiếm và nhóm các thông tin có thể thực hiện được với các phép tính số học.

Tech12h

Nội dung ghi nhớ:

- Các thông tin trên căn cước công dân:

●      Ảnh.

●      Họ và tên.

●      Giới tính.

●      Quốc tịch.

●      Quê quán.

●      Nơi cư trú.

●      Ngày sinh.

●      Thời gian hết hạn.

●      Quốc hiệu, tiêu ngữ.

●      Số căn cước công dân.

- Các thông tin trên được chia thành ba nhóm: dữ liệu dạng số, dữ liệu dạng văn bản và dữ liệu hình ảnh.

- Các dữ liệu dạng số là các đối tượng có thể làm việc được với các phép tính số học.

- Dữ liệu dạng văn bản có nhiều loại. Kiểu kí tự có thể làm việc với các phép toán như sắp xếp hay so sánh theo thứ tự trong bảng kí tự; trong khi đó các xâu kí tự - là một chuỗi các kí tự  có thể được xử lí bằng các phép toán so sánh, sắp xếp, cắt, ghép...

- Dữ liệu đa phương tiện (multimedia) bao gồm một số loại như âm thanh, hình ảnh, video.

- Dữ liệu logic: thể hiện các trạng thái đúng sai, được dùng để mô tả các điều kiện thực hiện của các câu lệnh trong phần mềm.

HOẠT ĐỘNG II. ĐƠN VỊ LƯU TRỮ DỮ LIỆU

- Hãy cho biết có những kí tự nào trong bảng kí tự La tinh? 

- Trong tin học, mỗi nguyên âm có dấu thanh của tiếng Việt là một kí tự. Hãy kể tên các kí tự có trong tiếng Việt không có trong bảng kí tự La tinh. Có bao nhiêu kí tự như vậy?

- Mã nhị phân và mã thập phân của các kí tự S, G, K trong bảng mã ASCII là gì?

- Trong bảng mã Unicode tiếng Việt, mỗi kí tự được biểu diễn bởi bao nhiêu byte? Em hãy nêu đặc điểm của bảng mã Unicode và trình bày lợi ích của nó?

- Em hãy giải thích xâu kí tự và tệp văn bản là gì?

Nội dung ghi nhớ:

- Kiểu văn bản có ba loại: kiểu kí tự, kiểu xâu kí tự và kiểu tệp văn bản.

- Bảng chữ cái tiếng Anh có 26 chữ cái “a, b, c, ..., x, y, z” và 26 chữ cái in hoa tương ứng.

- Các kí tự tiếng Việt không có trong tiếng Anh:

+ Các kí tự riêng của tiếng Việt là các nguyên âm có dấu và hai kí tự đ và Đ. Các nguyên âm của tiếng Việt gồm có o, ô, ơ, a, ă, â, e, ê, u, ư, i, y và cả chữ thường và chữ hoa.

+ So với tiếng Anh, mỗi chữ o, a, e, u, i, y cả chữ thường và chữ hoa có 1 kí tự, mỗi kí tự phát sinh 5 kí tự có dấu thành không có trong tiếng Anh nên sẽ có thêm 60 kí tự.

+ Mỗi chữ ô, ơ, ă, â, ê, ư kể cả chữ thường và chữ in hoa có 12 kí tự không có trong tiếng Anh, mỗi kí tự sẽ phát sinh 6 kí tự không có trong tiếng Anh nên sẽ có thêm 72 kí tự.

+ Chữ đ phát sinh thêm 2 kí tự.

 Tổng cộng có 134 kí tự không có trong tiếng Anh.

- ASCII là bảng mã chuẩn để trao đổi thông tin của Mỹ quy định biểu diễn nhị phân các kí tự, ban đầu là 7 bit (128 kí tự), sau đó được mở rộng thành 8 bit (256 kí tự).

- Các quốc gia có thể sử dụng phần mở rộng cho bộ kí tự của mình.

- Lí do cần có một bộ mã hợp nhất toàn cầu:

+ Bảng mã ASCII không đủ chỗ cho kí tự của tất cả các quốc gia.

+ Tồn tại các mặt chữ nhiều quốc gia nhưng có mã khác nhau dẫn đến thể hiện nhầm lẫn trong các ứng dụng.

- Đặc điểm:

+ Bảng mã chung cho tất cả các quốc gia, dùng từ 1 đến 4 byte để mã hóa các kí tự.

+ Nếu một “chữ” đã được một quốc gia định nghĩa trong bảng mã Unicode mà các quốc gia khác cũng có chữ đó thì dùng lại mã đã có, không tạo ra mã mới.

+ UTF-8 (một định dạng chuyển đổi Unicode) được dùng phổ biến trong web, mail và các ứng dụng khác.

- Lợi ích:

+ Đủ chỗ cho các kí tự của mỗi quốc gia.

+ Tránh tình trạng mất nhất quán, một “mặt chữ” có nhiều mã khác nhau.

+ Các ứng dụng đa ngữ, trên cùng một ứng dụng, nhiều ngôn ngữ khác nhau được thể hiện đồng thời.

- Xâu kí tự: là định dạng của một chuỗi các kí tự, chúng được đặt trong các byte kế tiếp nhau trong bộ nhớ.

- Tệp văn bản: là định dạng để lưu văn bản ở bộ nhớ ngoài. 

C. HOẠT ĐỘNG LUYỆN TẬP

- Hoàn thành bài tập trắc nghiệm sau:

Câu 1: Có bao nhiêu kiểu dữ liệu thường gặp?

A. 2.

B. 3.

C. 4.

D. 6.

Câu 2: Số phát biểu đúng trong các phát biểu sau?

1) Ban đầu bảng mã ASCII thể hiện đúng 128 kí tự.

2) Bảng mã ASCII mở rộng dùng 8 bit để biểu diên mọi kí tự.

3) Bảng mã ASCII dùng 3 byte để biểu diễn nguyên âm.

4) Mọi kí tự đều biểu diễn bằng 1 byte trong bảng mã ASCII.

A. 4.

B. 1.

C. 3.

D. 2.

Câu 3: Để ca ngợi đất nước Việt Nam tươi đẹp ta có thể làm những hoạt động nào sau đây?

A. Viết một bài văn.

B. Vẽ một bức tranh hay chụp một tấm ảnh.

C. Viết một bản nhạc.

D. Tất cả các hình thức trên.

Câu 4: Tệp văn bản là định dạng lưu trữ ở bộ nhớ nào?

A. Bộ nhớ ngoài.

B. Bộ nhớ trong.

C. Cả hai bộ nhớ.

D. Không có bộ nhớ nào.

Câu 5: Tại sao cần có Unicode?

A. Để đảm bảo bình đẳng cho mọi quốc gia trong ứng dụng tin học.

B. Bảng mã ASCII mã hóa mỗi kí tự bởi 1 byte. Giá thành thiết bị lưu trữ ngày càng rẻ nên không cần phải sử dụng các bộ kí tự mã hóa bởi 1 byte.

C. Dùng một bảng mã chung cho mọi quốc gia, giải quyết vấn đề thiếu vị trí cho bộ kí tự của một số quốc gia, đáp ứng nhu cầu dùng nhiều ngôn ngữ đồng thời trong cùng một ứng dụng.

D. Dùng cho quốc gia sử dụng chữ tượng hình.

Gợi ý đáp án:

Câu

1

2

3

4

5

Đáp án

C

B

D

A

C

D. HOẠT ĐỘNG VẬN DỤNG

Vận dụng kiến thức, GV yêu cầu HS trả lời câu hỏi:

Câu 1: Dựa trên bảng mã ASCII, Việt Nam xây dựng bảng mã VSCII , còn gọi là TCVN 5712: 1993. Hãy tìm hiểu và cho biết bảng mã này:

- Có đủ cho tất cả các kí tự tiếng Việt không?

- Có bảo toàn bảng mã ASCII 7 bít không?

Câu 2: Em hãy tìm hiểu trên Internet để biết bảng mã TCVN3 là gì? Bảng mã này có những đặc điểm nào?