Câu hỏi tự luận mức độ nhận biết Khoa học máy tính 12 cd bài 3: Giới thiệu về khoa học dữ liệu (tiếp theo)

1. NHẬN BIẾT (4 CÂU)

Câu 1: Định nghĩa dữ liệu lớn là gì? Nêu các đặc trưng chính của dữ liệu lớn?

Câu 2: Kể tên ít nhất ba đặc trưng của dữ liệu lớn và giải thích ý nghĩa của chúng?

Câu 3: Tính xác thực của dữ liệu lớn là gì? Tại sao nó lại quan trọng trong phân tích dữ liệu?

Câu 4: Mô tả khái niệm “phát hiện tri thức”  trong khoa học dữ liệu?


Câu 1:

- Dữ liệu lớn (Big Data) là tập hợp các dữ liệu có kích thước, tốc độ và sự đa dạng vượt quá khả năng xử lý của các công cụ quản lý dữ liệu truyền thống.

- Các đặc trưng chính:

+ Khối lượng (Volume): Dữ liệu lớn thường rất lớn, từ terabyte đến petabyte.

+ Tốc độ (Velocity): Dữ liệu được tạo ra và xử lý với tốc độ nhanh chóng.

+ Độ đa dạng (Variety): Dữ liệu đến từ nhiều nguồn khác nhau và có nhiều định dạng khác nhau (dữ liệu có cấu trúc, không có cấu trúc, bán cấu trúc).

+ Độ chính xác (Veracity): Độ tin cậy và chính xác của dữ liệu cần được xem xét.

Câu 2: 

- Khối lượng (Volume): Khối lượng dữ liệu lớn cho phép các tổ chức thu thập thông tin phong phú hơn, giúp cải thiện quyết định và phát triển chiến lược kinh doanh.

- Tốc độ (Velocity): Tốc độ cao của dữ liệu yêu cầu các hệ thống xử lý nhanh để có thể đáp ứng kịp thời với những thay đổi trong thị trường hoặc môi trường.

- Độ đa dạng (Variety): Độ đa dạng của dữ liệu cho phép phân tích từ nhiều góc độ khác nhau, giúp tổ chức hiểu rõ hơn về khách hàng và thị trường.

Câu 3: 

- Tính xác thực (Veracity): Là mức độ đáng tin cậy và chính xác của dữ liệu. Dữ liệu có thể bị sai lệch hoặc không chính xác, ảnh hưởng đến kết quả phân tích.

- Tại sao quan trọng: Tính xác thực là rất quan trọng vì các quyết định dựa trên dữ liệu sai lệch có thể dẫn đến hậu quả nghiêm trọng, như mất mát tài chính hoặc sai lệch trong chiến lược kinh doanh.

Câu 4: 

Phát hiện tri thức (Knowledge Discovery) là quá trình tìm kiếm thông tin hữu ích từ dữ liệu. Nó bao gồm các bước từ thu thập dữ liệu, tiền xử lý, phân tích, đến trực quan hóa và diễn giải kết quả. Mục tiêu của phát hiện tri thức là chuyển đổi dữ liệu thô thành tri thức có giá trị, hỗ trợ ra quyết định và cải thiện quy trình kinh doanh.


Bình luận

Giải bài tập những môn khác