Câu hỏi tự luận mức độ thông hiểu Khoa học máy tính 12 cd bài 3: Giới thiệu về khoa học dữ liệu (tiếp theo)

2. THÔNG HIỂU (4 CÂU)

Câu 1: Giải thích khái niệm “tốc độ” trong đặc trưng của dữ liệu lớn và nêu ví dụ minh họa?

Câu 2: Phân tích vai trò của tính đa dạng trong dữ liệu lớn và cách nó ảnh hưởng đến quá trình phân tích dữ liệu?

Câu 3: Nêu các bước cơ bản trong quy trình phân tích dữ liệu và giải thích vai trò của từng bước?

Câu 4: So sánh giá trị và tính xác thực của dữ liệu trong bối cảnh khoa học dữ liệu?


Câu 1:

- Tốc độ (Velocity) đề cập đến tốc độ mà dữ liệu được tạo ra và xử lý. Dữ liệu lớn không chỉ được thu thập mà còn cần được phân tích ngay lập tức để đưa ra quyết định kịp thời.

- Ví dụ minh họa: Trong lĩnh vực tài chính, giao dịch chứng khoán diễn ra trong tích tắc. Các hệ thống phải xử lý hàng triệu giao dịch mỗi giây để phát hiện các cơ hội đầu tư hoặc gian lận.

Câu 2: 

- Vai trò: Tính đa dạng cho phép tổ chức thu thập dữ liệu từ nhiều nguồn khác nhau, như mạng xã hội, cảm biến IoT, và hệ thống giao dịch.

- Ảnh hưởng: Tính đa dạng ảnh hưởng đến quá trình phân tích dữ liệu bằng cách cung cấp cái nhìn toàn diện hơn về vấn đề, giúp phát hiện các mẫu và xu hướng mà dữ liệu đơn giản không thể hiện rõ.

Câu 3: 

B1 - Xác định vấn đề: Đặt ra câu hỏi nghiên cứu rõ ràng để hướng dẫn quá trình phân tích.

B2 - Thu thập dữ liệu: Tìm kiếm và thu thập dữ liệu từ các nguồn khác nhau để đảm bảo tính đầy đủ.

B3 - Tiền xử lý dữ liệu: Làm sạch và chuẩn hóa dữ liệu để loại bỏ lỗi và không nhất quán.

B4 - Phân tích dữ liệu: Sử dụng các phương pháp thống kê và học máy để rút ra thông tin có giá trị.

B5 - Trực quan hóa dữ liệu: Trình bày kết quả phân tích qua biểu đồ và đồ thị để dễ hiểu hơn.

B6 - Diễn giải kết quả: Giải thích kết quả và đưa ra các khuyến nghị dựa trên phân tích.

Câu 4: 

- Giá trị của dữ liệu: Đề cập đến mức độ hữu ích của dữ liệu trong việc hỗ trợ ra quyết định và tạo ra lợi ích cho tổ chức. Dữ liệu có giá trị cao có thể dẫn đến những hiểu biết sâu sắc và cải thiện hiệu suất kinh doanh.

- Tính xác thực: Nhấn mạnh độ tin cậy và chính xác của dữ liệu. Dữ liệu có giá trị nhưng không chính xác sẽ dẫn đến quyết định sai lầm.

- So sánh: Dữ liệu có giá trị cao nhưng thiếu tính xác thực sẽ không mang lại lợi ích thực sự. Ngược lại, dữ liệu chính xác nhưng không có giá trị có thể không hữu ích trong việc ra quyết định. Do đó, cả hai yếu tố này đều cần thiết và bổ sung cho nhau trong khoa học dữ liệu.


Bình luận

Giải bài tập những môn khác