Câu hỏi tự luận mức độ thông hiểu Khoa học máy tính 12 cd bài 1: Giới thiệu về học máy

2. THÔNG HIỂU (4 CÂU)

Câu 1: Phân biệt giữa học có giám sát và học không giám sát?

Câu 2: Giải thích bài toán phân loại trong học có giám sát và đưa ra một ví dụ minh họa?

Câu 3: Mô tả quy trình huấn luyện và đánh giá mô hình trong học có giám sát?

Câu 4: Nêu rõ các bước trong bài toán phân cụm trong học không giám sát?


Câu 1

+ Học có giám sát: Sử dụng dữ liệu đã được gán nhãn (có đầu ra cụ thể). Mục tiêu là dự đoán đầu ra cho dữ liệu mới.

+ Học không giám sát: Sử dụng dữ liệu không có gán nhãn. Mục tiêu là tìm ra cấu trúc hoặc mẫu trong dữ liệu.

Câu 2: 

- Bài toán phân loại: Là bài toán trong đó mô hình học cách phân loại dữ liệu vào các nhóm hoặc loại khác nhau dựa trên đặc điểm của chúng.

- Ví dụ: Phân loại email thành "spam" hoặc "không spam" dựa trên nội dung và các thuộc tính khác của email.

Câu 3: 

*Quy trình huấn luyện:

+ Sử dụng dữ liệu huấn luyện để dạy mô hình.

+ Mô hình học cách nhận diện mối quan hệ giữa đầu vào và đầu ra.

*Quy trình đánh giá:

+ Sử dụng dữ liệu kiểm tra để kiểm tra mô hình.

+ Đánh giá độ chính xác và hiệu suất của mô hình bằng các chỉ số như độ chính xác, độ nhạy, độ đặc hiệu.

Câu 4: 

+ Thu thập dữ liệu: Tập hợp dữ liệu cần phân cụm.

+ Tiền xử lý dữ liệu: Làm sạch và chuẩn hóa dữ liệu.

+ Chọn thuật toán phân cụm: Lựa chọn thuật toán phù hợp (ví dụ: K-means, Hierarchical Clustering).

+ Thực hiện phân cụm: Áp dụng thuật toán lên dữ liệu để nhóm các điểm dữ liệu tương tự.

+ Đánh giá kết quả: Xem xét các cụm đã tạo ra và đánh giá tính hợp lý của chúng.


Bình luận

Giải bài tập những môn khác