Phát triển Phần mềm và Dữ liệu Quiz
200+ câu hỏi trắc nghiệm Khai phá dữ liệu (Có đáp án)
📜 Đọc lưu ý & miễn trừ trách nhiệm trước khi làm bài (Click để đọc)
⚠️ Xin lưu ý và đọc kỹ phần miễn trừ trách nhiệm: Các câu hỏi và đáp án được cung cấp trong bộ trắc nghiệm này mang tính chất tham khảo, phục vụ cho mục đích học tập và luyện tập kiến thức. Đây KHÔNG phải là đề thi chính thức, cũng không đại diện cho tài liệu chuẩn hoặc kỳ thi chứng chỉ do bất kỳ cơ quan giáo dục hay tổ chức cấp chứng chỉ nào ban hành. Website không chịu trách nhiệm về tính chính xác của nội dung cũng như các quyết định được đưa ra dựa trên kết quả làm bài.
Bộ số 1
Câu 1
Thuật toán 'K-Means' là một thuật toán phân cụm thuộc loại nào?
Câu 2
Trong thuật toán Apriori, 'Minimum Support' (hỗ trợ tối thiểu) được sử dụng để:
Câu 3
Trong khai phá dữ liệu, các thuật toán phân cụm dựa trên mật độ (density-based clustering) như DBSCAN có ưu điểm gì?
Câu 4
Mục tiêu của 'Data Reduction' (giảm thiểu dữ liệu) là gì?
Câu 5
Mục tiêu của 'Data Discretization' (rời rạc hóa dữ liệu) là gì?
Câu 6
Mục đích của 'Data Integration' (tích hợp dữ liệu) trong quy trình khai phá dữ liệu là gì?
Câu 7
Thuật toán Apriori được sử dụng chủ yếu cho loại bài toán nào trong khai phá dữ liệu?
Câu 8
Quá trình tiền xử lý dữ liệu nào sau đây giúp xử lý các giá trị bị thiếu (missing values) trong tập dữ liệu?
Câu 9
Mục tiêu chính của phân tích cụm (Cluster Analysis) trong khai phá dữ liệu là gì?
Câu 10
Trong khai phá dữ liệu, 'Association Rule Mining' (khai phá luật kết hợp) thường được ứng dụng trong kịch bản nào sau đây?
Câu 11
Kỹ thuật 'Data Transformation' (chuyển đổi dữ liệu) có thể bao gồm những hoạt động nào?
Câu 12
Trong khai phá dữ liệu, 'Pattern Evaluation' (đánh giá mẫu hình) là bước dùng để:
Câu 13
Trong khai phá dữ liệu, 'Outlier' (ngoại lệ) là gì?
Câu 14
Độ đo nào sau đây được sử dụng để đánh giá chất lượng của một luật kết hợp (association rule) như 'X -> Y'?
Câu 15
Kỹ thuật 'Data Normalization' (chuẩn hóa dữ liệu) có mục đích chính là gì?
Câu 16
Kỹ thuật 'Data Smoothing' (làm mịn dữ liệu) thường được sử dụng để:
Câu 17
Mục tiêu của 'Data Sampling' (lấy mẫu dữ liệu) là gì?
Câu 18
Trong khai phá dữ liệu, một 'transaction' (giao dịch) thường đề cập đến:
Câu 19
Trong các thuật toán phân loại, thuật toán K-Nearest Neighbors (KNN) phân loại một điểm dữ liệu mới dựa trên:
Câu 20
Trong mô hình cây quyết định, nút lá (leaf node) đại diện cho điều gì?
Câu 21
Trong khai phá dữ liệu, 'Lift' của một luật kết hợp (association rule) dùng để đo lường điều gì?
Câu 22
Trong học máy, 'overfitting' (quá khớp) xảy ra khi mô hình:
Câu 23
Mục tiêu của 'Data Generalization' (tổng quát hóa dữ liệu) trong khai phá dữ liệu là gì?
Câu 24
Kỹ thuật 'Data Aggregation' (tổng hợp dữ liệu) trong khai phá dữ liệu liên quan đến việc:
Câu 25
Kỹ thuật 'Data Visualization' (trực quan hóa dữ liệu) giúp ích gì cho quá trình khai phá dữ liệu?
Câu 26
Trong khai phá dữ liệu, 'bias' (thiên vị) trong một mô hình thường đề cập đến:
Câu 27
Kỹ thuật 'Data Transformation' nào sau đây thường được sử dụng để đưa các giá trị của một thuộc tính về khoảng [0, 1]?
Câu 28
Trong khai phá dữ liệu, 'Support' của một tập mục (itemset) 'X' được định nghĩa là:
Câu 29
Trong các thuật toán phân loại, 'Accuracy' (độ chính xác) được tính như thế nào?
Câu 30
Mục tiêu của kỹ thuật 'feature selection' (lựa chọn đặc trưng) là gì?
Câu 31
Trong các thuật toán cây quyết định, tiêu chí phân chia nào sau đây thường được sử dụng để lựa chọn thuộc tính tốt nhất cho mỗi nút?
Câu 32
Thuật toán nào sau đây là một thuật toán học không giám sát (unsupervised learning)?
Câu 33
Trong khai phá dữ liệu, thuật ngữ nào sau đây dùng để chỉ quá trình khám phá các mẫu hình ẩn, có ý nghĩa và tiềm năng trong tập dữ liệu lớn?
Câu 34
Thuật toán nào sau đây thường được sử dụng cho bài toán phân loại và có thể xử lý tốt dữ liệu phi tuyến tính?
Câu 35
Trong khai phá dữ liệu, 'Data Warehousing' (kho dữ liệu) đóng vai trò gì?
Câu 36
Trong khai phá dữ liệu, thuật toán Naive Bayes dựa trên nguyên lý nào?
Câu 37
Kỹ thuật nào thường được sử dụng để giảm số chiều của dữ liệu bằng cách tạo ra các biến mới là tổ hợp tuyến tính của các biến gốc, đồng thời giữ lại phần lớn phương sai?
Câu 38
Kỹ thuật 'Discretization' (rời rạc hóa) trong khai phá dữ liệu là gì?
Câu 39
Kỹ thuật 'Feature Engineering' (kỹ thuật đặc trưng) là gì?
Câu 40
Kỹ thuật nào thường được dùng để phát hiện các điểm bất thường (anomalies) trong dữ liệu chuỗi thời gian?
