Bộ số 1

Câu 1

Thuật toán 'K-Means' là một thuật toán phân cụm thuộc loại nào?

Câu 2

Trong thuật toán Apriori, 'Minimum Support' (hỗ trợ tối thiểu) được sử dụng để:

Câu 3

Trong khai phá dữ liệu, các thuật toán phân cụm dựa trên mật độ (density-based clustering) như DBSCAN có ưu điểm gì?

Câu 4

Mục tiêu của 'Data Reduction' (giảm thiểu dữ liệu) là gì?

Câu 5

Mục tiêu của 'Data Discretization' (rời rạc hóa dữ liệu) là gì?

Câu 6

Mục đích của 'Data Integration' (tích hợp dữ liệu) trong quy trình khai phá dữ liệu là gì?

Câu 7

Thuật toán Apriori được sử dụng chủ yếu cho loại bài toán nào trong khai phá dữ liệu?

Câu 8

Quá trình tiền xử lý dữ liệu nào sau đây giúp xử lý các giá trị bị thiếu (missing values) trong tập dữ liệu?

Câu 9

Mục tiêu chính của phân tích cụm (Cluster Analysis) trong khai phá dữ liệu là gì?

Câu 10

Trong khai phá dữ liệu, 'Association Rule Mining' (khai phá luật kết hợp) thường được ứng dụng trong kịch bản nào sau đây?

Câu 11

Kỹ thuật 'Data Transformation' (chuyển đổi dữ liệu) có thể bao gồm những hoạt động nào?

Câu 12

Trong khai phá dữ liệu, 'Pattern Evaluation' (đánh giá mẫu hình) là bước dùng để:

Câu 13

Trong khai phá dữ liệu, 'Outlier' (ngoại lệ) là gì?

Câu 14

Độ đo nào sau đây được sử dụng để đánh giá chất lượng của một luật kết hợp (association rule) như 'X -> Y'?

Câu 15

Kỹ thuật 'Data Normalization' (chuẩn hóa dữ liệu) có mục đích chính là gì?

Câu 16

Kỹ thuật 'Data Smoothing' (làm mịn dữ liệu) thường được sử dụng để:

Câu 17

Mục tiêu của 'Data Sampling' (lấy mẫu dữ liệu) là gì?

Câu 18

Trong khai phá dữ liệu, một 'transaction' (giao dịch) thường đề cập đến:

Câu 19

Trong các thuật toán phân loại, thuật toán K-Nearest Neighbors (KNN) phân loại một điểm dữ liệu mới dựa trên:

Câu 20

Trong mô hình cây quyết định, nút lá (leaf node) đại diện cho điều gì?

Câu 21

Trong khai phá dữ liệu, 'Lift' của một luật kết hợp (association rule) dùng để đo lường điều gì?

Câu 22

Trong học máy, 'overfitting' (quá khớp) xảy ra khi mô hình:

Câu 23

Mục tiêu của 'Data Generalization' (tổng quát hóa dữ liệu) trong khai phá dữ liệu là gì?

Câu 24

Kỹ thuật 'Data Aggregation' (tổng hợp dữ liệu) trong khai phá dữ liệu liên quan đến việc:

Câu 25

Kỹ thuật 'Data Visualization' (trực quan hóa dữ liệu) giúp ích gì cho quá trình khai phá dữ liệu?

Câu 26

Trong khai phá dữ liệu, 'bias' (thiên vị) trong một mô hình thường đề cập đến:

Câu 27

Kỹ thuật 'Data Transformation' nào sau đây thường được sử dụng để đưa các giá trị của một thuộc tính về khoảng [0, 1]?

Câu 28

Trong khai phá dữ liệu, 'Support' của một tập mục (itemset) 'X' được định nghĩa là:

Câu 29

Trong các thuật toán phân loại, 'Accuracy' (độ chính xác) được tính như thế nào?

Câu 30

Mục tiêu của kỹ thuật 'feature selection' (lựa chọn đặc trưng) là gì?

Câu 31

Trong các thuật toán cây quyết định, tiêu chí phân chia nào sau đây thường được sử dụng để lựa chọn thuộc tính tốt nhất cho mỗi nút?

Câu 32

Thuật toán nào sau đây là một thuật toán học không giám sát (unsupervised learning)?

Câu 33

Trong khai phá dữ liệu, thuật ngữ nào sau đây dùng để chỉ quá trình khám phá các mẫu hình ẩn, có ý nghĩa và tiềm năng trong tập dữ liệu lớn?

Câu 34

Thuật toán nào sau đây thường được sử dụng cho bài toán phân loại và có thể xử lý tốt dữ liệu phi tuyến tính?

Câu 35

Trong khai phá dữ liệu, 'Data Warehousing' (kho dữ liệu) đóng vai trò gì?

Câu 36

Trong khai phá dữ liệu, thuật toán Naive Bayes dựa trên nguyên lý nào?

Câu 37

Kỹ thuật nào thường được sử dụng để giảm số chiều của dữ liệu bằng cách tạo ra các biến mới là tổ hợp tuyến tính của các biến gốc, đồng thời giữ lại phần lớn phương sai?

Câu 38

Kỹ thuật 'Discretization' (rời rạc hóa) trong khai phá dữ liệu là gì?

Câu 39

Kỹ thuật 'Feature Engineering' (kỹ thuật đặc trưng) là gì?

Câu 40

Kỹ thuật nào thường được dùng để phát hiện các điểm bất thường (anomalies) trong dữ liệu chuỗi thời gian?