Bộ số 1

Câu 1

Cơ sở dữ liệu NoSQL nào thuộc loại Key-Value store, cung cấp khả năng truy cập nhanh chóng dựa trên khóa duy nhất?

Câu 2

Tại sao dữ liệu không cấu trúc (unstructured data) lại là một thách thức lớn trong BigData?

Câu 3

Đâu là một ví dụ về dữ liệu bán cấu trúc (semi-structured data)?

Câu 4

Đâu là một thách thức của BigData liên quan đến việc đảm bảo dữ liệu đến từ nhiều nguồn khác nhau là nhất quán và đáng tin cậy?

Câu 5

MapReduce là một mô hình lập trình được sử dụng trong Hadoop để:

Câu 6

Trong kiến trúc BigData, vai trò của 'Data Scientist' là gì?

Câu 7

Cơ sở dữ liệu NoSQL nào thuộc loại Graph database, chuyên dùng để mô hình hóa và quản lý dữ liệu có mối quan hệ phức tạp?

Câu 8

Công nghệ nào được sử dụng để xây dựng các ứng dụng phân tích dữ liệu tương tác và truy vấn dữ liệu lớn bằng SQL?

Câu 9

Khái niệm 'Velocity' trong BigData đề cập đến:

Câu 10

Trong Hadoop, YARN (Yet Another Resource Negotiator) có vai trò chính là:

Câu 11

Trong lĩnh vực BigData, 'ETL' (Extract, Transform, Load) là quy trình dùng để:

Câu 12

Cơ sở dữ liệu NoSQL nào phù hợp nhất cho việc lưu trữ dữ liệu có cấu trúc dạng bảng, tương tự như cơ sở dữ liệu quan hệ nhưng có khả năng mở rộng cao?

Câu 13

Mục tiêu chính của việc sử dụng Data Warehouse trong BigData là:

Câu 14

Trong bối cảnh BigData, 'Batch Processing' là phương pháp xử lý dữ liệu bằng cách:

Câu 15

Trong kiến trúc Hệ thống dữ liệu lớn, khái niệm 'Data Lake' thường được mô tả là nơi:

Câu 16

Trong Hadoop, 'NameNode' là một thành phần quan trọng của HDFS chịu trách nhiệm:

Câu 17

Một ví dụ về dữ liệu có cấu trúc (structured data) trong BigData là:

Câu 18

Mô hình dữ liệu nào của NoSQL phù hợp nhất cho việc lưu trữ và truy vấn các mối quan hệ phức tạp giữa các thực thể, ví dụ như mạng xã hội?

Câu 19

Đâu là đặc điểm chính của 'Volume' trong 3V của BigData?

Câu 20

Trong hệ sinh thái Hadoop, 'Oozie' là một công cụ được sử dụng để:

Câu 21

Khái niệm 'Data Governance' trong BigData liên quan đến việc:

Câu 22

Cơ sở dữ liệu NoSQL nào thuộc loại Document store, lưu trữ dữ liệu dưới dạng các tài liệu JSON hoặc BSON?

Câu 23

Khái niệm 'Data Virtualization' trong quản lý BigData là gì?

Câu 24

Tại sao 'Veracity' (tính xác thực) là một yếu tố quan trọng trong BigData?

Câu 25

Công nghệ nào thường được sử dụng để xử lý các tập dữ liệu rất lớn một cách song song và phân tán, đặc biệt là trong hệ sinh thái Hadoop?

Câu 26

Hadoop Distributed File System (HDFS) được thiết kế với nguyên tắc chính là:

Câu 27

Khái niệm 'Big Data Analytics' liên quan đến việc:

Câu 28

Khái niệm 'Data Mining' trong lĩnh vực BigData chủ yếu đề cập đến việc:

Câu 29

Trong phân tích BigData, 'Stream Processing' đề cập đến việc:

Câu 30

Khái niệm 'Data Lakehouse' kết hợp các ưu điểm của:

Câu 31

Đâu là một công nghệ xử lý luồng dữ liệu (stream processing) phổ biến trong BigData?

Câu 32

Trong các mô hình xử lý dữ liệu BigData, 'Near Real-Time Processing' là gì?

Câu 33

Công nghệ nào là một phần của hệ sinh thái Hadoop và được sử dụng để lưu trữ dữ liệu phân tán?

Câu 34

Apache Spark được đánh giá cao hơn MapReduce truyền thống ở khía cạnh nào?

Câu 35

Khái niệm 'Variety' trong 3V của BigData ám chỉ đến:

Câu 36

Tại sao việc sử dụng các công cụ phân tích BigData lại quan trọng đối với các doanh nghiệp hiện nay?

Câu 37

Cơ sở dữ liệu NoSQL nào thường được sử dụng cho các trường hợp cần lưu trữ dữ liệu với độ trễ thấp và khả năng mở rộng cao, ví dụ như lưu trữ phiên làm việc của người dùng?

Câu 38

Trong Hadoop, 'Sqoop' là công cụ được sử dụng để:

Câu 39

Trong Hadoop, 'DataNode' là thành phần chịu trách nhiệm:

Câu 40

Khái niệm 'Data Silo' trong quản lý dữ liệu BigData đề cập đến tình trạng: