Phát triển Phần mềm và Dữ liệu Quiz
200+ câu hỏi trắc nghiệm Dữ liệu lớn (BigData) (Có đáp án)
📜 Đọc lưu ý & miễn trừ trách nhiệm trước khi làm bài (Click để đọc)
⚠️ Xin lưu ý và đọc kỹ phần miễn trừ trách nhiệm: Các câu hỏi và đáp án được cung cấp trong bộ trắc nghiệm này mang tính chất tham khảo, phục vụ cho mục đích học tập và luyện tập kiến thức. Đây KHÔNG phải là đề thi chính thức, cũng không đại diện cho tài liệu chuẩn hoặc kỳ thi chứng chỉ do bất kỳ cơ quan giáo dục hay tổ chức cấp chứng chỉ nào ban hành. Website không chịu trách nhiệm về tính chính xác của nội dung cũng như các quyết định được đưa ra dựa trên kết quả làm bài.
Bộ số 1
Câu 1
Cơ sở dữ liệu NoSQL nào thuộc loại Key-Value store, cung cấp khả năng truy cập nhanh chóng dựa trên khóa duy nhất?
Câu 2
Tại sao dữ liệu không cấu trúc (unstructured data) lại là một thách thức lớn trong BigData?
Câu 3
Đâu là một ví dụ về dữ liệu bán cấu trúc (semi-structured data)?
Câu 4
Đâu là một thách thức của BigData liên quan đến việc đảm bảo dữ liệu đến từ nhiều nguồn khác nhau là nhất quán và đáng tin cậy?
Câu 5
MapReduce là một mô hình lập trình được sử dụng trong Hadoop để:
Câu 6
Trong kiến trúc BigData, vai trò của 'Data Scientist' là gì?
Câu 7
Cơ sở dữ liệu NoSQL nào thuộc loại Graph database, chuyên dùng để mô hình hóa và quản lý dữ liệu có mối quan hệ phức tạp?
Câu 8
Công nghệ nào được sử dụng để xây dựng các ứng dụng phân tích dữ liệu tương tác và truy vấn dữ liệu lớn bằng SQL?
Câu 9
Khái niệm 'Velocity' trong BigData đề cập đến:
Câu 10
Trong Hadoop, YARN (Yet Another Resource Negotiator) có vai trò chính là:
Câu 11
Trong lĩnh vực BigData, 'ETL' (Extract, Transform, Load) là quy trình dùng để:
Câu 12
Cơ sở dữ liệu NoSQL nào phù hợp nhất cho việc lưu trữ dữ liệu có cấu trúc dạng bảng, tương tự như cơ sở dữ liệu quan hệ nhưng có khả năng mở rộng cao?
Câu 13
Mục tiêu chính của việc sử dụng Data Warehouse trong BigData là:
Câu 14
Trong bối cảnh BigData, 'Batch Processing' là phương pháp xử lý dữ liệu bằng cách:
Câu 15
Trong kiến trúc Hệ thống dữ liệu lớn, khái niệm 'Data Lake' thường được mô tả là nơi:
Câu 16
Trong Hadoop, 'NameNode' là một thành phần quan trọng của HDFS chịu trách nhiệm:
Câu 17
Một ví dụ về dữ liệu có cấu trúc (structured data) trong BigData là:
Câu 18
Mô hình dữ liệu nào của NoSQL phù hợp nhất cho việc lưu trữ và truy vấn các mối quan hệ phức tạp giữa các thực thể, ví dụ như mạng xã hội?
Câu 19
Đâu là đặc điểm chính của 'Volume' trong 3V của BigData?
Câu 20
Trong hệ sinh thái Hadoop, 'Oozie' là một công cụ được sử dụng để:
Câu 21
Khái niệm 'Data Governance' trong BigData liên quan đến việc:
Câu 22
Cơ sở dữ liệu NoSQL nào thuộc loại Document store, lưu trữ dữ liệu dưới dạng các tài liệu JSON hoặc BSON?
Câu 23
Khái niệm 'Data Virtualization' trong quản lý BigData là gì?
Câu 24
Tại sao 'Veracity' (tính xác thực) là một yếu tố quan trọng trong BigData?
Câu 25
Công nghệ nào thường được sử dụng để xử lý các tập dữ liệu rất lớn một cách song song và phân tán, đặc biệt là trong hệ sinh thái Hadoop?
Câu 26
Hadoop Distributed File System (HDFS) được thiết kế với nguyên tắc chính là:
Câu 27
Khái niệm 'Big Data Analytics' liên quan đến việc:
Câu 28
Khái niệm 'Data Mining' trong lĩnh vực BigData chủ yếu đề cập đến việc:
Câu 29
Trong phân tích BigData, 'Stream Processing' đề cập đến việc:
Câu 30
Khái niệm 'Data Lakehouse' kết hợp các ưu điểm của:
Câu 31
Đâu là một công nghệ xử lý luồng dữ liệu (stream processing) phổ biến trong BigData?
Câu 32
Trong các mô hình xử lý dữ liệu BigData, 'Near Real-Time Processing' là gì?
Câu 33
Công nghệ nào là một phần của hệ sinh thái Hadoop và được sử dụng để lưu trữ dữ liệu phân tán?
Câu 34
Apache Spark được đánh giá cao hơn MapReduce truyền thống ở khía cạnh nào?
Câu 35
Khái niệm 'Variety' trong 3V của BigData ám chỉ đến:
Câu 36
Tại sao việc sử dụng các công cụ phân tích BigData lại quan trọng đối với các doanh nghiệp hiện nay?
Câu 37
Cơ sở dữ liệu NoSQL nào thường được sử dụng cho các trường hợp cần lưu trữ dữ liệu với độ trễ thấp và khả năng mở rộng cao, ví dụ như lưu trữ phiên làm việc của người dùng?
Câu 38
Trong Hadoop, 'Sqoop' là công cụ được sử dụng để:
Câu 39
Trong Hadoop, 'DataNode' là thành phần chịu trách nhiệm:
Câu 40
Khái niệm 'Data Silo' trong quản lý dữ liệu BigData đề cập đến tình trạng:
