Bộ số 1

Câu 1

Cơ chế 'Attention' trong các mô hình NLP hiện đại giúp giải quyết vấn đề gì?

Câu 2

Trong mô hình Seq2Seq, 'Decoder' có vai trò gì?

Câu 3

Mô hình BERT (Bidirectional Encoder Representations from Transformers) nổi bật nhờ khả năng học biểu diễn từ ngữ cảnh hai chiều. Điều này có nghĩa là gì?

Câu 4

Trong lĩnh vực Question Answering (QA), loại câu hỏi nào thường yêu cầu mô hình xác định một đoạn văn bản cụ thể cung cấp câu trả lời?

Câu 5

Kỹ thuật 'Named Entity Recognition' (NER) giúp xác định và phân loại loại thông tin nào trong văn bản?

Câu 6

Trong các mô hình ngôn ngữ lớn (LLMs) như GPT, khái niệm 'Prompt Engineering' đề cập đến việc gì?

Câu 7

Phân tích tình cảm (Sentiment Analysis) trong NLP nhằm mục đích gì?

Câu 8

Kỹ thuật 'Text Summarization' có hai loại chính là extractive và abstractive. Sự khác biệt cơ bản là gì?

Câu 9

Khái niệm 'Zero-shot learning' trong NLP đề cập đến khả năng của mô hình làm gì?

Câu 10

Mô hình 'Transformer' có bao nhiêu thành phần chính trong mỗi khối Encoder và Decoder?

Câu 11

Trong Chatbot, 'Intent Recognition' là bước quan trọng nhằm mục đích gì?

Câu 12

Kỹ thuật 'Lemmatization' khác với 'Stemming' ở điểm nào?

Câu 13

Kỹ thuật 'Word Embeddings' (như Word2Vec, GloVe) khác biệt với Bag-of-Words ở điểm nào?

Câu 14

Kỹ thuật 'Few-shot learning' trong NLP có nghĩa là gì?

Câu 15

Mô hình 'BERT' được huấn luyện ban đầu trên hai nhiệm vụ chính là Masked Language Model (MLM) và nhiệm vụ nào nữa?

Câu 16

Kỹ thuật 'Masked Language Modeling' (MLM) được sử dụng trong các mô hình như BERT để làm gì?

Câu 17

Kỹ thuật 'Topic Modeling' (như LDA - Latent Dirichlet Allocation) thường được sử dụng để làm gì?

Câu 18

Trong phân tích văn bản, 'Lemmatization' thường yêu cầu thông tin gì để thực hiện chính xác?

Câu 19

Trong lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật nào thường được sử dụng để giảm số lượng từ vựng bằng cách nhóm các từ có gốc chung?

Câu 20

Trong các mô hình ngôn ngữ, 'Positional Encoding' được thêm vào đầu vào Embedding để làm gì?

Câu 21

Mô hình ngôn ngữ n-gram hoạt động dựa trên giả định nào?

Câu 22

Transfomer là kiến trúc mạng nơ-ron nổi bật trong NLP, đặc trưng bởi việc sử dụng chủ yếu cơ chế nào?

Câu 23

Trong xử lý ngôn ngữ tự nhiên, 'Tokenization' là bước đầu tiên để làm gì?

Câu 24

Kỹ thuật 'Text Classification' trong NLP được ứng dụng để làm gì?

Câu 25

Kỹ thuật 'Bag-of-Words' (BoW) biểu diễn văn bản bằng cách nào?

Câu 26

Mô hình Language Model (LM) được huấn luyện để làm gì?

Câu 27

Trong Chatbot, 'Entity Recognition' (còn gọi là Slot Filling) có vai trò gì?

Câu 28

Khi sử dụng 'TF-IDF' (Term Frequency-Inverse Document Frequency) để đánh giá tầm quan trọng của một từ trong một tài liệu, ý nghĩa của 'IDF' là gì?

Câu 29

Trong các mô hình Generative Adversarial Networks (GANs) cho văn bản, vai trò của 'Generator' là gì?

Câu 30

Trong các mô hình Sequence-to-Sequence (Seq2Seq), vai trò của 'Encoder' là gì?

Câu 31

Trong Machine Translation, khái niệm 'BLEU score' được dùng để làm gì?

Câu 32

Kỹ thuật 'Coreference Resolution' tập trung vào việc xác định các biểu thức ngôn ngữ khác nhau đề cập đến cùng một đối tượng hoặc thực thể. Ví dụ: 'An đi chơi. Cô ấy rất vui.' 'Cô ấy' ở đây là gì?

Câu 33

Kỹ thuật 'Zero-shot Relation Extraction' cho phép mô hình làm gì?

Câu 34

Trong quá trình tiền xử lý văn bản, bước 'Stop words removal' có mục đích gì?

Câu 35

Kỹ thuật 'Word Sense Disambiguation' (WSD) nhằm mục đích gì?

Câu 36

Kỹ thuật 'Data Augmentation' trong NLP có thể bao gồm những hành động nào để tăng cường tập dữ liệu?

Câu 37

Trong các mô hình sinh văn bản, 'Beam Search' là một chiến lược giải mã nhằm mục đích gì?

Câu 38

Kỹ thuật 'Evaluation Metrics' trong NLP dùng để làm gì?

Câu 39

Kỹ thuật 'Part-of-Speech Tagging' (POS Tagging) gán nhãn cho mỗi từ trong câu theo loại từ của nó. Ví dụ: 'Nhà' có thể được gán nhãn là gì?

Câu 40

Cú pháp 'Query, Key, Value' là khái niệm cốt lõi trong cơ chế nào của Transformer?