Đề 5 – Đề thi, câu hỏi trắc nghiệm online Học máy

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Học máy

Đề 5 - Đề thi, câu hỏi trắc nghiệm online Học máy

1. Trong ngữ cảnh của học tăng cường (Reinforcement Learning), `môi trường` (environment) đại diện cho điều gì?

A. Thuật toán học mà tác tử sử dụng.
B. Tập hợp các quy tắc mà tác tử phải tuân theo.
C. Thế giới mà tác tử tương tác và nhận phản hồi.
D. Hàm phần thưởng mà tác tử cố gắng tối ưu hóa.

2. Boosting và Bagging khác nhau như thế nào trong ensemble learning?

A. Boosting huấn luyện các mô hình song song, trong khi Bagging huấn luyện tuần tự.
B. Boosting tập trung vào việc giảm variance, trong khi Bagging tập trung vào việc giảm bias.
C. Boosting huấn luyện các mô hình tuần tự, trong đó mỗi mô hình tập trung vào việc sửa lỗi của các mô hình trước, trong khi Bagging huấn luyện các mô hình độc lập trên các tập con khác nhau của dữ liệu.
D. Boosting chỉ sử dụng cho bài toán phân loại, trong khi Bagging chỉ sử dụng cho bài toán hồi quy.

3. Recurrent Neural Networks (RNNs) được thiết kế để xử lý loại dữ liệu nào?

A. Dữ liệu hình ảnh tĩnh.
B. Dữ liệu dạng bảng.
C. Dữ liệu chuỗi tuần tự (ví dụ: văn bản, chuỗi thời gian).
D. Dữ liệu không có cấu trúc.

4. Mục đích của việc sử dụng hàm softmax trong lớp đầu ra của một mạng nơ-ron phân loại đa lớp là gì?

A. Chuẩn hóa các giá trị đầu ra thành một phân phối xác suất, sao cho tổng của chúng bằng 1.
B. Tăng cường độ tương phản của các giá trị đầu ra.
C. Giảm số lượng tham số trong mạng.
D. Tăng tốc độ tính toán của mạng.

5. Hàm mất mát (loss function) được sử dụng để làm gì trong quá trình huấn luyện mô hình học máy?

A. Đánh giá hiệu suất mô hình trên dữ liệu mới.
B. Tính toán độ phức tạp của mô hình.
C. Đo lường sự khác biệt giữa dự đoán của mô hình và giá trị thực tế.
D. Xác định kiến trúc tối ưu cho mô hình.

6. Ensemble learning là gì?

A. Một phương pháp để chuẩn hóa dữ liệu đầu vào.
B. Một kỹ thuật để giảm số lượng đặc trưng.
C. Một phương pháp kết hợp nhiều mô hình học máy để cải thiện hiệu suất tổng thể.
D. Một thuật toán để tìm các cụm trong dữ liệu.

7. Khi nào thì việc sử dụng một mô hình phức tạp (ví dụ: mạng nơ-ron sâu) là phù hợp?

A. Khi dữ liệu có ít đặc trưng và số lượng mẫu nhỏ.
B. Khi cần một mô hình dễ diễn giải và có độ phức tạp thấp.
C. Khi có nhiều dữ liệu và mối quan hệ giữa các đặc trưng và nhãn là phức tạp.
D. Khi cần huấn luyện mô hình một cách nhanh chóng.

8. Hệ quả của việc sử dụng kích thước batch quá lớn trong huấn luyện mạng nơ-ron là gì?

A. Huấn luyện nhanh hơn nhưng có thể hội tụ kém.
B. Huấn luyện chậm hơn nhưng hội tụ tốt hơn.
C. Luôn luôn cải thiện độ chính xác của mô hình.
D. Không ảnh hưởng đến quá trình huấn luyện.

9. Trong học máy, kỹ thuật nào giúp giảm số lượng chiều dữ liệu đồng thời giữ lại thông tin quan trọng nhất?

A. Chuẩn hóa dữ liệu (Data Normalization)
B. Rút gọn dữ liệu (Data Reduction)
C. Phân tích thành phần chính (Principal Component Analysis - PCA)
D. Tăng cường dữ liệu (Data Augmentation)

10. Autoregressive model (mô hình tự hồi quy) được sử dụng để làm gì?

A. Phân loại hình ảnh.
B. Dự đoán chuỗi thời gian dựa trên các giá trị trước đó trong chuỗi.
C. Phân cụm dữ liệu.
D. Giảm số lượng chiều của dữ liệu.

11. Convolutional Neural Networks (CNNs) thường được sử dụng cho loại bài toán nào?

A. Xử lý ngôn ngữ tự nhiên.
B. Dự đoán chuỗi thời gian.
C. Phân tích hình ảnh và video.
D. Phân cụm dữ liệu.

12. Lợi ích chính của việc sử dụng mini-batch gradient descent so với batch gradient descent là gì?

A. Đảm bảo hội tụ đến nghiệm tối ưu toàn cục.
B. Giảm thiểu bộ nhớ sử dụng trong quá trình huấn luyện.
C. Tăng tốc độ huấn luyện và giảm khả năng mắc kẹt ở cực tiểu cục bộ.
D. Đơn giản hóa việc tính toán gradient.

13. ROC curve (Receiver Operating Characteristic curve) được sử dụng để đánh giá hiệu suất của mô hình nào?

A. Mô hình hồi quy.
B. Mô hình phân cụm.
C. Mô hình phân loại.
D. Mô hình giảm chiều dữ liệu.

14. Label encoding và One-hot encoding được sử dụng để làm gì trong tiền xử lý dữ liệu?

A. Chuẩn hóa dữ liệu số.
B. Chuyển đổi dữ liệu category thành dạng số để có thể sử dụng trong các mô hình học máy.
C. Giảm số lượng chiều của dữ liệu.
D. Loại bỏ các giá trị thiếu.

15. Lợi ích của việc sử dụng batch normalization là gì?

A. Tăng tốc độ huấn luyện, cho phép sử dụng learning rate cao hơn và cải thiện độ ổn định của quá trình huấn luyện.
B. Giảm số lượng tham số trong mạng.
C. Đơn giản hóa việc thiết kế kiến trúc mạng.
D. Giảm thiểu bộ nhớ sử dụng trong quá trình huấn luyện.

16. Trong học sâu, `gradient vanishing` (mất mát gradient) là gì và nó gây ra vấn đề gì?

A. Gradient trở nên quá lớn, gây ra sự không ổn định trong quá trình huấn luyện.
B. Gradient trở nên quá nhỏ, khiến cho các lớp đầu của mạng nơ-ron học rất chậm hoặc không học được.
C. Gradient dao động mạnh, gây khó khăn cho việc hội tụ.
D. Gradient bị mất hoàn toàn do lỗi phần cứng.

17. Mục tiêu chính của việc sử dụng hàm kích hoạt (activation function) trong mạng nơ-ron là gì?

A. Tăng tốc độ tính toán của mạng.
B. Giới thiệu tính phi tuyến vào mạng, cho phép mô hình học các mối quan hệ phức tạp.
C. Giảm số lượng tham số trong mạng.
D. Chuẩn hóa dữ liệu đầu vào.

18. Trong học máy, bias-variance tradeoff (đánh đổi giữa độ chệch và phương sai) mô tả điều gì?

A. Mối quan hệ giữa kích thước tập dữ liệu huấn luyện và thời gian huấn luyện.
B. Mối quan hệ giữa độ phức tạp của mô hình và khả năng khái quát hóa của nó.
C. Mối quan hệ giữa số lượng đặc trưng và độ chính xác của mô hình.
D. Mối quan hệ giữa learning rate và số lượng epochs trong quá trình huấn luyện.

19. Trong học máy không giám sát, thuật toán K-means clustering được sử dụng để làm gì?

A. Dự đoán giá trị của một biến liên tục.
B. Phân loại dữ liệu vào các nhóm dựa trên nhãn đã biết.
C. Tìm các cụm (cluster) trong dữ liệu dựa trên sự tương đồng giữa các điểm dữ liệu.
D. Giảm số lượng chiều của dữ liệu.

20. Phương pháp nào sau đây thường được sử dụng để tránh tình trạng overfitting trong mô hình học máy?

A. Tăng kích thước tập dữ liệu huấn luyện (Increase training data size)
B. Giảm số lượng đặc trưng (Reduce the number of features)
C. Sử dụng kỹ thuật regularization (Regularization techniques)
D. Tất cả các phương án trên (All of the above)

21. GANs (Generative Adversarial Networks) bao gồm hai mạng nơ-ron chính, đó là gì?

A. Encoder và Decoder.
B. Generator và Discriminator.
C. Classifier và Regressor.
D. Actor và Critic.

22. Kỹ thuật `cross-validation` được sử dụng để làm gì trong học máy?

A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá hiệu suất của mô hình trên dữ liệu chưa thấy.
C. Chọn các đặc trưng quan trọng nhất từ dữ liệu.
D. Giảm kích thước của mô hình.

23. Trong xử lý ngôn ngữ tự nhiên (NLP), Word Embedding (ví dụ: Word2Vec, GloVe) được sử dụng để làm gì?

A. Phân loại văn bản thành các chủ đề khác nhau.
B. Biểu diễn từ ngữ dưới dạng vector số, thể hiện mối quan hệ ngữ nghĩa giữa chúng.
C. Loại bỏ các từ dừng (stop words) khỏi văn bản.
D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.

24. Dropout là một kỹ thuật regularization được sử dụng trong mạng nơ-ron như thế nào?

A. Thêm một khoản phạt vào hàm mất mát dựa trên độ lớn của các trọng số.
B. Ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Chuẩn hóa dữ liệu đầu vào để có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1.
D. Sử dụng một learning rate nhỏ hơn trong quá trình huấn luyện.

25. Attention mechanism (cơ chế chú ý) được sử dụng để làm gì trong các mô hình học sâu?

A. Giảm số lượng tham số trong mô hình.
B. Cho phép mô hình tập trung vào các phần quan trọng nhất của dữ liệu đầu vào.
C. Tăng tốc độ tính toán của mô hình.
D. Chuẩn hóa dữ liệu đầu vào.

26. Khi nào thì nên sử dụng Support Vector Machine (SVM)?

A. Khi dữ liệu có số lượng chiều rất lớn và số lượng mẫu nhỏ.
B. Khi cần một mô hình dễ diễn giải và có độ phức tạp thấp.
C. Khi dữ liệu có nhiều nhiễu.
D. Khi dữ liệu có mối quan hệ tuyến tính rõ ràng.

27. Phương pháp nào sau đây giúp giải quyết vấn đề `gradient vanishing` trong mạng nơ-ron sâu?

A. Sử dụng hàm kích hoạt sigmoid.
B. Sử dụng hàm kích hoạt ReLU (Rectified Linear Unit).
C. Sử dụng learning rate lớn.
D. Sử dụng mini-batch gradient descent với kích thước batch nhỏ.

28. Khi nào nên sử dụng thuật toán Random Forest thay vì một cây quyết định đơn lẻ?

A. Khi cần một mô hình dễ diễn giải và có độ phức tạp thấp.
B. Khi muốn giảm overfitting và cải thiện độ chính xác dự đoán.
C. Khi dữ liệu có ít đặc trưng.
D. Khi cần huấn luyện mô hình trên một tập dữ liệu rất lớn.

29. Trong học máy, `feature engineering` (kỹ thuật đặc trưng) là gì?

A. Quá trình chọn thuật toán học máy phù hợp nhất cho một bài toán.
B. Quá trình chuyển đổi dữ liệu thô thành các đặc trưng phù hợp để huấn luyện mô hình.
C. Quá trình đánh giá hiệu suất của mô hình trên dữ liệu kiểm tra.
D. Quá trình tối ưu hóa các tham số của mô hình.

30. Trong bài toán phân loại, độ đo `Precision` (Độ chính xác) được định nghĩa như thế nào?

A. Tỷ lệ các điểm dữ liệu thực tế là dương tính được dự đoán chính xác.
B. Tỷ lệ các điểm dữ liệu được dự đoán là dương tính mà thực sự là dương tính.
C. Tỷ lệ các điểm dữ liệu âm tính được dự đoán chính xác.
D. Tỷ lệ tất cả các điểm dữ liệu được dự đoán chính xác.

1 / 30

Category: Học máy

Tags: Bộ đề 5

1. Trong ngữ cảnh của học tăng cường (Reinforcement Learning), 'môi trường' (environment) đại diện cho điều gì?

2 / 30

Category: Học máy

Tags: Bộ đề 5

2. Boosting và Bagging khác nhau như thế nào trong ensemble learning?

3 / 30

Category: Học máy

Tags: Bộ đề 5

3. Recurrent Neural Networks (RNNs) được thiết kế để xử lý loại dữ liệu nào?

4 / 30

Category: Học máy

Tags: Bộ đề 5

4. Mục đích của việc sử dụng hàm softmax trong lớp đầu ra của một mạng nơ-ron phân loại đa lớp là gì?

5 / 30

Category: Học máy

Tags: Bộ đề 5

5. Hàm mất mát (loss function) được sử dụng để làm gì trong quá trình huấn luyện mô hình học máy?

6 / 30

Category: Học máy

Tags: Bộ đề 5

6. Ensemble learning là gì?

7 / 30

Category: Học máy

Tags: Bộ đề 5

7. Khi nào thì việc sử dụng một mô hình phức tạp (ví dụ: mạng nơ-ron sâu) là phù hợp?

8 / 30

Category: Học máy

Tags: Bộ đề 5

8. Hệ quả của việc sử dụng kích thước batch quá lớn trong huấn luyện mạng nơ-ron là gì?

9 / 30

Category: Học máy

Tags: Bộ đề 5

9. Trong học máy, kỹ thuật nào giúp giảm số lượng chiều dữ liệu đồng thời giữ lại thông tin quan trọng nhất?

10 / 30

Category: Học máy

Tags: Bộ đề 5

10. Autoregressive model (mô hình tự hồi quy) được sử dụng để làm gì?

11 / 30

Category: Học máy

Tags: Bộ đề 5

11. Convolutional Neural Networks (CNNs) thường được sử dụng cho loại bài toán nào?

12 / 30

Category: Học máy

Tags: Bộ đề 5

12. Lợi ích chính của việc sử dụng mini-batch gradient descent so với batch gradient descent là gì?

13 / 30

Category: Học máy

Tags: Bộ đề 5

13. ROC curve (Receiver Operating Characteristic curve) được sử dụng để đánh giá hiệu suất của mô hình nào?

14 / 30

Category: Học máy

Tags: Bộ đề 5

14. Label encoding và One-hot encoding được sử dụng để làm gì trong tiền xử lý dữ liệu?

15 / 30

Category: Học máy

Tags: Bộ đề 5

15. Lợi ích của việc sử dụng batch normalization là gì?

16 / 30

Category: Học máy

Tags: Bộ đề 5

16. Trong học sâu, 'gradient vanishing' (mất mát gradient) là gì và nó gây ra vấn đề gì?

17 / 30

Category: Học máy

Tags: Bộ đề 5

17. Mục tiêu chính của việc sử dụng hàm kích hoạt (activation function) trong mạng nơ-ron là gì?

18 / 30

Category: Học máy

Tags: Bộ đề 5

18. Trong học máy, bias-variance tradeoff (đánh đổi giữa độ chệch và phương sai) mô tả điều gì?

19 / 30

Category: Học máy

Tags: Bộ đề 5

19. Trong học máy không giám sát, thuật toán K-means clustering được sử dụng để làm gì?

20 / 30

Category: Học máy

Tags: Bộ đề 5

20. Phương pháp nào sau đây thường được sử dụng để tránh tình trạng overfitting trong mô hình học máy?

21 / 30

Category: Học máy

Tags: Bộ đề 5

21. GANs (Generative Adversarial Networks) bao gồm hai mạng nơ-ron chính, đó là gì?

22 / 30

Category: Học máy

Tags: Bộ đề 5

22. Kỹ thuật 'cross-validation' được sử dụng để làm gì trong học máy?

23 / 30

Category: Học máy

Tags: Bộ đề 5

23. Trong xử lý ngôn ngữ tự nhiên (NLP), Word Embedding (ví dụ: Word2Vec, GloVe) được sử dụng để làm gì?

24 / 30

Category: Học máy

Tags: Bộ đề 5

24. Dropout là một kỹ thuật regularization được sử dụng trong mạng nơ-ron như thế nào?

25 / 30

Category: Học máy

Tags: Bộ đề 5

25. Attention mechanism (cơ chế chú ý) được sử dụng để làm gì trong các mô hình học sâu?

26 / 30

Category: Học máy

Tags: Bộ đề 5

26. Khi nào thì nên sử dụng Support Vector Machine (SVM)?

27 / 30

Category: Học máy

Tags: Bộ đề 5

27. Phương pháp nào sau đây giúp giải quyết vấn đề 'gradient vanishing' trong mạng nơ-ron sâu?

28 / 30

Category: Học máy

Tags: Bộ đề 5

28. Khi nào nên sử dụng thuật toán Random Forest thay vì một cây quyết định đơn lẻ?

29 / 30

Category: Học máy

Tags: Bộ đề 5

29. Trong học máy, 'feature engineering' (kỹ thuật đặc trưng) là gì?

30 / 30

Category: Học máy

Tags: Bộ đề 5

30. Trong bài toán phân loại, độ đo 'Precision' (Độ chính xác) được định nghĩa như thế nào?