1. Trong kiểm định giả thuyết, giá trị p (p-value) được sử dụng để làm gì?
A. Xác định kích thước mẫu cần thiết
B. Đo lường độ mạnh của mối quan hệ giữa các biến
C. Đánh giá bằng chứng chống lại giả thuyết không
D. Ước lượng khoảng tin cậy cho tham số
2. Trong thống kê, giá trị nào sau đây cho biết mối quan hệ tuyến tính giữa hai biến?
A. Giá trị trung bình
B. Độ lệch chuẩn
C. Hệ số tương quan
D. Phương sai
3. Trong thống kê suy diễn, sai số loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết không khi nó sai
B. Bác bỏ giả thuyết không khi nó đúng
C. Không bác bỏ giả thuyết không khi nó sai
D. Bác bỏ giả thuyết không khi nó đúng
4. Khi nào thì nên sử dụng kiểm định Mann-Whitney U test?
A. So sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn
B. So sánh trung bình của hai nhóm phụ thuộc khi dữ liệu tuân theo phân phối chuẩn
C. So sánh trung vị của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn
D. So sánh trung vị của hai nhóm phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn
5. Để đánh giá độ tin cậy của thang đo Likert, hệ số nào thường được sử dụng?
A. Hệ số tương quan Pearson
B. Cronbach`s Alpha
C. Hệ số R bình phương
D. Giá trị p (p-value)
6. Loại biểu đồ nào thường được sử dụng để thể hiện phân phối tần suất của một biến liên tục?
A. Biểu đồ phân tán
B. Biểu đồ cột
C. Biểu đồ tần suất (Histogram)
D. Biểu đồ hộp
7. Phương pháp nào sau đây được sử dụng để nhóm các đối tượng tương tự nhau thành các cụm dựa trên các đặc điểm của chúng?
A. Phân tích hồi quy
B. Phân tích cụm (Clustering)
C. Phân tích phương sai
D. Phân tích tương quan
8. Trong thống kê ứng dụng, loại biểu đồ nào thích hợp nhất để so sánh tỷ lệ đóng góp của các thành phần vào tổng thể?
A. Biểu đồ đường
B. Biểu đồ cột
C. Biểu đồ tròn
D. Biểu đồ hộp
9. Trong phân tích chuỗi thời gian, thành phần nào sau đây thể hiện sự biến động ngắn hạn và không thể dự đoán?
A. Xu hướng
B. Tính mùa vụ
C. Tính chu kỳ
D. Tính ngẫu nhiên
10. Khi phân tích hồi quy tuyến tính, hệ số R bình phương (R²) thể hiện điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu
B. Độ lớn của hệ số hồi quy
C. Mức ý nghĩa thống kê của các biến độc lập
D. Phương sai của sai số
11. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi cỡ mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn
D. Khi cần so sánh trung bình của hai nhóm
12. Khi thực hiện kiểm định t (t-test) cho hai mẫu độc lập, điều kiện tiên quyết nào sau đây cần được kiểm tra?
A. Tính dừng của chuỗi thời gian
B. Tính chuẩn của dữ liệu
C. Tính đa cộng tuyến
D. Tính dị phương sai
13. Phương pháp nào sau đây thường được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn, đồng thời giữ lại thông tin quan trọng nhất?
A. Phân tích phương sai (ANOVA)
B. Phân tích tương quan
C. Phân tích thành phần chính (PCA)
D. Hồi quy logistic
14. Phương pháp nào sau đây được sử dụng để giảm số lượng biến và chọn ra các biến quan trọng nhất để đưa vào mô hình?
A. Phân tích phương sai (ANOVA)
B. Phân tích tương quan
C. Lựa chọn biến (Variable selection)
D. Phân tích cụm
15. Trong phân tích hồi quy, giá trị của phần dư (residual) được tính như thế nào?
A. Giá trị dự đoán trừ giá trị thực tế
B. Giá trị thực tế trừ giá trị dự đoán
C. Tổng của giá trị thực tế và giá trị dự đoán
D. Tích của giá trị thực tế và giá trị dự đoán
16. Khi nào thì nên sử dụng hồi quy Logistic thay vì hồi quy tuyến tính?
A. Khi biến phụ thuộc là biến định lượng
B. Khi biến độc lập là biến định tính
C. Khi biến phụ thuộc là biến định tính
D. Khi không có mối quan hệ tuyến tính giữa các biến
17. Trong phân tích chuỗi thời gian, phương pháp nào sau đây được sử dụng để làm mịn dữ liệu và loại bỏ nhiễu?
A. Trung bình động (Moving average)
B. Phân tích hồi quy
C. Phân tích phương sai
D. Phân tích tương quan
18. Trong thống kê ứng dụng, phương pháp nào sau đây thường được sử dụng để dự báo giá trị tương lai dựa trên dữ liệu quá khứ?
A. Phân tích hồi quy tuyến tính
B. Phân tích phương sai (ANOVA)
C. Phân tích chuỗi thời gian
D. Phân tích tương quan
19. Trong thống kê mô tả, đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Mốt
C. Độ lệch chuẩn
D. Phân vị
20. Trong phân tích chuỗi thời gian, thành phần nào sau đây thể hiện xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ
B. Tính chu kỳ
C. Xu hướng
D. Tính ngẫu nhiên
21. Trong phân tích dữ liệu lớn, kỹ thuật nào sau đây được sử dụng để khám phá các mối quan hệ ẩn giữa các mục trong một tập dữ liệu giao dịch?
A. Phân tích hồi quy
B. Phân tích cụm
C. Phân tích kết hợp (Association rule mining)
D. Phân tích chuỗi thời gian
22. Phương pháp lấy mẫu nào đảm bảo mọi phần tử trong tổng thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện
B. Lấy mẫu phân tầng
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu theo cụm
23. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Ước lượng mối quan hệ giữa hai biến định lượng
B. So sánh phương sai giữa hai mẫu
C. So sánh trung bình của nhiều nhóm
D. Phân tích sự phân tán của dữ liệu
24. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có mối quan hệ tuyến tính hoàn hảo giữa biến độc lập và biến phụ thuộc
B. Khi có mối tương quan cao giữa các biến độc lập
C. Khi phương sai của sai số thay đổi
D. Khi dữ liệu không tuân theo phân phối chuẩn
25. Khi nào nên sử dụng phương pháp lấy mẫu phân tầng?
A. Khi tổng thể đồng nhất
B. Khi tổng thể có các nhóm khác biệt rõ rệt
C. Khi cần tiết kiệm chi phí lấy mẫu
D. Khi không có thông tin về tổng thể
26. Trong thống kê, `phân phối chuẩn` còn được gọi là gì?
A. Phân phối Poisson
B. Phân phối Bernoulli
C. Phân phối Gaussian
D. Phân phối nhị thức
27. Đường cong ROC (Receiver Operating Characteristic) được sử dụng để đánh giá hiệu suất của mô hình nào?
A. Mô hình hồi quy tuyến tính
B. Mô hình phân loại
C. Mô hình phân tích chuỗi thời gian
D. Mô hình phân tích phương sai
28. Trong một nghiên cứu, bạn muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t (t-test)
B. Phân tích hồi quy
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi bình phương
29. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là gì?
30. Khi nào thì nên sử dụng kiểm định Chi bình phương (Chi-square test)?
A. So sánh trung bình của hai nhóm độc lập
B. Phân tích mối quan hệ giữa hai biến định tính
C. Ước lượng khoảng tin cậy cho trung bình
D. Kiểm tra sự bằng nhau của phương sai