1. Trong thống kê ứng dụng, phương pháp nào được sử dụng để ước lượng giá trị của một biến phụ thuộc dựa trên giá trị của một hoặc nhiều biến độc lập?
A. Phân tích phương sai (ANOVA)
B. Kiểm định giả thuyết
C. Phân tích hồi quy
D. Thống kê mô tả
2. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được kiểm tra để xác định xem có sự khác biệt đáng kể giữa các nhóm hay không?
A. Giá trị trung bình của mỗi nhóm
B. Phương sai giữa các nhóm
C. Độ lệch chuẩn của mỗi nhóm
D. Tổng kích thước mẫu
3. Phương pháp nào sau đây giúp xác định xem có mối quan hệ phi tuyến tính giữa hai biến hay không?
A. Hệ số tương quan Pearson
B. Phân tích hồi quy tuyến tính
C. Biểu đồ phân tán (scatter plot)
D. Kiểm định t
4. Trong kiểm định giả thuyết, `mức ý nghĩa` (significance level) thường được ký hiệu là α (alpha) đại diện cho điều gì?
A. Xác suất mắc lỗi loại II
B. Xác suất chấp nhận giả thuyết H0 khi nó đúng
C. Xác suất bác bỏ giả thuyết H0 khi nó đúng (xác suất mắc lỗi loại I)
D. Xác suất bác bỏ giả thuyết H0 khi nó sai
5. Đâu là một ứng dụng quan trọng của kiểm định giả thuyết trong lĩnh vực kinh tế?
A. Ước lượng doanh thu tối đa
B. Đánh giá hiệu quả của một chiến dịch quảng cáo
C. Xây dựng mô hình dự báo thời tiết
D. Tính toán độ lệch chuẩn
6. Trong thống kê ứng dụng, kỹ thuật `lấy mẫu ngẫu nhiên` (random sampling) được sử dụng để làm gì?
A. Chọn mẫu sao cho thuận tiện nhất
B. Đảm bảo mọi thành viên của quần thể đều có cơ hội được chọn vào mẫu
C. Chọn mẫu dựa trên ý kiến chủ quan của nhà nghiên cứu
D. Chọn mẫu chỉ từ một nhóm nhỏ trong quần thể
7. Trong thống kê ứng dụng, khi nào nên sử dụng phân tích hồi quy đa biến (multiple regression)?
A. Khi muốn dự đoán một biến phụ thuộc dựa trên nhiều biến độc lập
B. Khi muốn so sánh trung bình của hai nhóm
C. Khi muốn kiểm tra tính độc lập giữa hai biến định tính
D. Khi muốn mô tả dữ liệu bằng các số liệu thống kê cơ bản
8. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-square) trong thống kê ứng dụng?
A. Khi so sánh trung bình của hai mẫu độc lập
B. Khi phân tích mối quan hệ giữa hai biến định tính
C. Khi ước lượng khoảng tin cậy cho trung bình
D. Khi phân tích hồi quy tuyến tính
9. Trong thống kê mô tả, đại lượng nào đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Mode
C. Độ lệch chuẩn
D. Phần trăm
10. Trong kiểm định giả thuyết, lỗi loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó thực sự sai
B. Bác bỏ giả thuyết H0 khi nó thực sự đúng
C. Không bác bỏ giả thuyết H0 khi nó thực sự đúng
D. Không bác bỏ giả thuyết H0 khi nó thực sự sai
11. Trong thống kê ứng dụng, khái niệm `khoảng tin cậy` (confidence interval) được sử dụng để làm gì?
A. Đo lường mức độ tin cậy của một kiểm định giả thuyết
B. Ước lượng một khoảng giá trị mà tham số của quần thể có khả năng nằm trong đó
C. Xác định kích thước mẫu cần thiết cho một nghiên cứu
D. Tính toán độ lệch chuẩn của mẫu
12. Khi dữ liệu không tuân theo phân phối chuẩn và kích thước mẫu nhỏ, kiểm định nào sau đây là phù hợp để so sánh hai nhóm?
A. Kiểm định t
B. Kiểm định z
C. Kiểm định Mann-Whitney U
D. Phân tích phương sai (ANOVA)
13. Khi phân tích mối quan hệ giữa hai biến định lượng, hệ số tương quan Pearson đo lường điều gì?
A. Mức độ phụ thuộc lẫn nhau giữa hai biến
B. Mức độ biến thiên của một biến so với biến kia
C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến
D. Sự khác biệt về trung bình giữa hai biến
14. Giả sử bạn muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau lên kết quả học tập của học sinh, phương pháp thống kê nào phù hợp nhất?
A. Hồi quy tuyến tính
B. Phân tích phương sai (ANOVA)
C. Kiểm định t (t-test)
D. Tương quan Pearson
15. Trong thống kê ứng dụng, `phân phối chuẩn` (normal distribution) còn được gọi là gì?
A. Phân phối Poisson
B. Phân phối Bernoulli
C. Phân phối Gaussian
D. Phân phối nhị thức
16. Phương pháp nào sau đây thường được sử dụng để xác định các giá trị ngoại lệ (outliers) trong một tập dữ liệu?
A. Tính trung bình
B. Sử dụng biểu đồ hộp (boxplot)
C. Tính trung vị
D. Tính độ lệch chuẩn
17. Trong thống kê ứng dụng, `phân tích cụm` (cluster analysis) được sử dụng để làm gì?
A. Dự đoán giá trị của một biến
B. Phân nhóm các đối tượng có đặc điểm tương đồng
C. Kiểm tra giả thuyết về mối quan hệ giữa các biến
D. Mô tả dữ liệu bằng các số liệu thống kê
18. Khi phân tích dữ liệu định tính, phương pháp nào sau đây thường được sử dụng để tóm tắt tần suất xuất hiện của các danh mục?
A. Tính trung bình
B. Tính độ lệch chuẩn
C. Bảng tần số (frequency table)
D. Phân tích hồi quy
19. Trong thống kê ứng dụng, phương pháp nào sau đây được sử dụng để kiểm tra sự phù hợp của dữ liệu với một phân phối lý thuyết (ví dụ: phân phối chuẩn)?
A. Kiểm định t
B. Kiểm định Chi-bình phương
C. Phân tích hồi quy
D. Phân tích phương sai (ANOVA)
20. Phương pháp nào sau đây được sử dụng để đánh giá độ tin cậy của một thang đo (scale) trong nghiên cứu định lượng?
A. Kiểm định t
B. Hệ số Cronbach`s alpha
C. Phân tích phương sai (ANOVA)
D. Phân tích hồi quy
21. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy
B. Phân tích phương sai (ANOVA)
C. Phân tích thành phần chính (Principal Component Analysis - PCA)
D. Kiểm định Chi-bình phương
22. Trong thống kê ứng dụng, khi nào nên sử dụng kiểm định t парный (paired t-test)?
A. Khi so sánh trung bình của hai mẫu độc lập
B. Khi so sánh trung bình của hai mẫu có liên quan (ví dụ: trước và sau can thiệp)
C. Khi so sánh trung bình của ba nhóm trở lên
D. Khi phân tích mối quan hệ giữa hai biến định tính
23. Khi nào thì việc sử dụng thống kê phi tham số là phù hợp hơn so với thống kê tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ
D. Khi cần tính toán khoảng tin cậy
24. Đâu là một hạn chế của việc sử dụng giá trị trung bình (mean) làm thước đo trung tâm trong thống kê mô tả?
A. Giá trị trung bình khó tính toán
B. Giá trị trung bình không phản ánh đầy đủ thông tin của dữ liệu
C. Giá trị trung bình dễ bị ảnh hưởng bởi các giá trị ngoại lệ
D. Giá trị trung bình chỉ áp dụng cho dữ liệu định lượng
25. Trong phân tích hồi quy, hệ số R-squared (R²) cho biết điều gì?
A. Mức độ quan hệ tuyến tính giữa các biến
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập
C. Sai số chuẩn của ước lượng
D. Giá trị p của các hệ số hồi quy
26. Trong kiểm định giả thuyết, `lỗi loại II` (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó thực sự đúng
B. Chấp nhận giả thuyết H0 khi nó thực sự đúng
C. Không bác bỏ giả thuyết H0 khi nó thực sự sai
D. Bác bỏ giả thuyết H0 khi nó thực sự sai
27. Trong thống kê ứng dụng, phương pháp nào thường được sử dụng để dự báo chuỗi thời gian (time series forecasting)?
A. Phân tích hồi quy tuyến tính
B. Trung bình động (Moving Average)
C. Kiểm định t
D. Phân tích phương sai (ANOVA)
28. Đâu là một ví dụ về ứng dụng của thống kê ứng dụng trong lĩnh vực y tế?
A. Dự báo giá cổ phiếu
B. Phân tích hiệu quả của một loại thuốc mới
C. Xác định độ tuổi trung bình của dân số
D. Nghiên cứu thị trường
29. Trong thống kê ứng dụng, `phân tích thời gian sống` (survival analysis) thường được sử dụng trong lĩnh vực nào?
A. Marketing
B. Tài chính
C. Y tế
D. Kỹ thuật
30. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng
B. Xác suất mắc lỗi loại I
C. Xác suất thu được kết quả quan sát được (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng
D. Xác suất mắc lỗi loại II