1. Khi nào nên sử dụng kiểm định t (t-test) độc lập?
A. Khi so sánh trung bình của hai mẫu phụ thuộc
B. Khi so sánh trung bình của hai mẫu độc lập
C. Khi so sánh phương sai của hai mẫu độc lập
D. Khi so sánh tỷ lệ của hai mẫu độc lập
2. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không là đúng
B. Xác suất mắc sai lầm loại II
C. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết không là đúng
D. Xác suất bác bỏ giả thuyết không
3. Trong kiểm định Chi-bình phương, giả thuyết không thường phát biểu điều gì?
A. Có mối quan hệ giữa các biến
B. Không có mối quan hệ giữa các biến
C. Các biến có phân phối chuẩn
D. Các biến có phương sai bằng nhau
4. Trong phân tích dữ liệu, `data mining` (khai thác dữ liệu) là gì?
A. Quá trình thu thập dữ liệu từ các nguồn khác nhau
B. Quá trình làm sạch và chuẩn hóa dữ liệu
C. Quá trình khám phá các mẫu và mối quan hệ tiềm ẩn trong dữ liệu lớn
D. Quá trình trình bày dữ liệu một cách trực quan
5. Phương pháp nào sau đây được sử dụng để ước lượng giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập?
A. Phân tích phương sai (ANOVA)
B. Hồi quy tuyến tính
C. Kiểm định Chi-bình phương
D. Thống kê mô tả
6. Trong phân tích chuỗi thời gian (time series), thành phần nào sau đây mô tả sự biến động ngắn hạn và không đều?
A. Xu hướng (Trend)
B. Tính mùa vụ (Seasonality)
C. Chu kỳ (Cycle)
D. Tính ngẫu nhiên (Irregularity)
7. Độ lệch chuẩn của phân phối lấy mẫu của trung bình được gọi là gì?
A. Phương sai
B. Sai số chuẩn
C. Khoảng tin cậy
D. Giá trị p
8. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn
C. Để so sánh phương sai của hai mẫu độc lập
D. Để so sánh tỷ lệ của hai mẫu độc lập
9. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Trung bình
B. Phương sai
C. Độ lệch chuẩn
D. Trung vị
10. Đại lượng nào sau đây đo lường mức độ bất đối xứng của phân phối?
A. Phương sai
B. Độ lệch chuẩn
C. Độ xiên (Skewness)
D. Độ nhọn (Kurtosis)
11. Phương pháp lấy mẫu nào mà mỗi thành viên của quần thể có cơ hội được chọn như nhau?
A. Lấy mẫu phân tầng
B. Lấy mẫu cụm
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu thuận tiện
12. Khi nào thì nên sử dụng kiểm định Mann-Whitney U test?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn
B. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn
C. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn
D. Để so sánh phương sai của hai mẫu độc lập
13. Trong thống kê, `bootstrap` là gì?
A. Một phương pháp lấy mẫu lại từ dữ liệu gốc để ước lượng các thống kê
B. Một phương pháp để làm sạch dữ liệu
C. Một phương pháp để giảm số lượng biến
D. Một phương pháp để kiểm định giả thuyết
14. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ quan hệ phi tuyến tính giữa hai biến
B. Mức độ quan hệ nhân quả giữa hai biến
C. Mức độ quan hệ tuyến tính giữa hai biến
D. Mức độ khác biệt giữa hai biến
15. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích thành phần chính (Principal Component Analysis - PCA)
D. Kiểm định t
16. Trong thống kê Bayesian, khái niệm `prior` (tiền nghiệm) đề cập đến điều gì?
A. Dữ liệu quan sát được
B. Giả thuyết không
C. Niềm tin ban đầu về một tham số trước khi xem xét dữ liệu
D. Phân phối hậu nghiệm
17. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối đều
18. Trong phân tích đa biến, phương pháp nào sau đây được sử dụng để khám phá cấu trúc tiềm ẩn trong một tập hợp các biến quan sát được thông qua các biến tiềm ẩn?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Mô hình phương trình cấu trúc (Structural Equation Modeling - SEM)
D. Kiểm định t
19. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó thực sự đúng
B. Chấp nhận giả thuyết không khi nó thực sự sai
C. Bác bỏ giả thuyết không khi nó thực sự sai
D. Chấp nhận giả thuyết không khi nó thực sự đúng
20. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ
D. Khi muốn tính toán trung bình
21. Khi nào thì nên sử dụng biểu đồ hộp (boxplot)?
A. Để hiển thị tần số của các giá trị
B. Để so sánh trung bình của các nhóm
C. Để hiển thị sự phân bố và các giá trị ngoại lệ của một tập dữ liệu
D. Để hiển thị mối quan hệ giữa hai biến
22. Khi nào thì nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Để so sánh trung bình của hai mẫu độc lập
B. Để so sánh trung bình của hai mẫu phụ thuộc
C. Để kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không
D. Để so sánh phương sai của hai mẫu độc lập
23. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) cho biết điều gì?
A. Thời gian sống sót trung bình
B. Xác suất một cá nhân sống sót qua một thời điểm nhất định
C. Tỷ lệ tử vong tại một thời điểm nhất định
D. Nguy cơ tử vong tại một thời điểm nhất định
24. Trong thống kê mô tả, đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Giá trị lớn nhất
C. Độ lệch chuẩn
D. Tần số
25. Trong thống kê suy diễn, khoảng tin cậy (confidence interval) được sử dụng để làm gì?
A. Ước lượng một tham số của quần thể
B. Kiểm định giả thuyết về một tham số của quần thể
C. Mô tả đặc điểm của mẫu
D. Tính toán độ lệch chuẩn của quần thể
26. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn
B. Khoảng tin cậy trở nên hẹp hơn
C. Khoảng tin cậy không thay đổi
D. Khoảng tin cậy trở nên không xác định
27. Phương pháp nào sau đây được sử dụng để đánh giá độ tin cậy của một thang đo (scale) bằng cách tính toán mức độ nhất quán nội tại giữa các mục (items) trong thang đo?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Cronbach`s alpha
D. Kiểm định t
28. Phương pháp nào sau đây được sử dụng để phân loại các đối tượng vào các nhóm khác nhau dựa trên các đặc điểm của chúng?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích cụm (Cluster analysis)
D. Kiểm định t
29. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Mức độ quan hệ nhân quả giữa các biến
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập
C. Độ mạnh của mối quan hệ tuyến tính giữa các biến
D. Mức độ ý nghĩa thống kê của mô hình
30. Đại lượng nào sau đây không bị ảnh hưởng bởi các giá trị ngoại lệ (outliers) trong tập dữ liệu?
A. Trung bình
B. Độ lệch chuẩn
C. Trung vị
D. Phương sai