1. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Mức độ ý nghĩa thống kê của mô hình.
D. Sai số chuẩn của các hệ số hồi quy.
2. Trong phân tích hồi quy tuyến tính, giá trị P (p-value) được sử dụng để làm gì?
A. Ước lượng giá trị của hệ số hồi quy.
B. Đo lường mức độ phù hợp của mô hình.
C. Xác định xem hệ số hồi quy có ý nghĩa thống kê hay không.
D. Tính toán sai số chuẩn của hệ số hồi quy.
3. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Khoảng tin cậy dao động ngẫu nhiên.
4. Sai số loại II (Type II error) trong kiểm định giả thuyết còn được gọi là gì?
A. Mức ý nghĩa (Significance level)
B. Công suất kiểm định (Power of the test)
C. Xác suất chấp nhận giả thuyết sai (Probability of accepting a false hypothesis)
D. Độ lệch chuẩn (Standard deviation)
5. Khi nào thì nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của hai mẫu độc lập.
6. Khi nào chúng ta sử dụng kiểm định Kolmogorov-Smirnov?
A. Để so sánh trung bình của hai nhóm.
B. Để kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Để ước lượng khoảng tin cậy cho trung bình.
D. Để phân tích phương sai giữa các nhóm.
7. Đại lượng nào sau đây đo lường mức độ phân tán của một tập dữ liệu so với giá trị trung bình của nó?
A. Trung vị
B. Độ lệch chuẩn
C. Mốt
D. Giá trị trung bình
8. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến liên tục.
B. Biến định tính (categorical).
C. Biến thứ bậc (ordinal).
D. Biến khoảng (interval).
9. Trong lý thuyết xác suất, hai sự kiện được gọi là độc lập nếu:
A. Chúng không thể xảy ra cùng một lúc.
B. Xác suất xảy ra của sự kiện này ảnh hưởng đến xác suất xảy ra của sự kiện kia.
C. Xác suất xảy ra của sự kiện này không ảnh hưởng đến xác suất xảy ra của sự kiện kia.
D. Tổng xác suất của chúng bằng 1.
10. Trong phân tích hồi quy đa biến, điều gì xảy ra nếu có hiện tượng đa cộng tuyến (multicollinearity)?
A. Các hệ số hồi quy trở nên ổn định hơn.
B. Phương sai của các hệ số hồi quy tăng lên.
C. Mô hình trở nên chính xác hơn.
D. Giá trị R-squared giảm xuống.
11. Khi nào thì nên sử dụng kiểm định Wilcoxon Signed-Rank?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung vị của hai mẫu độc lập.
C. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu tuân theo phân phối chuẩn.
D. Để so sánh trung vị của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
12. Điều gì xảy ra với sai số chuẩn của trung bình (standard error of the mean) khi kích thước mẫu tăng lên?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm xuống.
C. Sai số chuẩn không thay đổi.
D. Sai số chuẩn dao động ngẫu nhiên.
13. Trong kiểm định giả thuyết, công suất kiểm định (power of the test) là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết không khi nó thực sự sai.
D. Xác suất chấp nhận giả thuyết không khi nó thực sự đúng.
14. Phương pháp nào sau đây thường được sử dụng để ước lượng khoảng tin cậy cho trung bình của một tổng thể khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của tổng thể chưa biết?
A. Phân phối Z
B. Phân phối chuẩn
C. Phân phối t
D. Phân phối nhị thức
15. Trong thống kê, `mốt` (mode) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm giữa của tập dữ liệu đã được sắp xếp.
D. Độ lệch chuẩn của tập dữ liệu.
16. Chọn phát biểu đúng về ý nghĩa của khoảng tin cậy 95%:
A. Có 95% khả năng giá trị tham số thực tế nằm trong khoảng này.
B. Có 5% khả năng giá trị tham số thực tế nằm ngoài khoảng này.
C. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa giá trị tham số thực tế.
D. Cả B và C.
17. Trong thống kê mô tả, tứ phân vị (quartiles) chia dữ liệu thành bao nhiêu phần bằng nhau?
18. Trong một phân phối nhị thức, điều gì đại diện cho `n`?
A. Xác suất thành công.
B. Xác suất thất bại.
C. Số lượng thử nghiệm.
D. Giá trị trung bình.
19. Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong khoảng một độ lệch chuẩn so với giá trị trung bình?
A. 50%
B. 68%
C. 95%
D. 99.7%
20. Khi nào chúng ta sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Để so sánh trung bình của hai nhóm.
B. Để kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế.
C. Để ước lượng khoảng tin cậy cho trung bình.
D. Để phân tích phương sai giữa các nhóm.
21. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại thông tin quan trọng nhất?
A. Phân tích hồi quy (Regression analysis)
B. Phân tích phương sai (ANOVA)
C. Phân tích thành phần chính (Principal component analysis)
D. Phân tích tương quan (Correlation analysis)
22. Trong thống kê, `phương sai` (variance) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Độ lệch tuyệt đối trung bình của tập dữ liệu.
C. Mức độ phân tán của dữ liệu so với giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
23. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn ước lượng tham số tổng thể.
24. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết không (null hypothesis) khi nó thực sự đúng.
B. Bác bỏ giả thuyết không (null hypothesis) khi nó thực sự đúng.
C. Chấp nhận giả thuyết không (null hypothesis) khi nó thực sự sai.
D. Bác bỏ giả thuyết không (null hypothesis) khi nó thực sự sai.
25. Đặc điểm nào sau đây không phải là đặc điểm của phân phối chuẩn?
A. Đối xứng quanh giá trị trung bình.
B. Giá trị trung bình, trung vị và mốt bằng nhau.
C. Có hai đỉnh.
D. Tổng diện tích dưới đường cong bằng 1.
26. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để so sánh trung vị của hai nhóm độc lập.
C. Để so sánh trung bình của ba nhóm trở lên khi dữ liệu tuân theo phân phối chuẩn.
D. Để so sánh trung vị của ba nhóm trở lên khi dữ liệu không tuân theo phân phối chuẩn.
27. Ý nghĩa của việc chuẩn hóa dữ liệu (standardization) trong thống kê là gì?
A. Chuyển đổi dữ liệu về khoảng [0, 1].
B. Chuyển đổi dữ liệu sao cho có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1.
C. Loại bỏ các giá trị ngoại lệ (outliers) khỏi dữ liệu.
D. Sắp xếp dữ liệu theo thứ tự tăng dần.
28. Phương pháp nào sau đây được sử dụng để so sánh trung bình của ba nhóm trở lên?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi-bình phương (Chi-square test)
D. Hồi quy tuyến tính (Linear regression)
29. Trong phân tích thời gian, thành phần nào sau đây mô tả xu hướng dài hạn của chuỗi dữ liệu?
A. Tính mùa vụ (Seasonality)
B. Tính chu kỳ (Cyclicality)
C. Xu hướng (Trend)
D. Tính ngẫu nhiên (Randomness)
30. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ biến động của một biến.
C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến.
D. Sự khác biệt giữa giá trị trung bình của hai biến.