1. Trong phân tích hồi quy logistic, mục đích chính là gì?
A. Để xác định mối quan hệ giữa hai biến định lượng.
B. Để dự đoán xác suất của một biến phân loại dựa trên một hoặc nhiều biến dự đoán.
C. Để so sánh phương sai giữa hai hoặc nhiều nhóm.
D. Để kiểm tra mối quan hệ giữa hai biến định tính.
2. Khi nào thì nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để kiểm tra mối quan hệ giữa hai biến định tính.
C. Để kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
D. Để so sánh phương sai của hai nhóm độc lập.
3. Phương pháp nào sau đây được sử dụng để đánh giá độ tin cậy nội tại của một thang đo hoặc bài kiểm tra?
A. Độ tin cậy giữa các giám khảo (Inter-rater reliability)
B. Độ tin cậy kiểm tra lại (Test-retest reliability)
C. Alpha của Cronbach
D. Độ tin cậy song song (Parallel-forms reliability)
4. Khái niệm nào sau đây mô tả mức độ mà một thước đo đo lường những gì nó được cho là đo lường?
A. Độ tin cậy
B. Độ hiệu lực
C. Công suất (Power)
D. Ý nghĩa
5. Điều gì xảy ra với sai số chuẩn của trung bình khi kích thước mẫu tăng lên?
A. Sai số chuẩn tăng lên
B. Sai số chuẩn giảm xuống
C. Sai số chuẩn không đổi
D. Không thể xác định
6. Ý nghĩa của p-value trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết không đúng là đúng.
B. Xác suất quan sát được kết quả như hiện tại hoặc cực đoan hơn, giả sử giả thuyết không đúng là đúng.
C. Xác suất giả thuyết không đúng là sai.
D. Xác suất quan sát được kết quả như hiện tại hoặc ít cực đoan hơn, giả sử giả thuyết không đúng là đúng.
7. Trong thống kê, loại thang đo nào cho phép xác định thứ tự và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 thực sự?
A. Thang đo định danh
B. Thang đo thứ bậc
C. Thang đo khoảng
D. Thang đo tỷ lệ
8. Phương pháp nào sau đây phù hợp nhất để trực quan hóa mối quan hệ giữa hai biến định lượng?
A. Biểu đồ tần suất (Histogram)
B. Biểu đồ hộp (Box plot)
C. Biểu đồ phân tán (Scatter plot)
D. Biểu đồ tròn (Pie chart)
9. Trong kiểm định giả thuyết, lỗi loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết không đúng khi nó thực sự đúng.
B. Chấp nhận giả thuyết không đúng khi nó thực sự sai.
C. Bác bỏ giả thuyết không đúng khi nó thực sự sai.
D. Chấp nhận giả thuyết không đúng khi nó thực sự đúng.
10. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Để xác định mối quan hệ giữa hai biến định lượng.
B. Để so sánh phương sai giữa hai hoặc nhiều nhóm.
C. Để dự đoán giá trị của một biến dựa trên giá trị của một biến khác.
D. Để kiểm tra mối quan hệ giữa hai biến định tính.
11. Phân phối nào thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc địa điểm nhất định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối mũ
12. Điều gì xảy ra với mức độ tin cậy khi bạn tăng độ rộng của khoảng tin cậy?
A. Mức độ tin cậy tăng lên
B. Mức độ tin cậy giảm xuống
C. Mức độ tin cậy không đổi
D. Không thể xác định
13. Trong thống kê, `phương sai` đo lường điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Giá trị lớn nhất trong một tập dữ liệu.
14. Trong thống kê Bayes, điều gì đại diện cho niềm tin ban đầu về một tham số trước khi xem xét dữ liệu?
A. Hàm правдоподобие (Likelihood function)
B. Phân phối hậu nghiệm (Posterior distribution)
C. Ưu nghiệm (Prior)
D. Biên độ (Marginal likelihood)
15. Phương pháp nào sau đây được sử dụng để kiểm soát các biến gây nhiễu trong một nghiên cứu quan sát?
A. Ngẫu nhiên hóa (Randomization)
B. Đối sánh (Matching)
C. Làm mù (Blinding)
D. Phân tích ý định điều trị (Intention-to-treat analysis)
16. Khái niệm nào sau đây mô tả khả năng một kiểm định thống kê phát hiện ra một hiệu ứng thực sự khi hiệu ứng đó tồn tại?
A. Độ tin cậy
B. Độ hiệu lực
C. Công suất (Power)
D. Ý nghĩa
17. Trong phân tích hồi quy tuyến tính, R-squared (hệ số xác định) thể hiện điều gì?
A. Phương sai của biến độc lập được giải thích bởi biến phụ thuộc.
B. Phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Tổng phương sai của tất cả các biến trong mô hình.
D. Sai số chuẩn của mô hình.
18. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier ước tính điều gì?
A. Tỷ lệ rủi ro (Hazard ratio)
B. Hàm sống sót (Survival function)
C. Thời gian sống sót trung bình (Mean survival time)
D. Thời gian sống sót trung vị (Median survival time)
19. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ quan hệ phi tuyến tính giữa hai biến.
B. Mức độ quan hệ tuyến tính giữa hai biến.
C. Mức độ quan hệ nhân quả giữa hai biến.
D. Mức độ biến động của một biến.
20. Phương pháp nào sau đây được sử dụng để khám phá các cụm (cluster) trong một tập dữ liệu?
A. Phân tích hồi quy
B. Phân tích thành phần chính (PCA)
C. Phân tích cụm (Cluster analysis)
D. Phân tích phương sai (ANOVA)
21. Giả sử bạn có một tập dữ liệu bị lệch mạnh. Biện pháp nào sau đây là phù hợp nhất để đo lường xu hướng trung tâm?
A. Trung bình
B. Trung vị
C. Phương sai
D. Độ lệch chuẩn
22. Trong thống kê, `độ lệch chuẩn` đo lường điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Giá trị lớn nhất trong một tập dữ liệu.
23. Giả sử bạn có một tập dữ liệu với các giá trị ngoại lệ. Biện pháp nào sau đây là phù hợp nhất để đo lường sự phân tán?
A. Độ lệch chuẩn
B. Phương sai
C. Khoảng tứ phân vị (Interquartile range - IQR)
D. Phạm vi (Range)
24. Phương pháp nào được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại thông tin quan trọng?
A. Phân tích phương sai (ANOVA)
B. Phân tích hồi quy
C. Phân tích thành phần chính (PCA)
D. Kiểm định Chi-bình phương
25. Một nhà nghiên cứu muốn ước tính tỷ lệ cử tri ủng hộ một ứng cử viên cụ thể. Họ chọn ngẫu nhiên 1000 cử tri và hỏi ý kiến. Sai số ước tính tỷ lệ này được gọi là gì?
A. Sai số hệ thống
B. Sai số chọn mẫu
C. Sai số phi phản hồi
D. Sai số đo lường
26. Khi nào thì nên sử dụng kiểm định Chi-bình phương?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để kiểm tra mối quan hệ giữa hai biến định tính.
C. Để dự đoán giá trị của một biến dựa trên giá trị của một biến khác.
D. Để so sánh phương sai của hai nhóm độc lập.
27. Phương pháp nào sau đây phù hợp nhất để trực quan hóa phân phối của một biến định lượng duy nhất?
A. Biểu đồ phân tán (Scatter plot)
B. Biểu đồ hộp (Box plot)
C. Biểu đồ tần suất (Histogram)
D. Biểu đồ tròn (Pie chart)
28. Điều gì xảy ra với công suất (power) của một kiểm định thống kê khi mức ý nghĩa (alpha) tăng lên?
A. Công suất tăng lên
B. Công suất giảm xuống
C. Công suất không đổi
D. Không thể xác định
29. Giả sử bạn muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau trên điểm số của học sinh. Kiểm định thống kê nào sau đây là phù hợp nhất?
A. Kiểm định t (t-test)
B. Kiểm định Chi-bình phương
C. Phân tích phương sai (ANOVA)
D. Phân tích hồi quy
30. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn
B. Khoảng tin cậy không đổi
C. Khoảng tin cậy trở nên hẹp hơn
D. Không thể xác định