1. Ý nghĩa của khoảng tin cậy 95% là gì?
A. Có 95% khả năng tham số thực tế của tổng thể nằm trong khoảng đó.
B. Có 5% khả năng tham số thực tế của tổng thể nằm ngoài khoảng đó.
C. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa tham số thực tế của tổng thể.
D. Tất cả các đáp án trên.
2. Trong thống kê, thuật ngữ `ngoại suy` (extrapolation) đề cập đến điều gì?
A. Ước tính giá trị bên trong phạm vi dữ liệu đã biết.
B. Ước tính giá trị bên ngoài phạm vi dữ liệu đã biết.
C. Loại bỏ các giá trị ngoại lệ.
D. Tính trung bình của các giá trị.
3. Trong thống kê ứng dụng, loại biểu đồ nào thích hợp nhất để so sánh tỷ lệ đóng góp của các thành phần vào một tổng thể?
A. Biểu đồ đường
B. Biểu đồ cột
C. Biểu đồ tròn
D. Biểu đồ hộp
4. Để so sánh hai tỷ lệ, kiểm định thống kê nào sau đây là phù hợp nhất?
A. Kiểm định t (t-test)
B. Kiểm định ANOVA
C. Kiểm định z (z-test) cho hai tỷ lệ
D. Kiểm định Chi-bình phương
5. Một nhà nghiên cứu muốn xác định xem có mối liên hệ giữa hút thuốc và ung thư phổi. Họ nên sử dụng loại nghiên cứu nào?
A. Thử nghiệm ngẫu nhiên có đối chứng (RCT)
B. Nghiên cứu cắt ngang (Cross-sectional study)
C. Nghiên cứu bệnh chứng (Case-control study)
D. Nghiên cứu đoàn hệ (Cohort study)
6. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Ít nhất một trong các trung bình của các nhóm khác nhau.
C. Tất cả các trung bình của các nhóm đều bằng nhau.
D. Phương sai của các nhóm khác nhau.
7. Một tập dữ liệu có phương sai bằng 0 có nghĩa là gì?
A. Tất cả các giá trị trong tập dữ liệu đều bằng 0.
B. Tất cả các giá trị trong tập dữ liệu đều bằng nhau.
C. Giá trị trung bình của tập dữ liệu bằng 0.
D. Không thể xác định ý nghĩa.
8. Trong thống kê, `trung vị` là gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong một tập dữ liệu.
C. Giá trị nằm ở giữa của một tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị trong một tập dữ liệu.
9. Phương pháp nào sau đây được sử dụng để ước lượng giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập?
A. Phân tích phương sai (ANOVA)
B. Hồi quy tuyến tính
C. Kiểm định Chi-bình phương
D. Phân tích thành phần chính (PCA)
10. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn ước lượng tham số của tổng thể.
11. Trong phân tích hồi quy, biến giả (dummy variable) được sử dụng để biểu diễn điều gì?
A. Một biến liên tục.
B. Một biến phân loại (categorical variable).
C. Một biến thời gian.
D. Một biến ngẫu nhiên.
12. Trong phân tích độ tin cậy (reliability analysis), hệ số Cronbach`s alpha được sử dụng để đánh giá điều gì?
A. Tính giá trị của thang đo.
B. Tính ổn định của thang đo theo thời gian.
C. Tính nhất quán nội tại của thang đo.
D. Tính tương đương giữa các phiên bản khác nhau của thang đo.
13. Khi nào thì nên sử dụng biểu đồ tần số (histogram)?
A. Để so sánh các giá trị riêng lẻ.
B. Để hiển thị xu hướng theo thời gian.
C. Để hiển thị phân phối của một biến liên tục.
D. Để so sánh tỷ lệ phần trăm của các thành phần.
14. Phương pháp nào sau đây thường được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích phương sai (ANOVA)
B. Hồi quy logistic
C. Phân tích thành phần chính (PCA)
D. Kiểm định t
15. Trong phân tích hồi quy logistic, biến phụ thuộc có đặc điểm gì?
A. Là biến định lượng liên tục.
B. Là biến định tính có hai giá trị (nhị phân).
C. Là biến định tính có nhiều hơn hai giá trị.
D. Là biến thời gian.
16. Ma trận tương quan được sử dụng để thể hiện điều gì?
A. Mức độ tương quan giữa các biến trong một tập dữ liệu.
B. Phương sai của các biến trong một tập dữ liệu.
C. Giá trị trung bình của các biến trong một tập dữ liệu.
D. Phân phối tần số của các biến trong một tập dữ liệu.
17. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết null là đúng.
D. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết null là sai.
18. Độ lệch chuẩn đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị trung bình của tập dữ liệu.
19. Sai số chuẩn (standard error) ước tính điều gì?
A. Độ lệch chuẩn của mẫu.
B. Độ lệch chuẩn của tổng thể.
C. Độ lệch chuẩn của phân phối lấy mẫu của một thống kê.
D. Phương sai của mẫu.
20. Phân tích ANOVA được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường mối quan hệ giữa hai biến định lượng.
21. Khi nào thì nên sử dụng kiểm định Chi-bình phương?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để so sánh phương sai của hai nhóm độc lập.
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để ước lượng tham số của tổng thể.
22. Trong phân tích chuỗi thời gian, thành phần nào thể hiện sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend)
B. Tính mùa vụ (Seasonality)
C. Chu kỳ (Cycle)
D. Tính ngẫu nhiên (Irregularity)
23. Trong thống kê ứng dụng, `phân phối chuẩn` còn được gọi là gì?
A. Phân phối Poisson.
B. Phân phối Bernoulli.
C. Phân phối Gaussian.
D. Phân phối nhị thức.
24. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến điều gì?
A. Mối quan hệ tuyến tính giữa biến phụ thuộc và biến độc lập.
B. Mối quan hệ phi tuyến tính giữa biến phụ thuộc và biến độc lập.
C. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập.
D. Sự vắng mặt của mối quan hệ giữa các biến.
25. Trong phân tích chuỗi thời gian, phương pháp nào thường được sử dụng để làm mịn dữ liệu và loại bỏ nhiễu?
A. Hồi quy tuyến tính
B. Trung bình động (Moving average)
C. Phân tích phương sai (ANOVA)
D. Kiểm định t
26. Đâu là nhược điểm lớn nhất của việc sử dụng giá trị trung bình (mean) làm thước đo trung tâm?
A. Khó tính toán.
B. Không phù hợp với dữ liệu định tính.
C. Dễ bị ảnh hưởng bởi các giá trị ngoại lệ (outliers).
D. Luôn bằng 0.
27. Trong phân tích hồi quy, hệ số R bình phương (R-squared) đo lường điều gì?
A. Mức độ quan hệ tuyến tính giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Sai số chuẩn của ước lượng.
D. Mức ý nghĩa thống kê của mô hình.
28. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để ước tính điều gì?
A. Xác suất sống sót tại một thời điểm cụ thể.
B. Thời gian sống sót trung bình.
C. Tỷ lệ tử vong.
D. Nguy cơ xảy ra sự kiện.
29. Khi so sánh hai mẫu phụ thuộc (paired samples), kiểm định nào sau đây phù hợp nhất?
A. Kiểm định t độc lập (independent t-test)
B. Kiểm định t ghép cặp (paired t-test)
C. Kiểm định Chi-bình phương
D. Kiểm định ANOVA
30. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó thực sự đúng.
B. Bác bỏ giả thuyết null khi nó thực sự đúng.
C. Chấp nhận giả thuyết null khi nó thực sự sai.
D. Bác bỏ giả thuyết null khi nó thực sự sai.