1. Khi nào thì việc sử dụng trung vị thích hợp hơn trung bình để đo lường xu hướng trung tâm?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi dữ liệu có giá trị ngoại lệ (outliers)
C. Khi dữ liệu có tính đối xứng
D. Khi dữ liệu có nhiều đỉnh
2. Ý nghĩa của khoảng tin cậy 95% là gì?
A. Có 95% khả năng tham số thực tế nằm ngoài khoảng này
B. Có 95% khả năng tham số thực tế nằm trong khoảng này
C. Khoảng này chứa 95% dữ liệu
D. Sai số chuẩn của ước lượng là 5%
3. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích thành phần chính (Principal Component Analysis - PCA)
D. Kiểm định t
4. Phương pháp nào sau đây được sử dụng để dự báo giá trị của một biến dựa trên các giá trị quá khứ của chính biến đó?
A. Hồi quy tuyến tính đa biến
B. Trung bình trượt (Moving Average)
C. Phân tích phương sai
D. Kiểm định Chi bình phương
5. Trong phân tích thời gian, thành phần nào sau đây mô tả xu hướng dài hạn của chuỗi dữ liệu?
A. Tính mùa vụ (Seasonality)
B. Chu kỳ (Cycle)
C. Xu hướng (Trend)
D. Tính ngẫu nhiên (Randomness)
6. Khi thực hiện kiểm định giả thuyết, việc chọn mức ý nghĩa (alpha) ảnh hưởng đến điều gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất mắc sai lầm loại I.
C. Kích thước mẫu cần thiết.
D. Độ mạnh của kiểm định.
7. Phân phối chuẩn có đặc điểm gì?
A. Bất đối xứng và có hai đỉnh
B. Đối xứng và có một đỉnh
C. Bất đối xứng và không có đỉnh
D. Đối xứng và không có đỉnh
8. Trong phân tích tương quan, hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến thiên của dữ liệu.
B. Mức độ quan hệ tuyến tính giữa hai biến.
C. Mức độ phù hợp của mô hình hồi quy.
D. Mức độ khác biệt giữa các nhóm.
9. Phương pháp nào sau đây được sử dụng để ước lượng mối quan hệ giữa hai hay nhiều biến số?
A. Phân tích phương sai (ANOVA)
B. Hồi quy tuyến tính
C. Kiểm định t
D. Kiểm định Chi bình phương
10. Trong thống kê, `phương sai` được định nghĩa là gì?
A. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
B. Trung bình cộng của các giá trị trong tập dữ liệu.
C. Độ lệch trung bình của các giá trị so với trung bình cộng.
D. Bình phương độ lệch của mỗi giá trị so với trung bình cộng.
11. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết không khi nó sai
B. Bác bỏ giả thuyết không khi nó đúng
C. Chấp nhận giả thuyết không khi nó đúng
D. Bác bỏ giả thuyết không khi nó sai
12. Trong thống kê, hệ số Gini được sử dụng để đo lường điều gì?
A. Mức độ tăng trưởng kinh tế.
B. Mức độ bất bình đẳng thu nhập.
C. Mức độ lạm phát.
D. Mức độ thất nghiệp.
13. Trong thống kê mô tả, loại biểu đồ nào thường được sử dụng để thể hiện tần suất của các biến định tính?
A. Biểu đồ phân tán
B. Biểu đồ hộp
C. Biểu đồ cột
D. Biểu đồ đường
14. Trong thiết kế thử nghiệm, mục đích của việc sử dụng nhóm đối chứng (control group) là gì?
A. Để tăng kích thước mẫu.
B. Để giảm chi phí thử nghiệm.
C. Để loại bỏ các yếu tố gây nhiễu và so sánh với nhóm được can thiệp.
D. Để đảm bảo tính ngẫu nhiên của mẫu.
15. Khi nào nên sử dụng kiểm định Chi bình phương?
A. So sánh trung bình của hai nhóm độc lập
B. So sánh phương sai của hai nhóm độc lập
C. Kiểm tra sự phù hợp giữa phân phối thực nghiệm và phân phối lý thuyết
D. Ước lượng mối quan hệ giữa hai biến định lượng
16. Trong thống kê suy luận, khái niệm `bậc tự do` (degrees of freedom) liên quan đến điều gì?
A. Số lượng quan sát trong mẫu.
B. Số lượng biến trong một mô hình.
C. Số lượng giá trị trong tính toán cuối cùng có thể thay đổi.
D. Mức ý nghĩa thống kê được chọn.
17. Trong phân tích hồi quy, hệ số R bình phương (R-squared) biểu thị điều gì?
A. Độ mạnh của mối quan hệ giữa các biến
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập
C. Sai số chuẩn của ước lượng
D. Mức ý nghĩa thống kê của mô hình
18. Đâu là điều kiện tiên quyết để có thể áp dụng định lý giới hạn trung tâm (Central Limit Theorem)?
A. Quần thể phải tuân theo phân phối chuẩn.
B. Kích thước mẫu phải đủ lớn (thường n > 30).
C. Phương sai của quần thể phải đã biết.
D. Mẫu phải được chọn theo phương pháp lấy mẫu phân tầng.
19. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi.
20. Mục đích của việc lấy mẫu ngẫu nhiên là gì?
A. Để đảm bảo rằng mẫu đại diện cho quần thể
B. Để giảm kích thước mẫu
C. Để tăng độ chính xác của ước lượng
D. Để đơn giản hóa quá trình thu thập dữ liệu
21. Khi nào thì việc sử dụng kiểm định phi tham số (non-parametric test) thích hợp hơn kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có thang đo thứ bậc.
D. Khi cần so sánh trung bình của hai nhóm.
22. Trong kiểm định giả thuyết, giá trị p (p-value) biểu thị điều gì?
A. Xác suất giả thuyết không là đúng
B. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết không là đúng
C. Xác suất giả thuyết thay thế là đúng
D. Mức ý nghĩa thống kê của kiểm định
23. Phương pháp nào sau đây thường được sử dụng để xác định xem một tập dữ liệu có tuân theo phân phối chuẩn hay không?
A. Kiểm định t.
B. Biểu đồ tần suất (histogram).
C. Kiểm định Shapiro-Wilk.
D. Phân tích hồi quy.
24. Khi nào thì kiểm định t (t-test) phù hợp hơn kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn của quần thể đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
C. Khi so sánh trung bình của hai quần thể có phương sai bằng nhau.
D. Khi muốn ước lượng khoảng tin cậy cho trung bình quần thể.
25. Trong phân tích rủi ro, giá trị kỳ vọng (expected value) được tính như thế nào?
A. Giá trị lớn nhất có thể xảy ra.
B. Giá trị có khả năng xảy ra cao nhất.
C. Tổng của các giá trị có thể xảy ra nhân với xác suất tương ứng.
D. Trung bình cộng của tất cả các giá trị có thể xảy ra.
26. Giá trị nào sau đây là một thước đo của xu hướng trung tâm?
A. Phương sai
B. Độ lệch chuẩn
C. Trung bình
D. Khoảng biến thiên
27. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Độ lệch chuẩn
C. Mốt
D. Tứ phân vị
28. Trong lý thuyết xác suất, quy tắc cộng xác suất được áp dụng khi nào?
A. Khi các sự kiện độc lập.
B. Khi các sự kiện xung khắc.
C. Khi các sự kiện có điều kiện.
D. Khi các sự kiện có quan hệ nhân quả.
29. Trong thống kê Bayes, yếu tố nào sau đây được cập nhật dựa trên dữ liệu mới?
A. Xác suất tiên nghiệm (prior probability).
B. Hàm правдоподобие (likelihood function).
C. Xác suất biên (marginal probability).
D. Xác suất hậu nghiệm (posterior probability).
30. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được kiểm tra?
A. Sự khác biệt về trung bình giữa các nhóm
B. Mối quan hệ giữa các biến định lượng
C. Sự phù hợp của mô hình hồi quy
D. Sự phân tán của dữ liệu