1. Trong lý thuyết quyết định, giá trị kỳ vọng (expected value) được tính như thế nào?
A. Tổng các kết quả có thể xảy ra.
B. Trung bình cộng của các kết quả có thể xảy ra.
C. Tổng của các kết quả có thể xảy ra nhân với xác suất tương ứng của chúng.
D. Kết quả có khả năng xảy ra cao nhất.
2. Ý nghĩa của việc sử dụng trọng số (weights) trong tính toán số liệu thống kê là gì?
A. Để đơn giản hóa quá trình tính toán.
B. Để phản ánh tầm quan trọng khác nhau của các quan sát trong tập dữ liệu.
C. Để loại bỏ các giá trị ngoại lệ.
D. Để chuẩn hóa dữ liệu.
3. Trong thống kê kinh doanh, thuật ngữ `ngoại suy` (extrapolation) thường được dùng để chỉ điều gì?
A. Ước tính giá trị của một biến trong phạm vi dữ liệu đã biết.
B. Ước tính giá trị của một biến bên ngoài phạm vi dữ liệu đã biết.
C. Loại bỏ các giá trị ngoại lệ khỏi dữ liệu.
D. Điều chỉnh dữ liệu để loại bỏ ảnh hưởng của yếu tố mùa vụ.
4. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất thu được kết quả quan sát được (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
C. Mức ý nghĩa của kiểm định.
D. Xác suất mắc sai số loại II.
5. Ý nghĩa của hệ số tương quan Pearson bằng 0 là gì?
A. Có một mối quan hệ tuyến tính mạnh mẽ giữa hai biến.
B. Có một mối quan hệ phi tuyến tính giữa hai biến.
C. Không có mối quan hệ tuyến tính giữa hai biến.
D. Hai biến này hoàn toàn giống nhau.
6. Mục đích chính của việc sử dụng chỉ số giá (price index) trong kinh tế là gì?
A. Đo lường sự thay đổi về số lượng hàng hóa và dịch vụ được sản xuất.
B. Đo lường sự thay đổi về mức giá chung của hàng hóa và dịch vụ theo thời gian.
C. Đo lường sự thay đổi về thu nhập của người tiêu dùng.
D. Đo lường sự thay đổi về tỷ lệ thất nghiệp.
7. Trong phân tích chuỗi thời gian, hàm tự tương quan (autocorrelation function - ACF) được sử dụng để làm gì?
A. Để xác định xu hướng của chuỗi thời gian.
B. Để xác định tính thời vụ của chuỗi thời gian.
C. Để đo lường mối tương quan giữa các giá trị của chuỗi thời gian tại các thời điểm khác nhau.
D. Để loại bỏ nhiễu khỏi chuỗi thời gian.
8. Phương pháp nào sau đây thường được sử dụng để phân tích mối quan hệ giữa hai biến định tính?
A. Phân tích hồi quy tuyến tính.
B. Kiểm định Chi-bình phương (Chi-square test).
C. Phân tích phương sai (ANOVA).
D. Kiểm định t.
9. Điều gì xảy ra với khoảng tin cậy (confidence interval) khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy biến mất.
10. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi cần tính toán nhanh chóng.
11. Phương pháp nào sau đây được sử dụng để dự báo chuỗi thời gian dựa trên các giá trị quá khứ của chính nó?
A. Phân tích hồi quy.
B. Trung bình trượt (moving average).
C. Phân tích phương sai (ANOVA).
D. Phân tích tương quan.
12. Trong thống kê, phương sai (variance) đo lường điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình, được tính bằng bình phương độ lệch chuẩn.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
13. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là α (alpha) đại diện cho điều gì?
A. Xác suất mắc sai số loại II.
B. Xác suất bác bỏ giả thuyết null khi nó đúng (xác suất mắc sai số loại I).
C. Xác suất chấp nhận giả thuyết null khi nó đúng.
D. Xác suất chấp nhận giả thuyết null khi nó sai.
14. Trong thống kê, trung vị (median) là gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong một tập dữ liệu.
C. Giá trị nằm giữa của một tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị trong một tập dữ liệu chia cho số lượng giá trị.
15. Khi phân tích dữ liệu bảng (panel data), phương pháp ước lượng nào sau đây kiểm soát được các yếu tố không quan sát được nhưng không thay đổi theo thời gian?
A. Mô hình gộp (pooled model).
B. Mô hình tác động ngẫu nhiên (random effects model).
C. Mô hình tác động cố định (fixed effects model).
D. Mô hình sai phân bậc nhất (first difference model).
16. Phương pháp nào sau đây được sử dụng để kiểm tra sự khác biệt giữa trung bình của hai mẫu độc lập khi phương sai của chúng không được giả định là bằng nhau?
A. Kiểm định t Student.
B. Kiểm định z.
C. Kiểm định t Welch.
D. Kiểm định ANOVA.
17. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu phụ thuộc (paired samples) khi dữ liệu không tuân theo phân phối chuẩn.
C. Để phân tích mối quan hệ giữa hai biến định tính.
D. Để so sánh phương sai của hai mẫu.
18. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Sự tương quan cao giữa các biến độc lập.
B. Sự tương quan cao giữa biến độc lập và biến phụ thuộc.
C. Phương sai của sai số thay đổi.
D. Sai số không tuân theo phân phối chuẩn.
19. Trong phân tích rủi ro, phương pháp Monte Carlo được sử dụng để làm gì?
A. Ước tính giá trị trung bình của một biến.
B. Mô phỏng nhiều kịch bản khác nhau để đánh giá phân phối xác suất của kết quả.
C. Xác định các yếu tố rủi ro quan trọng nhất.
D. Giảm thiểu rủi ro.
20. Trong phân tích ANOVA, đại lượng nào được sử dụng để so sánh sự biến động giữa các nhóm với sự biến động trong nội bộ các nhóm?
A. Tổng bình phương (sum of squares).
B. Bậc tự do (degrees of freedom).
C. Thống kê F (F-statistic).
D. Giá trị p (p-value).
21. Trong phân tích dữ liệu lớn (big data), kỹ thuật nào sau đây thường được sử dụng để giảm số lượng chiều dữ liệu (dimensionality reduction)?
A. Phân tích hồi quy tuyến tính.
B. Phân tích thành phần chính (principal component analysis - PCA).
C. Phân tích phương sai (ANOVA).
D. Kiểm định t.
22. Phương pháp nào sau đây được sử dụng để kiểm tra tính dừng (stationarity) của một chuỗi thời gian?
A. Kiểm định Chi-bình phương.
B. Kiểm định t.
C. Kiểm định Dickey-Fuller.
D. Phân tích phương sai (ANOVA).
23. Phương pháp lấy mẫu nào đảm bảo mỗi phần tử của tổng thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu phân tầng.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu theo cụm.
24. Trong phân tích độ nhạy (sensitivity analysis), mục tiêu chính là gì?
A. Xác định các biến đầu vào quan trọng nhất ảnh hưởng đến kết quả của mô hình.
B. Tối ưu hóa các biến đầu vào để đạt được kết quả tốt nhất.
C. Đánh giá tính chính xác của mô hình.
D. Giảm thiểu sai số trong mô hình.
25. Phân phối Poisson thường được sử dụng để mô hình hóa điều gì?
A. Xác suất thành công trong một chuỗi các thử nghiệm độc lập.
B. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Phân phối của dữ liệu liên tục.
D. Phân phối của sai số trong mô hình hồi quy.
26. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu, thể hiện tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Mức độ tương quan giữa các biến độc lập.
D. Mức độ biến động của biến phụ thuộc.
27. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó sai.
D. Bác bỏ giả thuyết null khi nó sai.
28. Trong phân tích hồi quy logistic, biến phụ thuộc (dependent variable) có đặc điểm gì?
A. Là một biến liên tục.
B. Là một biến định tính với hai giá trị (ví dụ: 0 hoặc 1).
C. Là một biến định tính với nhiều hơn hai giá trị.
D. Là một biến thứ bậc.
29. Trong phân tích chuỗi thời gian, thành phần nào sau đây thể hiện sự biến động không đều đặn và khó dự đoán?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính ngẫu nhiên (Irregularity).
30. Trong thống kê mô tả, độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.