1. Trong thống kê, khái niệm `phân phối chuẩn` (normal distribution) còn được gọi là gì?
A. Phân phối Poisson.
B. Phân phối Bernoulli.
C. Phân phối Gaussian.
D. Phân phối nhị thức.
2. Trong thống kê suy luận, khoảng tin cậy (confidence interval) là gì?
A. Một giá trị duy nhất ước tính cho tham số của tổng thể.
B. Một khoảng giá trị mà trong đó chúng ta tin rằng tham số của tổng thể nằm trong đó, với một mức độ tin cậy nhất định.
C. Sai số chuẩn của ước lượng.
D. Mức ý nghĩa thống kê của kiểm định.
3. Phương pháp nào sau đây được sử dụng để kiểm tra sự khác biệt về trung bình giữa hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn?
A. Kiểm định t-Student.
B. Kiểm định ANOVA.
C. Kiểm định Mann-Whitney U.
D. Kiểm định Chi-square.
4. Trong phân tích chuỗi thời gian, hàm tự tương quan (Autocorrelation Function - ACF) được sử dụng để làm gì?
A. Đo lường mối quan hệ giữa hai chuỗi thời gian khác nhau.
B. Đo lường mối quan hệ giữa một chuỗi thời gian và chính nó ở các thời điểm khác nhau.
C. Dự báo giá trị tương lai của chuỗi thời gian.
D. Phân tích xu hướng của chuỗi thời gian.
5. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi muốn so sánh trung bình của hai nhóm.
6. Trong phân tích hồi quy logistic, biến phụ thuộc có đặc điểm gì?
A. Là biến liên tục.
B. Là biến định tính (categorical) với hai hoặc nhiều hơn hai mức.
C. Luôn tuân theo phân phối chuẩn.
D. Có thể có giá trị âm.
7. Ý nghĩa của hệ số tương quan (correlation coefficient) là gì?
A. Độ mạnh của mối quan hệ nhân quả giữa hai biến.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến.
C. Sự thay đổi trong một biến khi biến kia thay đổi một đơn vị.
D. Mức độ biến động của một biến.
8. Trong phân tích độ tin cậy của dữ liệu khảo sát, hệ số Cronbach`s alpha được sử dụng để đo lường điều gì?
A. Mức độ tương quan giữa các biến.
B. Tính nhất quán nội tại của các mục hỏi trong một thang đo.
C. Độ ổn định của kết quả theo thời gian.
D. Sự phù hợp của mô hình với dữ liệu.
9. Khi nào nên sử dụng kiểm định t (t-test) một phía (one-tailed)?
A. Khi không có giả thuyết cụ thể về hướng của sự khác biệt.
B. Khi muốn kiểm tra xem trung bình của một mẫu có khác biệt so với một giá trị nhất định.
C. Khi có giả thuyết cụ thể về hướng của sự khác biệt (lớn hơn hoặc nhỏ hơn).
D. Khi so sánh phương sai của hai mẫu.
10. Trong thống kê mô tả, độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
11. Khi nào thì thích hợp sử dụng phương pháp lấy mẫu phân tầng (stratified sampling)?
A. Khi tổng thể đồng nhất.
B. Khi tổng thể có các nhóm (strata) khác nhau và muốn đảm bảo mỗi nhóm đều được đại diện trong mẫu.
C. Khi không có danh sách đầy đủ của tổng thể.
D. Khi muốn lấy mẫu một cách nhanh chóng và dễ dàng.
12. Trong thống kê kinh doanh, thuật ngữ `ngoại lệ` (outlier) dùng để chỉ điều gì?
A. Một giá trị dữ liệu nằm gần trung bình của tập dữ liệu.
B. Một giá trị dữ liệu xuất hiện thường xuyên nhất trong tập dữ liệu.
C. Một giá trị dữ liệu khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Một giá trị dữ liệu bị thiếu trong tập dữ liệu.
13. Phương pháp lấy mẫu nào đảm bảo mọi phần tử của tổng thể đều có cơ hội được chọn bằng nhau?
A. Lấy mẫu thuận tiện (Convenience sampling).
B. Lấy mẫu phân tầng (Stratified sampling).
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
D. Lấy mẫu theo cụm (Cluster sampling).
14. Khi nào nên sử dụng phân tích phương sai (ANOVA)?
A. Để so sánh trung bình của hai nhóm.
B. Để so sánh trung bình của ba nhóm trở lên.
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để dự báo chuỗi thời gian.
15. Trong phân tích rủi ro, giá trị VaR (Value at Risk) được sử dụng để đo lường điều gì?
A. Lợi nhuận kỳ vọng của một khoản đầu tư.
B. Mức lỗ tối đa có thể xảy ra của một khoản đầu tư trong một khoảng thời gian nhất định, với một mức độ tin cậy nhất định.
C. Độ lệch chuẩn của lợi nhuận.
D. Xác suất xảy ra rủi ro.
16. Trong phân tích chuỗi thời gian, `tính dừng` (stationarity) của chuỗi có ý nghĩa gì?
A. Chuỗi có xu hướng tăng hoặc giảm theo thời gian.
B. Chuỗi có phương sai thay đổi theo thời gian.
C. Các đặc tính thống kê của chuỗi (ví dụ: trung bình, phương sai) không thay đổi theo thời gian.
D. Chuỗi không có mối tương quan với chính nó trong quá khứ.
17. Khi nào nên sử dụng kiểm định Chi-square?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để kiểm tra mối quan hệ giữa hai biến định tính.
C. Để dự báo chuỗi thời gian.
D. Để đo lường độ tin cậy của thang đo.
18. Ý nghĩa của p-value trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết không (null hypothesis) là đúng.
B. Xác suất mắc sai lầm loại I (Type I error).
C. Xác suất thu được kết quả kiểm định ít nhất cực đoan bằng kết quả quan sát được, giả sử giả thuyết không là đúng.
D. Xác suất mắc sai lầm loại II (Type II error).
19. Phương pháp nào sau đây thường được sử dụng để dự báo chuỗi thời gian?
A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Mô hình ARIMA (Autoregressive Integrated Moving Average).
D. Phân tích thành phần chính (PCA).
20. Độ tin cậy (reliability) của một thước đo đề cập đến điều gì?
A. Mức độ mà thước đo đo lường chính xác khái niệm mà nó được thiết kế để đo lường.
B. Mức độ mà thước đo cho kết quả nhất quán khi được sử dụng nhiều lần.
C. Mức độ mà thước đo có thể dự đoán các kết quả trong tương lai.
D. Mức độ mà thước đo dễ sử dụng.
21. Trong phân tích dữ liệu, `median` (trung vị) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm giữa của tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
22. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sai số giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
C. Giá trị trung bình của biến phụ thuộc.
D. Độ lệch chuẩn của biến phụ thuộc.
23. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh và hướng của mối quan hệ giữa các biến độc lập và biến phụ thuộc.
B. Tỷ lệ phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Mức độ ý nghĩa thống kê của từng biến độc lập trong mô hình.
D. Sai số chuẩn của ước lượng hồi quy.
24. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính hoàn hảo giữa biến phụ thuộc và các biến độc lập.
B. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập với nhau.
C. Sự biến động của phương sai sai số.
D. Sự thiếu dữ liệu.
25. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là gì?
26. Mục đích chính của việc sử dụng chỉ số giá tiêu dùng (CPI) trong kinh tế là gì?
A. Đo lường sự thay đổi trong chi tiêu của người tiêu dùng.
B. Đo lường sự thay đổi trong giá cả hàng hóa và dịch vụ mà người tiêu dùng mua.
C. Đo lường sự thay đổi trong sản lượng kinh tế.
D. Đo lường tỷ lệ thất nghiệp.
27. Phương pháp nào sau đây giúp giảm số lượng biến trong một tập dữ liệu lớn mà vẫn giữ lại được phần lớn thông tin?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Kiểm định Chi-square.
28. Trong phân tích bảng chéo (cross-tabulation), chúng ta thường sử dụng kiểm định nào để kiểm tra tính độc lập giữa hai biến?
A. Kiểm định t (t-test).
B. Kiểm định ANOVA.
C. Kiểm định Chi-square.
D. Kiểm định tương quan Pearson.
29. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết không (null hypothesis) khi nó thực sự đúng.
B. Bác bỏ giả thuyết không (null hypothesis) khi nó thực sự đúng.
C. Chấp nhận giả thuyết không (null hypothesis) khi nó thực sự sai.
D. Bác bỏ giả thuyết không (null hypothesis) khi nó thực sự sai.
30. Phương pháp nào sau đây được sử dụng để phân tích mối quan hệ giữa một biến phụ thuộc và nhiều biến độc lập, đồng thời kiểm soát ảnh hưởng của các biến gây nhiễu?
A. Phân tích tương quan.
B. Phân tích hồi quy đa biến.
C. Kiểm định t (t-test).
D. Phân tích phương sai (ANOVA).