1. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Mức độ tương quan giữa các biến độc lập.
D. Sai số chuẩn của các hệ số hồi quy.
2. Khi nào thì kiểm định Mann-Whitney U được ưu tiên hơn kiểm định t-Student?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi phương sai của hai nhóm bằng nhau.
C. Khi dữ liệu không tuân theo phân phối chuẩn.
D. Khi kích thước mẫu lớn.
3. Ước lượng điểm (point estimate) khác với ước lượng khoảng (interval estimate) như thế nào?
A. Ước lượng điểm cung cấp một khoảng giá trị, trong khi ước lượng khoảng cung cấp một giá trị duy nhất.
B. Ước lượng điểm cung cấp một giá trị duy nhất, trong khi ước lượng khoảng cung cấp một khoảng giá trị.
C. Ước lượng điểm chính xác hơn ước lượng khoảng.
D. Ước lượng khoảng dễ tính toán hơn ước lượng điểm.
4. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong một tập dữ liệu.
D. Giá trị nhỏ nhất trong một tập dữ liệu.
5. Trong thống kê kinh doanh, thuật ngữ `ngoại lệ` (outlier) thường được hiểu là gì?
A. Một giá trị trung bình cộng của một tập dữ liệu.
B. Một giá trị nằm gần trung vị của một tập dữ liệu.
C. Một giá trị cực kỳ khác biệt so với phần lớn các giá trị khác trong tập dữ liệu.
D. Một giá trị xuất hiện thường xuyên nhất trong một tập dữ liệu.
6. Trong phân tích chuỗi thời gian, hàm tự tương quan (Autocorrelation Function - ACF) được sử dụng để làm gì?
A. Để đo lường mối quan hệ giữa hai chuỗi thời gian khác nhau.
B. Để đo lường mối quan hệ giữa một chuỗi thời gian và chính nó ở các khoảng thời gian khác nhau.
C. Để kiểm tra tính dừng của chuỗi thời gian.
D. Để dự báo giá trị tương lai của chuỗi thời gian.
7. Phương pháp nào sau đây được sử dụng để kiểm tra sự khác biệt giữa trung bình của hai mẫu độc lập khi phương sai của chúng không được cho là bằng nhau?
A. Kiểm định t Student.
B. Kiểm định z.
C. Kiểm định t Welch.
D. Kiểm định ANOVA.
8. Khi nào nên sử dụng phương pháp lấy mẫu cụm (cluster sampling)?
A. Khi cần đảm bảo tính đại diện của tất cả các nhóm trong quần thể.
B. Khi không có danh sách đầy đủ của tất cả các thành viên trong quần thể.
C. Khi muốn giảm thiểu sai số chọn mẫu.
D. Khi muốn tăng chi phí thu thập dữ liệu.
9. Ý nghĩa của việc sử dụng phương pháp lấy mẫu ngẫu nhiên phân tầng (stratified random sampling) trong nghiên cứu thị trường là gì?
A. Đảm bảo mỗi thành viên của quần thể đều có cơ hội được chọn vào mẫu.
B. Giảm chi phí thu thập dữ liệu.
C. Đảm bảo mẫu đại diện cho các nhóm khác nhau trong quần thể theo tỷ lệ của chúng.
D. Loại bỏ hoàn toàn sai số trong quá trình lấy mẫu.
10. Trong phân tích rủi ro, giá trị kỳ vọng (expected value) được tính như thế nào?
A. Bằng cách cộng tất cả các kết quả có thể xảy ra.
B. Bằng cách lấy giá trị trung bình của tất cả các kết quả có thể xảy ra.
C. Bằng cách nhân mỗi kết quả có thể xảy ra với xác suất của nó, sau đó cộng các kết quả lại.
D. Bằng cách chia tổng các kết quả cho số lượng kết quả.
11. Trong phân tích phương sai (ANOVA), kiểm định F được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường mối quan hệ tuyến tính giữa hai biến.
12. Trong phân tích bảng chéo (cross-tabulation), mục đích chính là gì?
A. Tính trung bình của các biến.
B. So sánh phương sai của các biến.
C. Phân tích mối quan hệ giữa hai hay nhiều biến định tính.
D. Dự đoán giá trị của một biến dựa trên biến khác.
13. Trong phân tích quyết định, cây quyết định (decision tree) được sử dụng để làm gì?
A. Để tính giá trị trung bình của các biến.
B. Để mô hình hóa các quyết định và kết quả có thể xảy ra của chúng.
C. Để đo lường mối quan hệ tuyến tính giữa các biến.
D. Để kiểm tra tính dừng của chuỗi thời gian.
14. Trong kiểm định giả thuyết, giá trị p (p-value) đại diện cho điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả, hoặc kết quả cực đoan hơn, nếu giả thuyết null là đúng.
C. Xác suất giả thuyết thay thế là đúng.
D. Xác suất mắc sai lầm loại II.
15. Mục đích chính của việc sử dụng chỉ số giá tiêu dùng (CPI) là gì?
A. Đo lường sự thay đổi trong chi tiêu của người tiêu dùng.
B. Đo lường sự thay đổi trong mức giá của một giỏ hàng hóa và dịch vụ tiêu dùng.
C. Đo lường sự thay đổi trong sản lượng kinh tế.
D. Đo lường sự thay đổi trong tỷ lệ thất nghiệp.
16. Phương pháp nào sau đây được sử dụng để dự báo xu hướng trong chuỗi thời gian?
A. Phân tích hồi quy.
B. Trung bình động (Moving Average).
C. San bằng mũ (Exponential Smoothing).
D. Tất cả các đáp án trên.
17. Trong phân tích thống kê, hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến động của một biến.
B. Mối quan hệ nhân quả giữa hai biến.
C. Mức độ liên kết tuyến tính giữa hai biến.
D. Sự khác biệt giữa trung bình của hai nhóm.
18. Trong phân tích độ nhạy (sensitivity analysis), mục tiêu chính là gì?
A. Xác định giá trị trung bình của các biến.
B. Xác định mức độ ảnh hưởng của sự thay đổi trong các giả định đầu vào đến kết quả cuối cùng.
C. Xác định mối quan hệ tuyến tính giữa các biến.
D. Xác định phương sai của các biến.
19. Trong kiểm định giả thuyết, sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự đúng.
C. Bác bỏ giả thuyết null khi nó thực sự sai.
D. Chấp nhận giả thuyết null khi nó thực sự sai.
20. Khi nào nên sử dụng kiểm định Chi-square?
A. Để so sánh trung bình của hai nhóm.
B. Để phân tích phương sai.
C. Để kiểm tra sự độc lập giữa hai biến định tính.
D. Để đo lường mối quan hệ tuyến tính giữa hai biến định lượng.
21. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu (dimensionality reduction) trong phân tích dữ liệu lớn?
A. Hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Kiểm định Chi-square.
22. Trong phân tích chuỗi thời gian, thành phần nào sau đây mô tả sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Tính chu kỳ (Cyclical).
D. Tính ngẫu nhiên (Irregularity).
23. Trong thống kê mô tả, phương sai (variance) được sử dụng để làm gì?
A. Đo lường giá trị trung bình của dữ liệu.
B. Đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Xác định giá trị lớn nhất và nhỏ nhất của dữ liệu.
D. Đếm số lượng quan sát trong dữ liệu.
24. Phân tích hồi quy đa biến (multiple regression) khác với hồi quy đơn biến (simple regression) như thế nào?
A. Hồi quy đa biến chỉ sử dụng một biến độc lập, trong khi hồi quy đơn biến sử dụng nhiều biến độc lập.
B. Hồi quy đa biến sử dụng nhiều biến độc lập, trong khi hồi quy đơn biến chỉ sử dụng một biến độc lập.
C. Hồi quy đa biến chỉ sử dụng một biến phụ thuộc, trong khi hồi quy đơn biến sử dụng nhiều biến phụ thuộc.
D. Hồi quy đa biến không thể sử dụng biến định tính.
25. Ý nghĩa của mức ý nghĩa (significance level) trong kiểm định giả thuyết là gì?
A. Xác suất chấp nhận giả thuyết null khi nó thực sự đúng.
B. Xác suất bác bỏ giả thuyết null khi nó thực sự sai.
C. Xác suất bác bỏ giả thuyết null khi nó thực sự đúng (sai lầm loại I).
D. Xác suất chấp nhận giả thuyết null khi nó thực sự sai (sai lầm loại II).
26. Khi nào nên sử dụng hồi quy Logistic thay vì hồi quy tuyến tính?
A. Khi biến phụ thuộc là biến định lượng liên tục.
B. Khi biến phụ thuộc là biến định tính (phân loại).
C. Khi có mối quan hệ tuyến tính giữa biến độc lập và biến phụ thuộc.
D. Khi cần dự báo giá trị của biến độc lập.
27. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có kích thước mẫu nhỏ.
D. Khi cần so sánh trung bình của hai nhóm.
28. Điều gì xảy ra với khoảng tin cậy (confidence interval) khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy biến mất.
29. Phương pháp nào sau đây thường được sử dụng để kiểm tra tính dừng (stationarity) của chuỗi thời gian?
A. Kiểm định t-Student.
B. Kiểm định Durbin-Watson.
C. Kiểm định Augmented Dickey-Fuller (ADF).
D. Kiểm định Chi-square.
30. Trong kinh tế lượng, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Sự tương quan cao giữa các biến độc lập trong mô hình hồi quy.
B. Sự tương quan cao giữa biến độc lập và biến phụ thuộc.
C. Sự biến động lớn của sai số trong mô hình hồi quy.
D. Sự thiếu dữ liệu trong mô hình hồi quy.