1. Khi nào thì nên sử dụng phân tích hồi quy logistic?
A. Khi biến phụ thuộc là biến định lượng liên tục.
B. Khi biến phụ thuộc là biến định tính nhị phân.
C. Khi biến độc lập là biến định tính.
D. Khi cần so sánh trung bình của nhiều nhóm.
2. Phương pháp nào sau đây được sử dụng để xác định các nhóm khách hàng có đặc điểm tương đồng dựa trên dữ liệu về hành vi và sở thích của họ?
A. Phân tích hồi quy.
B. Phân tích phân cụm (Cluster Analysis).
C. Phân tích phương sai (ANOVA).
D. Phân tích chuỗi thời gian.
3. Sai số loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó sai.
C. Bác bỏ giả thuyết H1 khi nó đúng.
D. Chấp nhận giả thuyết H1 khi nó sai.
4. Mục đích chính của việc sử dụng chỉ số giá (price index) trong kinh tế là gì?
A. Đo lường sự thay đổi về số lượng hàng hóa và dịch vụ sản xuất.
B. Đo lường sự thay đổi về mức giá chung của hàng hóa và dịch vụ.
C. Đo lường sự thay đổi về thu nhập của người tiêu dùng.
D. Đo lường sự thay đổi về tỷ lệ thất nghiệp.
5. Giá trị trung vị (median) của một tập dữ liệu thể hiện điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm ở giữa tập dữ liệu khi được sắp xếp theo thứ tự.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
6. Phương pháp lấy mẫu nào đảm bảo mọi phần tử trong quần thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu phân tầng.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu theo cụm.
7. Trong lý thuyết xác suất, hai sự kiện được gọi là độc lập nếu điều gì xảy ra?
A. Chúng không thể xảy ra cùng một lúc.
B. Xác suất của sự kiện này ảnh hưởng đến xác suất của sự kiện kia.
C. Xác suất của sự kiện này không ảnh hưởng đến xác suất của sự kiện kia.
D. Tổng xác suất của chúng bằng 1.
8. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được kiểm tra?
A. Sự khác biệt giữa phương sai của hai mẫu.
B. Sự khác biệt giữa trung bình của hai mẫu.
C. Sự khác biệt giữa trung bình của nhiều nhóm.
D. Sự khác biệt giữa phương sai của nhiều nhóm.
9. Khi nào nên sử dụng kiểm định Chi-square?
A. Khi so sánh trung bình của hai nhóm.
B. Khi phân tích mối quan hệ giữa hai biến định tính.
C. Khi dự đoán giá trị của một biến dựa trên biến khác.
D. Khi kiểm tra sự khác biệt giữa phương sai của hai nhóm.
10. Trong phân tích chuỗi thời gian, thành phần nào sau đây mô tả sự biến động không đều đặn và khó dự đoán?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Chu kỳ (Cyclical).
D. Tính ngẫu nhiên (Irregularity).
11. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Kiểm định t (t-test).
12. Một nhà quản lý muốn so sánh hiệu suất bán hàng của ba chi nhánh khác nhau. Phương pháp thống kê nào sau đây phù hợp nhất?
A. Kiểm định t (t-test).
B. Phân tích hồi quy.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-square.
13. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
14. Trong thống kê suy luận, mục tiêu chính là gì?
A. Mô tả các đặc điểm của mẫu dữ liệu.
B. Thu thập dữ liệu từ quần thể.
C. Ước tính và đưa ra kết luận về quần thể dựa trên mẫu.
D. Tính toán các số liệu thống kê mô tả.
15. Trong phân tích rủi ro, giá trị kỳ vọng (expected value) được tính như thế nào?
A. Tổng của tất cả các kết quả có thể xảy ra.
B. Trung bình của các kết quả tốt nhất và xấu nhất.
C. Tổng của các kết quả có thể xảy ra nhân với xác suất tương ứng của chúng.
D. Kết quả có khả năng xảy ra cao nhất.
16. Trong phân tích tương quan, hệ số tương quan Pearson đo lường điều gì?
A. Mức độ tác động của một biến lên biến khác.
B. Mức độ phù hợp của mô hình hồi quy.
C. Mức độ liên kết tuyến tính giữa hai biến.
D. Mức độ biến động của hai biến.
17. Ý nghĩa của giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc lỗi loại I.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Xác suất bác bỏ giả thuyết H0.
18. Đường cong ROC (Receiver Operating Characteristic) được sử dụng để đánh giá điều gì?
A. Độ chính xác của mô hình hồi quy.
B. Hiệu suất của mô hình phân loại.
C. Mức độ tương quan giữa hai biến.
D. Sự phân bố của dữ liệu.
19. Khi dữ liệu bị lệch (skewed), thước đo nào sau đây thường được sử dụng để đo lường xu hướng trung tâm thay vì giá trị trung bình (mean)?
A. Phương sai (variance).
B. Độ lệch chuẩn (standard deviation).
C. Trung vị (median).
D. Mốt (mode).
20. Phương pháp nào sau đây được sử dụng để kiểm tra sự khác biệt giữa trung bình của hai mẫu độc lập?
A. Kiểm định ANOVA.
B. Kiểm định t (t-test).
C. Kiểm định Chi-square.
D. Phân tích hồi quy.
21. Ý nghĩa của mức ý nghĩa (alpha) trong kiểm định giả thuyết là gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất chấp nhận giả thuyết H0 khi nó sai.
C. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
22. Trong phân tích hồi quy, sai số chuẩn của hệ số hồi quy (standard error of the regression coefficient) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy.
B. Độ lệch chuẩn của các giá trị dự đoán.
C. Mức độ biến động của hệ số hồi quy ước tính.
D. Mức độ tương quan giữa các biến độc lập.
23. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập.
B. Mối quan hệ phi tuyến tính giữa biến độc lập và biến phụ thuộc.
C. Sự thiếu biến quan trọng trong mô hình.
D. Phương sai của sai số thay đổi.
24. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ quan trọng của các biến độc lập trong mô hình.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
C. Mức độ tin cậy của các hệ số hồi quy.
D. Mức độ biến động của biến phụ thuộc.
25. Trong thống kê mô tả, tứ phân vị (quartile) được sử dụng để làm gì?
A. Đo lường mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Chia tập dữ liệu thành bốn phần bằng nhau.
C. Đo lường mức độ lệch của phân phối dữ liệu.
D. Xác định giá trị lớn nhất và nhỏ nhất trong tập dữ liệu.
26. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Dự đoán giá trị tương lai của chuỗi.
B. Làm mịn chuỗi và loại bỏ nhiễu.
C. Xác định xu hướng của chuỗi.
D. Phân tích tính mùa vụ của chuỗi.
27. Giả thuyết H1 (giả thuyết thay thế) trong kiểm định giả thuyết là gì?
A. Giả thuyết mà chúng ta cố gắng bác bỏ.
B. Giả thuyết mặc định.
C. Giả thuyết mà chúng ta cố gắng chứng minh.
D. Giả thuyết luôn đúng.
28. Một công ty muốn khảo sát mức độ hài lòng của khách hàng. Phương pháp lấy mẫu nào sau đây phù hợp nhất để đảm bảo tính đại diện của các nhóm khách hàng khác nhau (ví dụ: theo độ tuổi, giới tính)?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu ngẫu nhiên đơn giản.
C. Lấy mẫu phân tầng.
D. Lấy mẫu theo cụm.
29. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi cần so sánh trung bình của nhiều nhóm.
30. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Khoảng tin cậy trở nên không xác định.