1. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết không đúng khi nó thực sự đúng.
B. Chấp nhận giả thuyết không đúng khi nó thực sự sai.
C. Bác bỏ giả thuyết không đúng khi nó thực sự sai.
D. Chấp nhận giả thuyết không đúng khi nó thực sự đúng.
2. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy trở nên không xác định.
3. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Mức độ tập trung của dữ liệu xung quanh giá trị trung vị.
D. Mức độ bất đối xứng của phân phối dữ liệu.
4. Một nhà quản lý muốn so sánh hiệu quả của hai chiến dịch marketing khác nhau bằng cách đo lường số lượng khách hàng mới mà mỗi chiến dịch thu hút được. Họ sử dụng kiểm định t để so sánh trung bình số lượng khách hàng mới của hai chiến dịch. Kết quả kiểm định t cho thấy giá trị p là 0.03. Điều này có nghĩa là gì?
A. Không có sự khác biệt đáng kể giữa hiệu quả của hai chiến dịch.
B. Có sự khác biệt đáng kể giữa hiệu quả của hai chiến dịch ở mức ý nghĩa 5%.
C. Có sự khác biệt đáng kể giữa hiệu quả của hai chiến dịch ở mức ý nghĩa 1%.
D. Không thể kết luận gì về sự khác biệt giữa hiệu quả của hai chiến dịch.
5. Trong phân tích chuỗi thời gian, thành phần nào sau đây mô tả sự biến động ngắn hạn và không đều đặn trong dữ liệu?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính ngẫu nhiên (Irregularity).
6. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi kích thước mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có thang đo thứ bậc.
D. Khi muốn so sánh trung bình của hai nhóm.
7. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu liên quan khi dữ liệu tuân theo phân phối chuẩn.
C. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của hai mẫu độc lập.
8. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của tập dữ liệu gốc.
B. Mức độ phân tán của các trung bình mẫu xung quanh trung bình quần thể.
C. Kích thước của mẫu.
D. Độ tin cậy của ước lượng.
9. Một công ty muốn dự báo doanh số bán hàng cho quý tới. Phương pháp nào sau đây là phù hợp nhất nếu công ty có dữ liệu doanh số bán hàng trong 5 năm qua?
A. Phân tích hồi quy đa biến.
B. Phân tích chuỗi thời gian.
C. Phân tích phương sai (ANOVA).
D. Phân tích cụm (Cluster analysis).
10. Trong phân tích phương sai (ANOVA), giá trị F thể hiện điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu.
B. Tỷ lệ phương sai giữa các nhóm so với phương sai trong các nhóm.
C. Mức độ tương quan giữa các biến số.
D. Xác suất mắc sai lầm loại I.
11. Trong thống kê kinh doanh, thuật ngữ `ngoại lệ` (outlier) thường đề cập đến điều gì?
A. Một quan sát có giá trị khác biệt đáng kể so với các quan sát khác trong tập dữ liệu.
B. Một biến số không tương quan với các biến số khác trong mô hình.
C. Một lỗi trong quá trình thu thập dữ liệu.
D. Một xu hướng không thể giải thích được trong dữ liệu thời gian.
12. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu, thể hiện tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
B. Độ mạnh của mối quan hệ nhân quả giữa biến độc lập và biến phụ thuộc.
C. Mức độ ý nghĩa thống kê của từng biến độc lập trong mô hình.
D. Sai số chuẩn của các hệ số hồi quy.
13. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Dự báo giá trị tương lai của chuỗi thời gian.
B. Làm mịn chuỗi thời gian để loại bỏ nhiễu và làm nổi bật xu hướng.
C. Xác định các thành phần thời vụ trong chuỗi thời gian.
D. Đo lường mức độ biến động của chuỗi thời gian.
14. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không đúng là đúng.
B. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết không đúng là đúng.
C. Xác suất giả thuyết không đúng là sai.
D. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết không đúng là sai.
15. Phương pháp nào sau đây được sử dụng để kiểm tra sự khác biệt giữa trung bình của hai mẫu độc lập khi phương sai của hai quần thể không được biết và giả định là không bằng nhau?
A. Kiểm định t Student.
B. Kiểm định z.
C. Kiểm định t Welch.
D. Kiểm định ANOVA.
16. Loại biểu đồ nào sau đây phù hợp nhất để so sánh phân phối của một biến số giữa hai nhóm khác nhau?
A. Biểu đồ đường (Line chart).
B. Biểu đồ cột (Bar chart).
C. Biểu đồ hộp (Box plot).
D. Biểu đồ tròn (Pie chart).
17. Một nhà quản lý muốn so sánh hiệu quả bán hàng của ba chi nhánh khác nhau. Phương pháp thống kê nào sau đây là phù hợp nhất?
A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Kiểm định t Student.
D. Kiểm định Chi-bình phương.
18. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy.
B. Phân tích thành phần chính (Principal Component Analysis).
C. Phân tích phương sai (ANOVA).
D. Phân tích tương quan.
19. Trong phân tích rủi ro, phương pháp Monte Carlo được sử dụng để làm gì?
A. Ước tính giá trị trung bình của một biến số.
B. Mô phỏng nhiều kịch bản khác nhau để đánh giá tác động của rủi ro.
C. Xác định các yếu tố rủi ro quan trọng nhất.
D. Giảm thiểu rủi ro bằng cách đa dạng hóa danh mục đầu tư.
20. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có mối tương quan cao giữa các biến độc lập trong mô hình.
B. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
C. Khi có sự thay đổi phương sai của sai số.
D. Khi mô hình hồi quy không phù hợp với dữ liệu.
21. Trong phân tích chuỗi thời gian, phương pháp ARIMA được sử dụng để làm gì?
A. Phân tích mối quan hệ giữa các biến số khác nhau.
B. Dự báo giá trị tương lai của chuỗi thời gian dựa trên các giá trị quá khứ của nó.
C. Xác định các nhóm khách hàng khác nhau.
D. So sánh trung bình của các nhóm khác nhau.
22. Một công ty muốn xác định xem có sự khác biệt đáng kể về mức độ hài lòng của khách hàng giữa các khu vực địa lý khác nhau hay không. Phương pháp nào sau đây là phù hợp nhất?
A. Phân tích hồi quy tuyến tính.
B. Phân tích tương quan.
C. Phân tích phương sai (ANOVA).
D. Phân tích cụm (Cluster analysis).
23. Phương pháp nào sau đây thường được sử dụng để phân tích mối quan hệ giữa hai biến định tính?
A. Hệ số tương quan Pearson.
B. Kiểm định Chi-bình phương.
C. Phân tích hồi quy tuyến tính.
D. Phân tích phương sai (ANOVA).
24. Trong thống kê, thuật ngữ `phân phối lấy mẫu` (sampling distribution) đề cập đến điều gì?
A. Phân phối của dữ liệu trong mẫu.
B. Phân phối của một thống kê (ví dụ: trung bình mẫu) được tính từ nhiều mẫu khác nhau được lấy từ cùng một quần thể.
C. Phân phối của quần thể.
D. Phân phối của sai số trong mô hình hồi quy.
25. Một nhà phân tích muốn đánh giá tác động của một chương trình đào tạo mới đối với năng suất của nhân viên. Họ thu thập dữ liệu về năng suất của nhân viên trước và sau khi tham gia chương trình đào tạo. Phương pháp nào sau đây là phù hợp nhất?
A. Kiểm định t cho mẫu độc lập.
B. Kiểm định t cho mẫu ghép cặp.
C. Phân tích phương sai (ANOVA).
D. Phân tích hồi quy tuyến tính.
26. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ thay đổi của một biến số khi biến số khác thay đổi.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến số định lượng.
C. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
D. Sự khác biệt giữa giá trị trung bình của hai mẫu.
27. Một công ty muốn dự đoán số lượng sản phẩm sẽ bán được dựa trên giá bán và chi phí quảng cáo. Phương pháp nào sau đây là phù hợp nhất?
A. Phân tích hồi quy tuyến tính đa biến.
B. Phân tích tương quan.
C. Phân tích phương sai (ANOVA).
D. Phân tích cụm (Cluster analysis).
28. Một nhà nghiên cứu muốn kiểm tra xem có mối liên hệ giữa chi tiêu quảng cáo và doanh thu bán hàng hay không, nhưng nghi ngờ rằng mối quan hệ này có thể không tuyến tính. Phương pháp nào sau đây có thể được sử dụng?
A. Phân tích hồi quy tuyến tính.
B. Phân tích tương quan Pearson.
C. Phân tích hồi quy phi tuyến.
D. Kiểm định Chi-bình phương.
29. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến số dựa trên các biến số khác.
B. Phân nhóm các đối tượng tương tự vào các cụm khác nhau.
C. Xác định mối quan hệ giữa hai biến số.
D. So sánh trung bình của các nhóm khác nhau.
30. Phương pháp nào sau đây có thể được sử dụng để xác định các nhóm khách hàng khác nhau dựa trên hành vi mua sắm của họ?
A. Phân tích hồi quy.
B. Phân tích tương quan.
C. Phân tích cụm (Cluster analysis).
D. Phân tích phương sai (ANOVA).