1. Độ tin cậy (confidence level) là gì?
A. Xác suất mà khoảng tin cậy chứa giá trị tham số thực.
B. Độ rộng của khoảng tin cậy.
C. Sai số chuẩn của ước lượng.
D. Kích thước mẫu cần thiết để ước lượng tham số.
2. Công thức nào sau đây là công thức tính phương sai của một biến ngẫu nhiên $X$?
A. $Var(X) = E(X^2) - [E(X)]^2$
B. $Var(X) = E(X) - [E(X)]^2$
C. $Var(X) = E(X^2) + [E(X)]^2$
D. $Var(X) = [E(X)]^2 - E(X^2)$
3. Sai số loại I trong kiểm định giả thuyết là gì?
A. Việc chấp nhận giả thuyết không khi nó thực sự sai.
B. Việc bác bỏ giả thuyết không khi nó thực sự đúng.
C. Việc không bác bỏ giả thuyết không khi nó thực sự đúng.
D. Việc không bác bỏ giả thuyết không khi nó thực sự sai.
4. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là gì?
A. $\beta$
B. $\mu$
C. $\alpha$
D. $\sigma$
5. Biến ngẫu nhiên liên tục khác biến ngẫu nhiên rời rạc ở điểm nào?
A. Biến liên tục chỉ nhận giá trị nguyên.
B. Biến liên tục có thể nhận bất kỳ giá trị nào trong một khoảng xác định.
C. Biến rời rạc có phân phối xác suất liên tục.
D. Biến rời rạc có thể nhận bất kỳ giá trị nào trong một khoảng xác định.
6. Phân phối nào sau đây được sử dụng để ước lượng trung bình của một tổng thể khi độ lệch chuẩn của tổng thể chưa biết và kích thước mẫu nhỏ?
A. Phân phối chuẩn.
B. Phân phối t.
C. Phân phối Chi bình phương.
D. Phân phối F.
7. Một hộp chứa 5 bi đỏ và 3 bi xanh. Nếu bạn chọn ngẫu nhiên 2 bi, xác suất để cả hai bi đều đỏ là bao nhiêu?
A. $\frac{5}{8} \times \frac{4}{7}$
B. $\frac{5}{8} + \frac{3}{8}$
C. $\frac{5}{8} \times \frac{5}{8}$
D. $\frac{3}{8} \times \frac{2}{7}$
8. Công thức nào sau đây là công thức tính kỳ vọng của một biến ngẫu nhiên rời rạc $X$?
A. $E(X) = \sum x^2 P(X=x)$
B. $E(X) = \sum x P(X=x)$
C. $E(X) = \int x P(X=x) dx$
D. $E(X) = \frac{1}{n} \sum x_i$
9. Trong thống kê mô tả, tứ phân vị (quartile) được sử dụng để làm gì?
A. Đo lường độ lệch chuẩn của dữ liệu.
B. Chia dữ liệu thành bốn phần bằng nhau.
C. Tìm giá trị trung bình của dữ liệu.
D. Xác định giá trị lớn nhất và nhỏ nhất của dữ liệu.
10. Công thức Bayes được sử dụng để tính toán cái gì?
A. Xác suất của một biến cố ngẫu nhiên.
B. Xác suất có điều kiện.
C. Kỳ vọng của một biến ngẫu nhiên.
D. Phương sai của một biến ngẫu nhiên.
11. Khi nào thì nên sử dụng kiểm định Chi-square?
A. Khi so sánh trung bình của hai nhóm.
B. Khi phân tích phương sai.
C. Khi kiểm tra mối quan hệ giữa hai biến định tính.
D. Khi dự đoán giá trị của một biến liên tục.
12. Trong phân tích phương sai (ANOVA), yếu tố nào được kiểm tra?
A. Sự khác biệt giữa các phương sai của hai mẫu.
B. Sự khác biệt giữa các trung bình của hai hay nhiều nhóm.
C. Mối quan hệ giữa hai biến định lượng.
D. Sự khác biệt giữa các tỷ lệ của hai mẫu.
13. Nếu bạn tung một đồng xu 3 lần, xác suất để có được ít nhất 2 mặt ngửa là bao nhiêu?
A. $\frac{1}{8}$
B. $\frac{3}{8}$
C. $\frac{1}{2}$
D. $\frac{5}{8}$
14. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây KHÔNG phải là một giả định?
A. Dữ liệu phải tuân theo phân phối chuẩn.
B. Phương sai giữa các nhóm phải bằng nhau (homogeneity of variance).
C. Các nhóm phải có kích thước bằng nhau.
D. Các quan sát phải độc lập với nhau.
15. Nếu $X$ là một biến ngẫu nhiên có phân phối chuẩn với trung bình $\mu$ và độ lệch chuẩn $\sigma$, biến ngẫu nhiên $Z = \frac{X - \mu}{\sigma}$ có phân phối gì?
A. Phân phối chuẩn với trung bình $\mu$ và độ lệch chuẩn $\sigma$.
B. Phân phối chuẩn với trung bình 0 và độ lệch chuẩn 1.
C. Phân phối mũ với tham số $\lambda = \frac{1}{\sigma}$.
D. Phân phối Poisson với tham số $\lambda = \mu$.
16. Trong kiểm định giả thuyết, khi nào chúng ta mắc phải sai lầm loại II (Type II error)?
A. Khi chúng ta bác bỏ giả thuyết null khi nó thực sự đúng.
B. Khi chúng ta chấp nhận giả thuyết null khi nó thực sự sai.
C. Khi chúng ta không đưa ra kết luận gì.
D. Khi chúng ta tăng kích thước mẫu.
17. Khi nào thì nên sử dụng kiểm định t (t-test) độc lập?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của hai nhóm phụ thuộc.
C. Khi kiểm tra mối quan hệ giữa hai biến định tính.
D. Khi dự đoán giá trị của một biến liên tục.
18. Nếu hai biến cố $A$ và $B$ độc lập, thì $P(A \cap B)$ bằng gì?
A. $P(A) + P(B)$
B. $P(A) \times P(B)$
C. $P(A) / P(B)$
D. $P(A) - P(B)$
19. Trong một bài toán kiểm định giả thuyết, nếu giá trị p nhỏ hơn mức ý nghĩa \(\alpha\), chúng ta nên làm gì?
A. Chấp nhận giả thuyết null.
B. Bác bỏ giả thuyết null.
C. Không đưa ra kết luận gì.
D. Tăng kích thước mẫu.
20. Trong lý thuyết xác suất, biến ngẫu nhiên rời rạc là gì?
A. Biến có thể nhận bất kỳ giá trị nào trong một khoảng.
B. Biến chỉ có thể nhận một số hữu hạn giá trị hoặc vô hạn đếm được các giá trị.
C. Biến mà giá trị của nó không thể dự đoán được.
D. Biến luôn có giá trị bằng 0 hoặc 1.
21. Cho hai biến ngẫu nhiên $X$ và $Y$, khi nào thì $Cov(X, Y) = 0$?
A. Khi $X$ và $Y$ phụ thuộc tuyến tính.
B. Khi $X$ và $Y$ độc lập.
C. Khi $X$ và $Y$ có cùng phương sai.
D. Khi $X = Y$.
22. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối mũ
23. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì?
A. Tổng của các biến ngẫu nhiên độc lập có phân phối chuẩn.
B. Trung bình mẫu của một số lượng lớn các biến ngẫu nhiên độc lập, có cùng phân phối, sẽ xấp xỉ phân phối chuẩn.
C. Phương sai của tổng các biến ngẫu nhiên độc lập bằng tổng các phương sai.
D. Các biến ngẫu nhiên độc lập luôn có kỳ vọng bằng 0.
24. Trong phân tích hồi quy tuyến tính, điều gì xảy ra nếu có hiện tượng đa cộng tuyến (multicollinearity)?
A. Các hệ số hồi quy trở nên ổn định hơn.
B. Phương sai của các hệ số hồi quy tăng lên.
C. Mô hình trở nên chính xác hơn trong việc dự đoán.
D. Giá trị R-squared giảm xuống.
25. Giá trị $p$ (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất thu được kết quả kiểm định ít nhất cực đoan bằng kết quả quan sát được, giả sử giả thuyết không là đúng.
C. Mức ý nghĩa của kiểm định.
D. Xác suất mắc sai số loại II.
26. Độ lệch chuẩn của một tập dữ liệu là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Phương sai của tập dữ liệu.
C. Căn bậc hai của phương sai.
D. Tổng của các giá trị trong tập dữ liệu.
27. Giá trị trung vị (median) của một tập dữ liệu là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị ở giữa của tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
28. Trong thống kê, `mode` (mốt) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị ở giữa của tập dữ liệu đã sắp xếp.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Độ lệch chuẩn của tập dữ liệu.
29. Nếu một biến ngẫu nhiên tuân theo phân phối chuẩn với trung bình là 0 và độ lệch chuẩn là 1, xác suất để biến đó nằm trong khoảng từ -1 đến 1 là bao nhiêu (xấp xỉ)?
A. 50%
B. 68%
C. 95%
D. 99.7%
30. Trong hồi quy tuyến tính, hệ số $R^2$ (R-squared) đo lường điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
C. Phương sai của sai số.
D. Giá trị trung bình của biến phụ thuộc.