1. Một người chơi xổ số mua một vé. Xác suất trúng giải độc đắc là 1/1000000. Nếu người đó mua 1000 vé, xác suất trúng giải độc đắc ít nhất một lần là bao nhiêu (ước lượng)?
A. 0.000001
B. 0.001
C. 0.999
D. 0.00001
2. Nếu hệ số tương quan Pearson giữa hai biến là -1, điều này có nghĩa là gì?
A. Không có mối quan hệ nào giữa hai biến.
B. Có một mối quan hệ tuyến tính mạnh mẽ và dương giữa hai biến.
C. Có một mối quan hệ tuyến tính mạnh mẽ và âm giữa hai biến.
D. Hai biến này hoàn toàn giống nhau.
3. Cho biến ngẫu nhiên X có hàm mật độ xác suất $f(x) = \begin{cases} kx, & 0 \le x \le 2 \\ 0, & \text{otherwise} \end{cases}$. Tìm giá trị của k.
A. $\frac{1}{2}$
B. 1
C. $\frac{1}{4}$
D. 2
4. Một đồng xu được tung 5 lần. Tính xác suất để có đúng 3 mặt ngửa.
A. $\frac{5}{32}$
B. $\frac{3}{5}$
C. $\frac{10}{32}$
D. $\frac{1}{2}$
5. Giá trị p (p-value) trong kiểm định giả thuyết thống kê là gì?
A. Xác suất giả thuyết $H_0$ là đúng.
B. Xác suất mắc lỗi loại I.
C. Xác suất thu được kết quả thống kê ít nhất cực đoan như kết quả quan sát được, giả sử $H_0$ là đúng.
D. Xác suất mắc lỗi loại II.
6. Một người chơi tung một con xúc xắc cân đối 6 mặt. Tính xác suất để số chấm xuất hiện là số nguyên tố.
A. $\frac{1}{2}$
B. $\frac{1}{3}$
C. $\frac{2}{3}$
D. $\frac{1}{6}$
7. Một bài kiểm tra có 20 câu hỏi trắc nghiệm, mỗi câu có 4 lựa chọn. Một học sinh chọn đáp án ngẫu nhiên cho tất cả các câu hỏi. Tính số câu trả lời đúng kỳ vọng.
8. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi của độ rộng khoảng tin cậy.
9. Phân phối chuẩn (normal distribution) có những đặc điểm nào?
A. Bất đối xứng và có hai đỉnh.
B. Đối xứng, đơn đỉnh và có dạng hình chuông.
C. Phân bố đều trên toàn bộ trục số.
D. Luôn có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1.
10. Cho biến ngẫu nhiên X có phân phối nhị thức $B(n, p)$. Biết $n = 10$ và $p = 0.3$. Tính kỳ vọng $E(X)$.
11. Một hộp chứa 4 viên bi đỏ và 6 viên bi xanh. Lấy ngẫu nhiên 3 viên bi. Tính xác suất để có ít nhất 1 viên bi đỏ.
A. $\frac{1}{6}$
B. $\frac{5}{6}$
C. $\frac{1}{2}$
D. $\frac{2}{3}$
12. Cho biến ngẫu nhiên X tuân theo phân phối chuẩn với trung bình $\mu$ và phương sai $\sigma^2$. Hàm mật độ xác suất của X được cho bởi công thức nào?
A. $\frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$
B. $\frac{1}{\sigma \sqrt{2\pi}} e^{\frac{(x-\mu)^2}{2\sigma^2}}$
C. $\frac{1}{\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$
D. $\frac{1}{\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$
13. Cho biến ngẫu nhiên X có phân phối Poisson với tham số $\lambda = 2$. Tính phương sai $Var(X)$.
A. 4
B. 2
C. $\sqrt{2}$
D. 1
14. Trong kiểm định giả thuyết thống kê, lỗi loại I là gì?
A. Bác bỏ giả thuyết $H_0$ khi $H_0$ sai.
B. Chấp nhận giả thuyết $H_0$ khi $H_0$ đúng.
C. Bác bỏ giả thuyết $H_0$ khi $H_0$ đúng.
D. Chấp nhận giả thuyết $H_0$ khi $H_0$ sai.
15. Chọn ngẫu nhiên một điểm trên đoạn [0, 1]. Tính xác suất để điểm đó lớn hơn 0.7.
A. 0.7
B. 0.3
C. 0.5
D. 1
16. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Vị trí trung tâm của một tập dữ liệu.
D. Mối quan hệ giữa hai biến.
17. Cho hai biến ngẫu nhiên X và Y độc lập. Biết $E(X) = 2$, $E(Y) = 3$, $Var(X) = 1$, $Var(Y) = 4$. Tính $Var(X + Y)$.
18. Một hộp chứa 5 bi đỏ và 3 bi xanh. Lấy ngẫu nhiên 2 bi. Tính xác suất để cả hai bi đều đỏ.
A. $\frac{5}{14}$
B. $\frac{10}{56}$
C. $\frac{10}{28}$
D. $\frac{5}{28}$
19. Chọn ngẫu nhiên một số từ tập {1, 2, ..., 100}. Tính xác suất để số đó chia hết cho 5.
A. $\frac{1}{2}$
B. $\frac{1}{5}$
C. $\frac{1}{10}$
D. $\frac{5}{100}$
20. Một lô hàng có 10 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên 3 sản phẩm. Tính xác suất để có đúng 1 phế phẩm.
A. $\frac{7}{15}$
B. $\frac{2}{15}$
C. $\frac{1}{5}$
D. $\frac{8}{15}$
21. Cho hai biến cố A và B. Biết $P(A) = 0.6$, $P(B) = 0.5$ và $P(A \cap B) = 0.3$. Tính $P(A|B)$.
A. 0.5
B. 0.6
C. 0.3
D. 0.4
22. Khoảng tin cậy (confidence interval) là gì?
A. Một giá trị duy nhất ước lượng cho tham số của quần thể.
B. Một khoảng giá trị mà trong đó chúng ta tin rằng tham số của quần thể nằm trong đó với một độ tin cậy nhất định.
C. Xác suất tham số của quần thể nằm trong một khoảng nhất định.
D. Một kiểm định giả thuyết thống kê.
23. Giá trị trung vị (median) của một tập dữ liệu là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình của tập dữ liệu.
C. Giá trị nằm ở giữa tập dữ liệu sau khi đã sắp xếp.
D. Độ lệch chuẩn của tập dữ liệu.
24. Trong thống kê mô tả, tứ phân vị (quartile) được sử dụng để làm gì?
A. Đo lường giá trị trung bình của dữ liệu.
B. Chia dữ liệu thành bốn phần bằng nhau.
C. Đo lường độ lệch chuẩn của dữ liệu.
D. Xác định giá trị lớn nhất và nhỏ nhất trong dữ liệu.
25. Một xạ thủ bắn 3 phát vào một mục tiêu. Xác suất bắn trúng mục tiêu trong mỗi lần bắn là 0.6. Tính xác suất để xạ thủ bắn trúng mục tiêu ít nhất một lần.
A. 0.216
B. 0.936
C. 0.784
D. 0.36
26. Một công ty có 100 nhân viên, trong đó có 60 nữ và 40 nam. Chọn ngẫu nhiên 5 nhân viên để tham gia một dự án. Tính xác suất để có đúng 3 nữ.
A. $\frac{C_{60}^3}{C_{100}^5}$
B. $\frac{C_{60}^3 \times C_{40}^2}{C_{100}^5}$
C. $\frac{C_{60}^3 + C_{40}^2}{C_{100}^5}$
D. $\frac{C_{100}^5}{C_{60}^3 \times C_{40}^2}$
27. Chọn ngẫu nhiên một số từ tập hợp các số tự nhiên có hai chữ số. Tính xác suất để số được chọn chia hết cho 3.
A. $\frac{1}{3}$
B. $\frac{1}{9}$
C. $\frac{1}{10}$
D. $\frac{3}{100}$
28. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai quần thể.
B. Kiểm tra sự phù hợp của dữ liệu với một phân phối lý thuyết.
C. Ước lượng khoảng tin cậy cho trung bình quần thể.
D. Phân tích phương sai (ANOVA).
29. Cho hai biến cố A và B độc lập. Biết $P(A) = 0.4$ và $P(B) = 0.7$. Tính $P(A \cup B)$.
A. 0.12
B. 0.28
C. 0.82
D. 0.58
30. Trong phân tích hồi quy tuyến tính, hệ số xác định $R^2$ đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Sai số chuẩn của ước lượng.
D. Giá trị p của kiểm định F.