1. Giá trị nào sau đây biểu thị mối tương quan tuyến tính mạnh nhất?
A. 0.0
B. 0.5
C. -0.9
D. 0.3
2. Loại biểu đồ nào thích hợp nhất để hiển thị mối quan hệ giữa hai biến định lượng?
A. Biểu đồ cột (Bar chart)
B. Biểu đồ tần suất (Histogram)
C. Biểu đồ phân tán (Scatter plot)
D. Biểu đồ tròn (Pie chart)
3. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến điều gì?
A. Mối quan hệ tuyến tính giữa biến phụ thuộc và biến độc lập.
B. Mối quan hệ phi tuyến tính giữa biến phụ thuộc và biến độc lập.
C. Mối tương quan cao giữa các biến độc lập.
D. Sự thay đổi phương sai của sai số.
4. Nếu bạn muốn so sánh sự khác biệt giữa hai nhóm phụ thuộc (ví dụ: trước và sau can thiệp), bạn nên sử dụng kiểm định nào?
A. Kiểm định t độc lập (Independent t-test)
B. Kiểm định t ghép cặp (Paired t-test)
C. Kiểm định Chi-bình phương (Chi-square test)
D. Phân tích phương sai (ANOVA)
5. Giả sử bạn muốn kiểm tra xem có sự khác biệt đáng kể về điểm trung bình của một bài kiểm tra giữa ba nhóm sinh viên khác nhau hay không, bạn nên sử dụng kiểm định thống kê nào?
A. Kiểm định t (t-test)
B. Kiểm định Chi-bình phương (Chi-square test)
C. Phân tích phương sai (ANOVA)
D. Hồi quy tuyến tính (Linear regression)
6. Giá trị nào sau đây không bị ảnh hưởng bởi các giá trị ngoại lệ (outliers) trong một tập dữ liệu?
A. Trung bình (Mean)
B. Độ lệch chuẩn (Standard deviation)
C. Trung vị (Median)
D. Phạm vi (Range)
7. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Mức độ quan hệ nhân quả giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Độ mạnh của mối tương quan giữa các biến.
D. Mức độ ý nghĩa thống kê của mô hình.
8. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu rất lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi muốn so sánh trung bình của nhiều nhóm.
9. Trong thống kê, `trung bình` (mean) được tính như thế nào?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Tổng của tất cả các giá trị chia cho số lượng giá trị.
C. Giá trị ở giữa của tập dữ liệu đã sắp xếp.
D. Hiệu giữa giá trị lớn nhất và nhỏ nhất trong tập dữ liệu.
10. Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong khoảng một độ lệch chuẩn so với giá trị trung bình?
A. 50%
B. 68%
C. 95%
D. 99.7%
11. Độ lệch (skewness) của một phân phối đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Mức độ bất đối xứng của phân phối.
D. Độ nhọn của phân phối.
12. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
13. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Sai số do đo lường không chính xác.
14. Kiểm định nào sau đây thường được sử dụng để so sánh tỷ lệ của hai quần thể độc lập?
A. Kiểm định t (t-test)
B. Kiểm định z (z-test)
C. Kiểm định Chi-bình phương (Chi-square test)
D. Phân tích phương sai (ANOVA)
15. Khái niệm nào sau đây mô tả xác suất mắc lỗi loại II (Type II error)?
A. Mức ý nghĩa (Significance level)
B. Độ mạnh của kiểm định (Power of the test)
C. Giá trị p (p-value)
D. Sai số chuẩn (Standard error)
16. Lấy mẫu phân tầng (stratified sampling) là gì?
A. Chọn mẫu một cách ngẫu nhiên từ toàn bộ quần thể.
B. Chia quần thể thành các nhóm (strata) và sau đó lấy mẫu ngẫu nhiên từ mỗi nhóm.
C. Chọn mẫu dựa trên sự thuận tiện của người nghiên cứu.
D. Chọn mẫu theo một quy luật cố định.
17. Trong thống kê, `phân phối chuẩn` còn được gọi là gì?
A. Phân phối Poisson
B. Phân phối Bernoulli
C. Phân phối Gaussian
D. Phân phối nhị thức
18. Trong kiểm định giả thuyết, giá trị p (p-value) đại diện cho điều gì?
A. Xác suất giả thuyết không (null hypothesis) là đúng.
B. Xác suất thu được kết quả cực đoan như kết quả quan sát được, giả sử giả thuyết không là đúng.
C. Mức ý nghĩa thống kê của kết quả.
D. Độ mạnh của kiểm định.
19. Phương pháp lấy mẫu nào đảm bảo rằng mọi thành viên của quần thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling)
B. Lấy mẫu phân tầng (Stratified sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
D. Lấy mẫu theo cụm (Cluster sampling)
20. Phương pháp nào sau đây được sử dụng để kiểm tra mối quan hệ giữa hai biến phân loại?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi-bình phương (Chi-square test)
D. Hồi quy tuyến tính (Linear regression)
21. Trong thống kê mô tả, loại biểu đồ nào thường được sử dụng để so sánh phân phối của một biến số giữa hai hoặc nhiều nhóm?
A. Biểu đồ phân tán (Scatter plot)
B. Biểu đồ hộp (Box plot)
C. Biểu đồ đường (Line chart)
D. Biểu đồ tròn (Pie chart)
22. Loại lỗi nào xảy ra khi chúng ta bác bỏ một giả thuyết không đúng (null hypothesis) trong khi nó thực sự đúng?
A. Lỗi loại I (Type I error)
B. Lỗi loại II (Type II error)
C. Lỗi hệ thống (Systematic error)
D. Lỗi ngẫu nhiên (Random error)
23. Trong phân tích dữ liệu, giá trị ngoại lệ (outlier) là gì?
A. Một giá trị nằm gần giá trị trung bình.
B. Một giá trị cực đoan khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
C. Một giá trị bị thiếu trong tập dữ liệu.
D. Một giá trị được sử dụng để tính toán giá trị trung bình.
24. Mục đích chính của thống kê mô tả là gì?
A. Đưa ra kết luận về quần thể dựa trên mẫu.
B. Tóm tắt và mô tả các đặc điểm chính của dữ liệu.
C. Kiểm định các giả thuyết về quần thể.
D. Dự đoán các giá trị tương lai.
25. Phương pháp nào sau đây giúp xác định các cụm (clusters) trong một tập dữ liệu?
A. Phân tích hồi quy (Regression analysis)
B. Phân tích cụm (Cluster analysis)
C. Phân tích phương sai (ANOVA)
D. Phân tích thành phần chính (Principal component analysis)
26. Trong thống kê suy luận, khoảng tin cậy (confidence interval) được sử dụng để ước lượng điều gì?
A. Tham số của quần thể (Population parameter)
B. Thống kê mẫu (Sample statistic)
C. Sai số chuẩn (Standard error)
D. Giá trị p (p-value)
27. Trong thống kê, phương sai (variance) được định nghĩa là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Căn bậc hai của độ lệch chuẩn.
C. Trung bình của các bình phương độ lệch so với giá trị trung bình.
D. Phạm vi giữa giá trị lớn nhất và nhỏ nhất trong tập dữ liệu.
28. Phương pháp nào sau đây được sử dụng để dự đoán giá trị của một biến phụ thuộc dựa trên giá trị của một hoặc nhiều biến độc lập?
A. Phân tích phương sai (ANOVA)
B. Phân tích hồi quy (Regression analysis)
C. Kiểm định Chi-bình phương (Chi-square test)
D. Phân tích thành phần chính (Principal component analysis)
29. Kiểm định giả thuyết một phía (one-tailed test) khác với kiểm định giả thuyết hai phía (two-tailed test) như thế nào?
A. Kiểm định một phía chỉ được sử dụng cho các mẫu nhỏ.
B. Kiểm định một phía chỉ kiểm tra một hướng của sự khác biệt (lớn hơn hoặc nhỏ hơn), trong khi kiểm định hai phía kiểm tra cả hai hướng.
C. Kiểm định một phía luôn cho kết quả chính xác hơn kiểm định hai phía.
D. Kiểm định một phía dễ thực hiện hơn kiểm định hai phía.
30. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích phương sai (ANOVA)
B. Phân tích hồi quy tuyến tính (Linear Regression Analysis)
C. Phân tích thành phần chính (Principal Component Analysis)
D. Kiểm định Chi-bình phương (Chi-square test)