Đề 10 - Đề thi, câu hỏi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh
1. Trong phân tích chuỗi thời gian, thành phần nào thể hiện sự biến động không đều và không thể dự đoán được trong dữ liệu?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính ngẫu nhiên (Irregularity).
2. Trong marketing, kỹ thuật nào sử dụng dữ liệu để cá nhân hóa trải nghiệm của khách hàng trên trang web?
A. Phân tích chuỗi thời gian.
B. Hệ thống gợi ý (Recommender system).
C. Phân tích phương sai.
D. Phân tích hồi quy.
3. Trong lĩnh vực bán lẻ, ứng dụng nào của khoa học dữ liệu giúp xác định vị trí tối ưu cho các cửa hàng mới?
A. Phân tích chuỗi thời gian.
B. Phân tích không gian.
C. Phân tích cảm xúc.
D. Phân tích hồi quy.
4. Trong marketing, kỹ thuật nào sử dụng dữ liệu để phân nhóm khách hàng thành các phân khúc khác nhau dựa trên đặc điểm chung?
A. Phân tích hồi quy.
B. Phân tích cụm.
C. Phân tích chuỗi thời gian.
D. Phân tích phương sai.
5. Trong phân tích dữ liệu, thuật ngữ `feature engineering` đề cập đến điều gì?
A. Chọn thuật toán học máy phù hợp.
B. Xây dựng các đặc trưng (features) mới từ dữ liệu hiện có.
C. Đánh giá hiệu quả của mô hình.
D. Làm sạch dữ liệu.
6. Trong lĩnh vực ngân hàng, thuật toán nào thường được sử dụng để phân loại khách hàng thành các nhóm rủi ro khác nhau?
A. K-means clustering.
B. Principal Component Analysis (PCA).
C. Apriori algorithm.
D. Linear Regression.
7. Trong lĩnh vực năng lượng, khoa học dữ liệu có thể được sử dụng để tối ưu hóa hoạt động nào?
A. Dự báo thời tiết.
B. Quản lý tài chính.
C. Dự báo nhu cầu năng lượng.
D. Tuyển dụng nhân sự.
8. Trong lĩnh vực y tế, ứng dụng nào của khoa học dữ liệu giúp cải thiện chẩn đoán bệnh?
A. Phân tích cảm xúc của bệnh nhân.
B. Phân tích hình ảnh y tế.
C. Dự đoán xu hướng thời trang.
D. Tối ưu hóa chuỗi cung ứng.
9. Trong lĩnh vực logistics, khoa học dữ liệu có thể được sử dụng để tối ưu hóa điều gì?
A. Thiết kế sản phẩm.
B. Tuyển dụng nhân viên.
C. Lộ trình vận chuyển.
D. Chiến dịch quảng cáo.
10. Trong thống kê, kiểm định giả thuyết (hypothesis testing) được sử dụng để làm gì?
A. Tính toán trung bình của một mẫu.
B. Ước lượng phương sai của một tổng thể.
C. Đưa ra quyết định về một giả thuyết dựa trên dữ liệu mẫu.
D. Trực quan hóa dữ liệu.
11. Phương pháp nào sau đây thường được sử dụng để giảm số chiều dữ liệu trong phân tích kinh doanh, giúp đơn giản hóa mô hình và giảm nguy cơ overfitting?
A. Phân tích phương sai (ANOVA).
B. Phân tích hồi quy tuyến tính (Linear Regression).
C. Phân tích thành phần chính (PCA).
D. Phân tích chuỗi thời gian (Time Series Analysis).
12. Trong quản lý rủi ro tài chính, mô hình nào thường được sử dụng để ước tính giá trị có nguy cơ (Value at Risk - VaR)?
A. Mô hình hồi quy tuyến tính.
B. Mô hình Monte Carlo.
C. Mô hình ARIMA.
D. Mô hình K-means.
13. Kỹ thuật nào sau đây giúp giảm thiểu tác động của các giá trị ngoại lệ (outliers) trong dữ liệu?
A. Chuẩn hóa (Normalization).
B. Mã hóa (Encoding).
C. Rời rạc hóa (Discretization).
D. Winsorization.
14. Trong quản lý nhân sự, khoa học dữ liệu có thể được sử dụng để dự đoán điều gì?
A. Sở thích ăn uống của nhân viên.
B. Khả năng nghỉ việc của nhân viên.
C. Địa điểm du lịch yêu thích của nhân viên.
D. Loại xe nhân viên muốn mua.
15. Trong lĩnh vực bảo hiểm, mô hình nào thường được sử dụng để dự đoán xác suất xảy ra tai nạn hoặc rủi ro?
A. Mô hình hồi quy tuyến tính.
B. Mô hình phân loại.
C. Mô hình chuỗi thời gian.
D. Mô hình cụm.
16. Trong phân tích rủi ro tín dụng, biến nào sau đây thường được sử dụng để đánh giá khả năng trả nợ của khách hàng?
A. Địa chỉ email.
B. Lịch sử tín dụng.
C. Sở thích cá nhân.
D. Hoạt động trên mạng xã hội.
17. Trong kinh tế học, thuật ngữ `độ co giãn của cầu theo giá` đo lường điều gì?
A. Sự thay đổi về lượng cung khi giá thay đổi.
B. Sự thay đổi về lượng cầu khi thu nhập thay đổi.
C. Sự thay đổi về lượng cầu khi giá thay đổi.
D. Sự thay đổi về giá khi lượng cung thay đổi.
18. Trong kinh tế lượng, hiện tượng đa cộng tuyến xảy ra khi nào?
A. Các biến độc lập có phương sai lớn.
B. Có sự tương quan tuyến tính hoàn hảo hoặc gần hoàn hảo giữa hai hay nhiều biến độc lập trong mô hình hồi quy.
C. Giá trị của biến phụ thuộc không thay đổi theo thời gian.
D. Số lượng quan sát nhỏ hơn số lượng biến độc lập.
19. Chỉ số nào sau đây đo lường mức độ tập trung của một ngành công nghiệp, thường được sử dụng để đánh giá cạnh tranh thị trường?
A. Chỉ số giá tiêu dùng (CPI).
B. Chỉ số Herfindahl-Hirschman (HHI).
C. Chỉ số thất nghiệp.
D. Chỉ số tăng trưởng GDP.
20. Trong phân tích mạng xã hội, độ đo nào thể hiện mức độ quan trọng của một nút (người dùng) trong mạng lưới?
A. Độ dài đường đi ngắn nhất.
B. Độ trung tâm (Centrality).
C. Độ kết nối.
D. Độ phân tán.
21. Phương pháp nào sau đây được sử dụng để đánh giá hiệu quả của một mô hình phân loại?
A. R-squared.
B. Mean Squared Error (MSE).
C. Confusion Matrix.
D. Root Mean Squared Error (RMSE).
22. Trong phân tích dữ liệu, phương pháp nào được sử dụng để điền các giá trị bị thiếu trong một tập dữ liệu?
A. Chuẩn hóa (Normalization).
B. Imputation.
C. Mã hóa (Encoding).
D. Rời rạc hóa (Discretization).
23. Phương pháp nào sau đây thường được sử dụng để phân tích cảm xúc của khách hàng từ các đánh giá sản phẩm trực tuyến?
A. Phân tích hồi quy (Regression Analysis).
B. Phân tích phương sai (ANOVA).
C. Xử lý ngôn ngữ tự nhiên (NLP).
D. Phân tích cụm (Cluster Analysis).
24. Trong quản lý chuỗi cung ứng, khoa học dữ liệu có thể được sử dụng để dự đoán điều gì?
A. Sở thích của khách hàng.
B. Nhu cầu sản phẩm.
C. Hiệu quả của quảng cáo.
D. Hành vi của đối thủ cạnh tranh.
25. Trong phân tích dữ liệu lớn, kỹ thuật MapReduce được sử dụng để làm gì?
A. Trực quan hóa dữ liệu.
B. Làm sạch dữ liệu.
C. Xử lý song song các tập dữ liệu lớn.
D. Mã hóa dữ liệu.
26. Khi một mô hình học máy hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra, hiện tượng này được gọi là gì?
A. Underfitting.
B. Overfitting.
C. Regularization.
D. Normalization.
27. Trong lĩnh vực tài chính, thuật toán nào thường được sử dụng để phát hiện gian lận thẻ tín dụng dựa trên lịch sử giao dịch?
A. K-means clustering.
B. Support Vector Machine (SVM).
C. Apriori algorithm.
D. Linear Regression.
28. Trong phân tích chuỗi cung ứng, chỉ số nào sau đây đo lường thời gian cần thiết để chuyển đổi nguyên liệu thô thành sản phẩm hoàn chỉnh?
A. Vòng quay hàng tồn kho.
B. Chu kỳ chuyển đổi tiền mặt.
C. Thời gian sản xuất.
D. Tỷ lệ lấp đầy đơn hàng.
29. Mục tiêu chính của việc sử dụng thuật toán Apriori trong phân tích giỏ hàng là gì?
A. Dự đoán giá của sản phẩm.
B. Tìm các tập hợp mục thường xuyên xuất hiện cùng nhau.
C. Phân loại khách hàng dựa trên hành vi mua hàng.
D. Giảm số lượng sản phẩm trong giỏ hàng.
30. Đâu là một thách thức lớn trong việc áp dụng khoa học dữ liệu vào kinh doanh?
A. Thiếu phần mềm phân tích dữ liệu.
B. Khả năng tiếp cận dữ liệu.
C. Thiếu nhân lực có kỹ năng phân tích dữ liệu.
D. Chi phí phần cứng giảm.