1. Đâu là một thách thức lớn trong việc quản lý và xử lý Big Data?
A. Sự thiếu hụt các công cụ phần mềm.
B. Chi phí lưu trữ và xử lý dữ liệu.
C. Sự đơn giản của các thuật toán phân tích.
D. Khả năng dự đoán chính xác tương lai.
2. Ứng dụng nào sau đây của Big Data có thể giúp các thành phố cải thiện quản lý giao thông?
A. Dự đoán thời tiết.
B. Phân tích dữ liệu từ cảm biến giao thông.
C. Phân tích các yêu cầu bồi thường.
D. Quản lý tài chính cá nhân.
3. Trong ngữ cảnh Big Data, `Hadoop Distributed File System (HDFS)` được sử dụng để làm gì?
A. Thực hiện các phép tính toán học phức tạp.
B. Lưu trữ dữ liệu trên một cluster các máy tính.
C. Truy vấn dữ liệu bằng ngôn ngữ SQL.
D. Trực quan hóa dữ liệu.
4. Ứng dụng nào sau đây của Big Data có thể giúp các tổ chức y tế cải thiện chăm sóc bệnh nhân?
A. Dự đoán thời tiết.
B. Phân tích tình hình giao thông.
C. Phân tích dữ liệu bệnh sử và kết quả điều trị.
D. Quản lý tài chính cá nhân.
5. Trong Big Data, thuật ngữ `Schema on Read` có nghĩa là gì?
A. Cấu trúc dữ liệu được xác định trước khi dữ liệu được ghi vào hệ thống.
B. Cấu trúc dữ liệu được xác định khi dữ liệu được đọc từ hệ thống.
C. Dữ liệu được lưu trữ dưới dạng XML.
D. Dữ liệu được lưu trữ dưới dạng JSON.
6. Trong Big Data, `CAP theorem` đề cập đến những yếu tố nào?
A. Consistency, Availability, Partition Tolerance.
B. Capacity, Agility, Performance.
C. Cost, Accuracy, Privacy.
D. Complexity, Adaptability, Reliability.
7. Công cụ nào sau đây thường được sử dụng để quản lý cluster Hadoop?
A. Microsoft Word.
B. YARN.
C. Notepad.
D. Command Prompt.
8. Trong Big Data, `MapReduce` là gì?
A. Một ngôn ngữ lập trình.
B. Một framework lập trình để xử lý song song lượng lớn dữ liệu.
C. Một hệ thống quản lý cơ sở dữ liệu.
D. Một công cụ trực quan hóa dữ liệu.
9. Trong Big Data, `NoSQL` là viết tắt của cụm từ nào?
A. No Structure Query Language.
B. Not Only SQL.
C. New Object SQL.
D. Network Oriented SQL.
10. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu Big Data?
A. Microsoft Word.
B. Tableau.
C. Notepad.
D. Command Prompt.
11. Công cụ nào sau đây thường được sử dụng để truy vấn dữ liệu trong Hadoop?
A. Java.
B. Python.
C. SQL.
D. C++.
12. Trong Big Data, thuật ngữ `Data wrangling` đề cập đến điều gì?
A. Quá trình thu thập dữ liệu từ nhiều nguồn khác nhau.
B. Quá trình làm sạch, chuyển đổi và chuẩn hóa dữ liệu.
C. Quá trình khám phá các mẫu và thông tin hữu ích từ dữ liệu.
D. Quá trình lưu trữ dữ liệu trong Data Lake.
13. Trong Big Data, thuật ngữ `Data Lakehouse` kết hợp ưu điểm của Data Lake và công nghệ nào?
A. Data Warehouse.
B. Data Mart.
C. Data Cube.
D. Data Stream.
14. Trong Big Data, thuật ngữ `Data virtualization` đề cập đến điều gì?
A. Quá trình thu thập dữ liệu từ nhiều nguồn khác nhau.
B. Quá trình tạo ra một lớp trừu tượng cho phép truy cập dữ liệu từ nhiều nguồn khác nhau mà không cần di chuyển dữ liệu.
C. Quá trình khám phá các mẫu và thông tin hữu ích từ dữ liệu.
D. Quá trình lưu trữ dữ liệu trong Data Lake.
15. Ứng dụng nào sau đây KHÔNG phải là một ứng dụng phổ biến của Big Data?
A. Phân tích hành vi khách hàng.
B. Dự đoán bảo trì thiết bị.
C. Tối ưu hóa chuỗi cung ứng.
D. Thiết kế logo.
16. Trong Big Data, thuật ngữ `Data lineage` đề cập đến điều gì?
A. Quá trình thu thập dữ liệu từ nhiều nguồn khác nhau.
B. Quá trình theo dõi nguồn gốc, chuyển đổi và dòng chảy của dữ liệu từ khi nó được tạo ra đến khi nó được sử dụng.
C. Quá trình khám phá các mẫu và thông tin hữu ích từ dữ liệu.
D. Quá trình lưu trữ dữ liệu trong Data Lake.
17. Công nghệ nào sau đây thường được sử dụng để xử lý và phân tích dữ liệu lớn?
A. Microsoft Excel.
B. Hadoop.
C. Microsoft Access.
D. Adobe Photoshop.
18. Khái niệm `Real-time processing` trong Big Data ám chỉ đến điều gì?
A. Xử lý dữ liệu sau khi nó đã được lưu trữ trong Data Warehouse.
B. Xử lý dữ liệu ngay khi nó được tạo ra.
C. Xử lý dữ liệu hàng loạt theo lịch trình định kỳ.
D. Xử lý dữ liệu bằng các thuật toán Machine Learning.
19. Trong kiến trúc Big Data, Data Lake được sử dụng để làm gì?
A. Lưu trữ dữ liệu đã được xử lý và chuyển đổi.
B. Lưu trữ dữ liệu thô ở định dạng gốc của nó.
C. Thực hiện các phép tính phức tạp trên dữ liệu.
D. Trực quan hóa dữ liệu.
20. Công nghệ nào sau đây thường được sử dụng để xử lý dòng dữ liệu (data streaming) trong Big Data?
A. Hadoop.
B. Spark Streaming.
C. Microsoft Excel.
D. Adobe Photoshop.
21. Công nghệ nào sau đây thường được sử dụng để xây dựng các hệ thống cơ sở dữ liệu NoSQL?
A. Microsoft Word.
B. MongoDB.
C. Notepad.
D. Command Prompt.
22. Trong Big Data, thuật ngữ `Data Governance` đề cập đến điều gì?
A. Quá trình thu thập dữ liệu từ nhiều nguồn khác nhau.
B. Quá trình làm sạch và chuẩn hóa dữ liệu.
C. Tập hợp các chính sách và quy trình để đảm bảo chất lượng, bảo mật và tuân thủ của dữ liệu.
D. Quá trình lưu trữ dữ liệu trong Data Lake.
23. Trong Big Data, `Lambda architecture` kết hợp hai phương pháp xử lý dữ liệu chính nào?
A. Batch processing và real-time processing.
B. Data mining và data warehousing.
C. Data virtualization và data integration.
D. Data governance và data security.
24. Công nghệ nào sau đây thường được sử dụng để xây dựng các ứng dụng Machine Learning trên Big Data?
A. Microsoft Word.
B. TensorFlow.
C. Notepad.
D. Command Prompt.
25. Ứng dụng nào sau đây của Big Data có thể giúp các công ty bảo hiểm phát hiện gian lận?
A. Dự đoán thời tiết.
B. Phân tích tình hình giao thông.
C. Phân tích các yêu cầu bồi thường.
D. Quản lý tài chính cá nhân.
26. Trong ngữ cảnh Big Data, đặc điểm `Volume` đề cập đến điều gì?
A. Sự đa dạng của các loại dữ liệu khác nhau.
B. Tốc độ tạo ra và xử lý dữ liệu.
C. Quy mô lớn của dữ liệu được tạo ra và lưu trữ.
D. Độ chính xác và tin cậy của dữ liệu.
27. Ứng dụng nào sau đây của Big Data có thể giúp các nhà sản xuất tối ưu hóa quy trình sản xuất?
A. Dự đoán thời tiết.
B. Phân tích tình hình giao thông.
C. Phân tích dữ liệu cảm biến từ thiết bị.
D. Quản lý tài chính cá nhân.
28. Thuật ngữ `Data Mining` trong Big Data đề cập đến điều gì?
A. Quá trình thu thập dữ liệu từ nhiều nguồn khác nhau.
B. Quá trình làm sạch và chuẩn hóa dữ liệu.
C. Quá trình khám phá các mẫu và thông tin hữu ích từ dữ liệu.
D. Quá trình lưu trữ dữ liệu trong Data Lake.
29. Yếu tố nào sau đây KHÔNG phải là một trong `5Vs` của Big Data?
A. Volume.
B. Velocity.
C. Veracity.
D. Volatility.
30. Ứng dụng nào sau đây của Big Data có thể giúp các nhà bán lẻ cải thiện trải nghiệm khách hàng?
A. Dự đoán thời tiết.
B. Phân tích tình hình giao thông.
C. Cá nhân hóa đề xuất sản phẩm.
D. Quản lý tài chính cá nhân.