Đề 3 – Đề thi, câu hỏi trắc nghiệm online Dữ liệu lớn (BigData)

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Dữ liệu lớn (BigData)

Đề 3 - Đề thi, câu hỏi trắc nghiệm online Dữ liệu lớn (BigData)

1. Ứng dụng nào sau đây KHÔNG phải là một ứng dụng phổ biến của Big Data?

A. Phân tích hành vi khách hàng trong bán lẻ.
B. Dự đoán thời tiết.
C. Chỉnh sửa ảnh cá nhân.
D. Phát hiện gian lận trong tài chính.

2. Công nghệ nào sau đây cho phép tạo ra các ứng dụng phân tích dữ liệu tương tác và trực quan trên Big Data?

A. Hadoop MapReduce.
B. Apache Zeppelin.
C. HDFS.
D. Hive.

3. Trong Big Data, `Value` (Giá trị) đề cập đến yếu tố nào?

A. Kích thước của dữ liệu.
B. Tốc độ xử lý dữ liệu.
C. Giá trị kinh tế và thông tin chiết xuất từ dữ liệu.
D. Độ tin cậy của dữ liệu.

4. Công nghệ nào sau đây cho phép xử lý dữ liệu trong bộ nhớ (in-memory processing) để tăng tốc độ phân tích Big Data?

A. Hadoop MapReduce.
B. Apache Spark.
C. HDFS.
D. Hive.

5. Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm lưu trữ dữ liệu?

A. YARN.
B. MapReduce.
C. HDFS (Hadoop Distributed File System).
D. Hive.

6. Công nghệ nào sau đây thường được sử dụng để xử lý song song dữ liệu lớn trên nhiều máy tính?

A. Microsoft Excel.
B. Hadoop.
C. Microsoft Word.
D. Adobe Photoshop.

7. Trong ngữ cảnh của Big Data, đặc điểm `Volume` đề cập đến điều gì?

A. Độ chính xác của dữ liệu.
B. Số lượng dữ liệu được tạo ra và lưu trữ.
C. Tốc độ xử lý dữ liệu.
D. Sự đa dạng của các loại dữ liệu.

8. Công cụ nào sau đây là một NoSQL database được sử dụng rộng rãi trong các ứng dụng Big Data?

A. MySQL.
B. PostgreSQL.
C. MongoDB.
D. Microsoft SQL Server.

9. Ưu điểm chính của việc sử dụng NoSQL database so với relational database trong Big Data là gì?

A. Hỗ trợ tốt hơn cho các giao dịch ACID.
B. Khả năng mở rộng và linh hoạt tốt hơn để xử lý dữ liệu phi cấu trúc và bán cấu trúc.
C. Hiệu suất truy vấn tốt hơn cho các truy vấn phức tạp.
D. Bảo mật dữ liệu tốt hơn.

10. Công cụ nào sau đây thường được sử dụng để thu thập dữ liệu từ các nguồn khác nhau và đưa vào Hadoop?

A. Hive.
B. Pig.
C. Flume.
D. HBase.

11. Trong Big Data, thuật ngữ `Machine Learning` (Học máy) được sử dụng để làm gì?

A. Để lưu trữ dữ liệu.
B. Để trực quan hóa dữ liệu.
C. Để xây dựng các mô hình dự đoán và phân tích từ dữ liệu.
D. Để mã hóa dữ liệu.

12. Yếu tố nào sau đây KHÔNG phải là một trong `5Vs` đặc trưng của Big Data?

A. Volume.
B. Variety.
C. Veracity.
D. Volatility.

13. Khái niệm `Data Mining` (Khai thác dữ liệu) trong Big Data liên quan đến điều gì?

A. Việc thu thập dữ liệu từ các nguồn khác nhau.
B. Việc tìm kiếm các mẫu, xu hướng và thông tin hữu ích từ các tập dữ liệu lớn.
C. Việc mã hóa dữ liệu để bảo mật.
D. Việc nén dữ liệu để tiết kiệm không gian lưu trữ.

14. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu lớn?

A. Microsoft Access.
B. Tableau.
C. Notepad.
D. Command Prompt.

15. Trong Big Data, thuật ngữ `Data Governance` (Quản trị dữ liệu) đề cập đến điều gì?

A. Việc mã hóa dữ liệu để bảo mật.
B. Việc quản lý và đảm bảo chất lượng, tính toàn vẹn và khả năng sử dụng của dữ liệu.
C. Việc nén dữ liệu để tiết kiệm không gian lưu trữ.
D. Việc thu thập dữ liệu từ các nguồn khác nhau.

16. Thuật ngữ `Data Lake` (Hồ dữ liệu) trong Big Data dùng để chỉ điều gì?

A. Một loại cơ sở dữ liệu quan hệ.
B. Một kho lưu trữ dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc ở định dạng gốc của nó.
C. Một công cụ trực quan hóa dữ liệu.
D. Một phương pháp mã hóa dữ liệu.

17. Công nghệ nào sau đây cho phép truyền dữ liệu tốc độ cao giữa các hệ thống trong Big Data?

A. HDFS.
B. Apache Kafka.
C. Hive.
D. Hadoop MapReduce.

18. Trong Big Data, thuật ngữ `ETL` viết tắt của cụm từ nào?

A. Extract, Transform, Load.
B. Evaluate, Test, Learn.
C. Encrypt, Transfer, Locate.
D. Enter, Track, Log.

19. Ngôn ngữ lập trình nào thường được sử dụng với Hadoop để xử lý và phân tích dữ liệu?

A. C++.
B. Java.
C. Pascal.
D. Assembly.

20. Trong Big Data, thuật ngữ `Data Wrangling` (Chuẩn bị dữ liệu) đề cập đến công đoạn nào?

A. Mã hóa dữ liệu.
B. Làm sạch, chuyển đổi và chuẩn bị dữ liệu để phân tích.
C. Nén dữ liệu.
D. Thu thập dữ liệu.

21. Trong bối cảnh Big Data, kiến trúc Lambda (Lambda Architecture) được sử dụng để giải quyết vấn đề nào?

A. Bảo mật dữ liệu.
B. Xử lý đồng thời cả dữ liệu batch và stream.
C. Tối ưu hóa chi phí lưu trữ.
D. Quản lý siêu dữ liệu.

22. Trong Big Data, `Variety` (Tính đa dạng) đề cập đến điều gì?

A. Số lượng dữ liệu.
B. Tốc độ xử lý dữ liệu.
C. Các loại và định dạng dữ liệu khác nhau.
D. Độ tin cậy của dữ liệu.

23. Công cụ nào sau đây là một giải pháp lưu trữ dữ liệu cột (columnar data store) được sử dụng trong Big Data?

A. MongoDB.
B. HBase.
C. MySQL.
D. PostgreSQL.

24. Trong Big Data, `Velocity` (Vận tốc) dùng để chỉ yếu tố nào?

A. Độ tin cậy của dữ liệu.
B. Tốc độ tạo ra và xử lý dữ liệu.
C. Kích thước của dữ liệu.
D. Sự phức tạp của dữ liệu.

25. Công cụ nào sau đây được sử dụng để xây dựng các pipeline dữ liệu (data pipelines) phức tạp trong Big Data?

A. Tableau.
B. Apache Kafka.
C. Apache Airflow.
D. Microsoft Excel.

26. Trong Big Data, `Veracity` (Độ tin cậy) đề cập đến khía cạnh nào?

A. Sự đa dạng của các nguồn dữ liệu.
B. Tính chính xác và độ tin cậy của dữ liệu.
C. Tốc độ xử lý dữ liệu.
D. Kích thước của dữ liệu.

27. Trong Big Data, thuật ngữ `Data Visualization` (Trực quan hóa dữ liệu) được sử dụng để làm gì?

A. Để mã hóa dữ liệu.
B. Để biểu diễn dữ liệu bằng hình ảnh, biểu đồ và các phương tiện trực quan khác để giúp người dùng dễ dàng hiểu và phân tích dữ liệu.
C. Để nén dữ liệu.
D. Để thu thập dữ liệu.

28. Công cụ nào sau đây cung cấp một giao diện SQL để truy vấn dữ liệu trong Hadoop?

A. Spark.
B. Pig.
C. Hive.
D. Flume.

29. Framework nào sau đây được thiết kế để xử lý dữ liệu thời gian thực trong Big Data?

A. Hadoop MapReduce.
B. Apache Spark Streaming.
C. HDFS.
D. Hive.

30. Trong Big Data, `Data Scientist` (Nhà khoa học dữ liệu) là người chịu trách nhiệm chính cho công việc nào?

A. Quản lý cơ sở dữ liệu.
B. Phát triển ứng dụng web.
C. Phân tích dữ liệu, xây dựng mô hình dự đoán và đưa ra các khuyến nghị dựa trên dữ liệu.
D. Thiết kế giao diện người dùng.

1 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

1. Ứng dụng nào sau đây KHÔNG phải là một ứng dụng phổ biến của Big Data?

2 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

2. Công nghệ nào sau đây cho phép tạo ra các ứng dụng phân tích dữ liệu tương tác và trực quan trên Big Data?

3 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

3. Trong Big Data, 'Value' (Giá trị) đề cập đến yếu tố nào?

4 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

4. Công nghệ nào sau đây cho phép xử lý dữ liệu trong bộ nhớ (in-memory processing) để tăng tốc độ phân tích Big Data?

5 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

5. Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm lưu trữ dữ liệu?

6 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

6. Công nghệ nào sau đây thường được sử dụng để xử lý song song dữ liệu lớn trên nhiều máy tính?

7 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

7. Trong ngữ cảnh của Big Data, đặc điểm 'Volume' đề cập đến điều gì?

8 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

8. Công cụ nào sau đây là một NoSQL database được sử dụng rộng rãi trong các ứng dụng Big Data?

9 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

9. Ưu điểm chính của việc sử dụng NoSQL database so với relational database trong Big Data là gì?

10 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

10. Công cụ nào sau đây thường được sử dụng để thu thập dữ liệu từ các nguồn khác nhau và đưa vào Hadoop?

11 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

11. Trong Big Data, thuật ngữ 'Machine Learning' (Học máy) được sử dụng để làm gì?

12 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

12. Yếu tố nào sau đây KHÔNG phải là một trong '5Vs' đặc trưng của Big Data?

13 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

13. Khái niệm 'Data Mining' (Khai thác dữ liệu) trong Big Data liên quan đến điều gì?

14 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

14. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu lớn?

15 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

15. Trong Big Data, thuật ngữ 'Data Governance' (Quản trị dữ liệu) đề cập đến điều gì?

16 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

16. Thuật ngữ 'Data Lake' (Hồ dữ liệu) trong Big Data dùng để chỉ điều gì?

17 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

17. Công nghệ nào sau đây cho phép truyền dữ liệu tốc độ cao giữa các hệ thống trong Big Data?

18 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

18. Trong Big Data, thuật ngữ 'ETL' viết tắt của cụm từ nào?

19 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

19. Ngôn ngữ lập trình nào thường được sử dụng với Hadoop để xử lý và phân tích dữ liệu?

20 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

20. Trong Big Data, thuật ngữ 'Data Wrangling' (Chuẩn bị dữ liệu) đề cập đến công đoạn nào?

21 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

21. Trong bối cảnh Big Data, kiến trúc Lambda (Lambda Architecture) được sử dụng để giải quyết vấn đề nào?

22 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

22. Trong Big Data, 'Variety' (Tính đa dạng) đề cập đến điều gì?

23 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

23. Công cụ nào sau đây là một giải pháp lưu trữ dữ liệu cột (columnar data store) được sử dụng trong Big Data?

24 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

24. Trong Big Data, 'Velocity' (Vận tốc) dùng để chỉ yếu tố nào?

25 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

25. Công cụ nào sau đây được sử dụng để xây dựng các pipeline dữ liệu (data pipelines) phức tạp trong Big Data?

26 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

26. Trong Big Data, 'Veracity' (Độ tin cậy) đề cập đến khía cạnh nào?

27 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

27. Trong Big Data, thuật ngữ 'Data Visualization' (Trực quan hóa dữ liệu) được sử dụng để làm gì?

28 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

28. Công cụ nào sau đây cung cấp một giao diện SQL để truy vấn dữ liệu trong Hadoop?

29 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

29. Framework nào sau đây được thiết kế để xử lý dữ liệu thời gian thực trong Big Data?

30 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 3

30. Trong Big Data, 'Data Scientist' (Nhà khoa học dữ liệu) là người chịu trách nhiệm chính cho công việc nào?