Soal Pilihan Ganda PDF - Big Data, Teknologi Hadoop
Document Details

Uploaded by SatisfiedDenouement
Tags
Summary
Kumpulan soal pilihan ganda dalam bahasa Indonesia ini membahas konsep Big Data, teknologi Hadoop, dan berbagai studi kasus terkait pemrosesan data. Soal-soal ini dirancang untuk menguji pemahaman tentang analisis data dan infrastruktur Big Data.
Full Transcript
**1. Menganalisis Konsep Big Data (C4 - Analyzing)** Perusahaan teknologi X ingin meningkatkan sistem deteksi fraud menggunakan Big Data. Data transaksi yang dianalisis memiliki volume sangat besar, berasal dari berbagai sumber, dan harus diproses dalam waktu nyata. Berdasarkan karakteristik 5V dal...
**1. Menganalisis Konsep Big Data (C4 - Analyzing)** Perusahaan teknologi X ingin meningkatkan sistem deteksi fraud menggunakan Big Data. Data transaksi yang dianalisis memiliki volume sangat besar, berasal dari berbagai sumber, dan harus diproses dalam waktu nyata. Berdasarkan karakteristik 5V dalam Big Data, faktor utama yang harus diperhatikan dalam kasus ini adalah: A. Volume dan Value\ B. Variety dan Velocity\ C. Velocity dan Veracity\ D. Veracity dan Variety **Jawaban:** C. Velocity dan Veracity **2. Evaluasi Teknologi Hadoop (C5 - Evaluating)** Seorang data engineer ingin mengoptimalkan pemrosesan Big Data pada klaster Hadoop. Saat ini, sistem sering mengalami bottleneck saat menangani data dalam jumlah besar. Teknologi mana yang paling tepat digunakan untuk meningkatkan efisiensi pemrosesan?\ A. Menggunakan HDFS tanpa replikasi data\ B. Menerapkan MapReduce untuk semua jenis query\ C. Menggunakan Apache Spark untuk pemrosesan data secara in-memory\ D. Menggunakan YARN tanpa pengelolaan sumber daya **Jawaban:** C. Menggunakan Apache Spark untuk pemrosesan data secara in-memory **3. Studi Kasus Pemrosesan Data (C5 - Evaluating)** Sebuah perusahaan retail ingin menganalisis tren pembelian pelanggan selama satu tahun terakhir. Data yang digunakan sangat besar, tetapi tidak memerlukan hasil analisis secara langsung dalam hitungan detik. Teknologi pemrosesan yang paling sesuai untuk kebutuhan ini adalah:\ A. Pemrosesan batch menggunakan Hadoop MapReduce\ B. Pemrosesan streaming menggunakan Apache Flink\ C. Pemrosesan real-time menggunakan Apache Kafka\ D. Pemrosesan hybrid menggunakan Lambda Architecture **Jawaban:** A. Pemrosesan batch menggunakan Hadoop MapReduce **4. Menggunakan Big Data untuk Pengambilan Keputusan (C6 - Creating)** Seorang analis data ingin membuat laporan visualisasi tren penjualan produk menggunakan Big Data. Alat analisis dan visualisasi mana yang paling tepat digunakan untuk tugas ini?\ A. MySQL dan Microsoft Excel\ B. Apache Hive dan Tableau\ C. PostgreSQL dan Jupyter Notebook\ D. MongoDB dan Power BI **Jawaban:** B. Apache Hive dan Tableau. **5. Optimalisasi Infrastruktur Big Data (C6 - Creating)** Sebuah perusahaan media sosial mengalami peningkatan jumlah pengguna yang sangat pesat, menyebabkan lonjakan besar dalam jumlah data yang harus diproses setiap detik. Untuk memastikan sistem tetap responsif dan skalabel, solusi terbaik yang dapat diterapkan adalah: A. Menyimpan semua data dalam satu server dengan kapasitas besar untuk mengurangi latensi\ B. Menggunakan sistem database relasional tradisional untuk menyimpan dan memproses data\ C. Menerapkan arsitektur terdistribusi dengan Hadoop dan memanfaatkan Apache Spark untuk pemrosesan cepat\ D. Menghapus sebagian besar data lama agar sistem tidak terbebani **Jawaban:** **C. Menerapkan arsitektur terdistribusi dengan Hadoop dan memanfaatkan Apache Spark untuk pemrosesan cepat**