16 Soal (Pilihan Ganda) Data Mining dan Jawaban
Contoh Soal Pilgan Tentang Data Mining
1. Apa yang dimaksud dengan "time series analysis" dalam Data Mining?
A. Menganalisis data spasial dalam ruang tiga dimensi
B. Menganalisis data yang berkaitan dengan waktu secara berurutan
C. Mengelompokkan data ke dalam cluster berdasarkan waktu
D. Mengidentifikasi outlier dalam dataset berdasarkan waktu
Jawaban:
B. Menganalisis data yang berkaitan dengan waktu secara berurutan
2. Apa kegunaan metode "apriori" dalam Data Mining?
A. Mencari pola frekuensi itemset dalam dataset
B. Mengurangi dimensi data dengan memilih subset atribut yang paling relevan
C. Mengidentifikasi data yang tidak normal
D. Menemukan pola tersembunyi dalam data dengan menggunakan teknik kompresi
Jawaban:
A. Mencari pola frekuensi itemset dalam dataset
3. Apa yang dimaksud dengan "ensemble learning" dalam Machine Learning?
A. Menggabungkan beberapa model prediktif untuk meningkatkan kinerja
B. Menggabungkan atribut dari beberapa dataset yang berbeda
C. Menggabungkan teknik klasifikasi dan clustering
D. Menggabungkan data numerik dan data kategorikal dalam satu dataset
Jawaban:
A. Menggabungkan beberapa model prediktif untuk meningkatkan kinerja
4. Algoritma Support Vector Machine (SVM) digunakan untuk:
A. Mengelompokkan data ke dalam cluster
B. Mencari pola frekuensi itemset dalam dataset
C. Memprediksi kelas target dengan mencari batas pemisah optimal
D. Mengidentifikasi data yang tidak normal
Jawaban:
C. Memprediksi kelas target dengan mencari batas pemisah optimal
5. Apa yang dimaksud dengan "data imputation" dalam Data Mining?
A. Menggabungkan data dari sumber yang berbeda
B. Mengganti data yang hilang dengan nilai yang diestimasi
C. Menghapus data yang tidak relevan dalam dataset
D. Menemukan pola tersembunyi dalam data dengan menggunakan teknik kompresi
Jawaban:
B. Mengganti data yang hilang dengan nilai yang diestimasi
6. Apa yang dimaksud dengan "web mining" dalam Data Mining?
A. Menganalisis pola dan struktur hyperlink di web
B. Menganalisis data yang dihasilkan oleh pengguna web
C. Mencari pola frekuensi itemset dalam dataset
D. Mengurangi dimensi data dengan mengubah ke dalam format yang lebih ringkas
Jawaban:
A. Menganalisis pola dan struktur hyperlink di web
7. Apa yang dimaksud dengan "neural networks" dalam Machine Learning?
A. Model yang terdiri dari beberapa input dan output
B. Model yang belajar dengan menerapkan aturan logika
C. Model yang menggunakan fungsi matematis untuk memodelkan hubungan antara input dan output
D. Model yang belajar dengan menyesuaikan bobot yang menghubungkan input dan output
Jawaban:
D. Model yang belajar dengan menyesuaikan bobot yang menghubungkan input dan output
8. Apa kegunaan metode "k-nearest neighbors" (k-NN) dalam Data Mining?
A. Mengelompokkan data ke dalam cluster
B. Menggabungkan data dari sumber yang berbeda
C. Mencari pola frekuensi itemset dalam dataset
D. Memprediksi kelas target berdasarkan atribut yang mirip dengan tetangga terdekat
Jawaban:
D. Memprediksi kelas target berdasarkan atribut yang mirip dengan tetangga terdekat
9. Apa yang dimaksud dengan "text mining" dalam Data Mining?
A. Menganalisis pola dalam data teks
B. Menganalisis pola dan struktur hyperlink di web
C. Mengelompokkan data ke dalam cluster berdasarkan teks yang terkandung
D. Mencari pola frekuensi itemset dalam dataset teks
Jawaban:
A. Menganalisis pola dalam data teks
10. Metode "hierarchical clustering" digunakan untuk:
A. Mengelompokkan data ke dalam cluster berdasarkan kemiripan hierarkis
B. Menggabungkan data dari sumber yang berbeda
C. Mencari pola frekuensi itemset dalam dataset
D. Memprediksi kelas target berdasarkan atribut yang mirip dengan tetangga terdekat
Jawaban:
A. Mengelompokkan data ke dalam cluster berdasarkan kemiripan hierarkis
11. Apa yang dimaksud dengan "big data" dalam konteks Data Mining?
A. Data yang memiliki ukuran yang sangat besar dan kompleks
B. Data yang berasal dari berbagai sumber yang berbeda
C. Data yang memiliki banyak atribut dan variabel
D. Data yang tidak memerlukan proses preprocessing
Jawaban:
A. Data yang memiliki ukuran yang sangat besar dan kompleks
12. Apa yang dimaksud dengan "data visualization" dalam Data Mining?
A. Representasi grafis dari data untuk memahami pola dan tren
B. Menggabungkan data dari sumber yang berbeda
C. Mencari pola frekuensi itemset dalam dataset
D. Mengurangi dimensi data dengan mengubah ke dalam format yang lebih ringkas
Jawaban:
A. Representasi grafis dari data untuk memahami pola dan tren
13. Algoritma Genetic Algorithm digunakan untuk:
A. Mengelompokkan data ke dalam cluster
B. Mencari pola frekuensi itemset dalam dataset
C. Memprediksi kelas target dengan menggunakan aturan genetika
D. Mengidentifikasi data yang tidak normal
Jawaban:
C. Memprediksi kelas target dengan menggunakan aturan genetika
14. Apa yang dimaksud dengan "unsupervised learning" dalam Machine Learning?
A. Model belajar dari data tanpa label
B. Model belajar dari data dengan label yang diketahui
C. Model belajar dengan melakukan eksplorasi interaktif pada data
D. Model belajar dengan memperhatikan feedback pengguna
Jawaban:
A. Model belajar dari data tanpa label
15. Apa yang dimaksud dengan "ensemble methods" dalam Machine Learning?
A. Menggabungkan beberapa model prediktif untuk meningkatkan kinerja
B. Menggabungkan atribut dari beberapa dataset yang berbeda
C. Menggabungkan teknik klasifikasi dan clustering
D. Menggabungkan data numerik dan data kategorikal dalam satu dataset
Jawaban:
A. Menggabungkan beberapa model prediktif untuk meningkatkan kinerja
16. Metode "association rule pruning" digunakan untuk:
A. Mengurangi dimensi data dengan memilih subset atribut yang paling relevan
B. Mengidentifikasi outlier dalam dataset
C. Mencari pola frekuensi itemset dalam dataset secara efisien
D. Menemukan pola tersembunyi dalam data dengan menggunakan teknik kompresi
Jawaban:
C. Mencari pola frekuensi itemset dalam dataset secara efisien