Modul 4 Dasar-Dasar Statistik PDF
Document Details
Imam Machdi, Pudji Ismartini, Ahlam, Ernani Suhartati, Nur Rachmawati, Elfirda Nisa Ramadhanira
Tags
Summary
Modul ini membahas dasar-dasar statistik, mulai dari pengertian data dan indikator hingga penggunaan tabel dan grafik. Materi ini juga mencakup analisis korelasi, angka indeks, dan latihan soal. Ini sangat cocok sebagai referensi belajar untuk memahami dan mengaplikasikan metode statistik.
Full Transcript
i i Modul 4 DASAR-DASAR STATISTIK ISBN: - No. Publikasi: 03200.2116 Katalog: 1202102 Ukuran Buku: 18,2 x 25,7 cm Jumlah Halaman: xvi + 165 halaman Naskah: Direktorat Diseminasi Statistik Gambar Kulit: Direktorat Diseminasi Statistik Diterbitkan oleh: Badan Pusat Statistik, Jakarta-Indonesia...
i i Modul 4 DASAR-DASAR STATISTIK ISBN: - No. Publikasi: 03200.2116 Katalog: 1202102 Ukuran Buku: 18,2 x 25,7 cm Jumlah Halaman: xvi + 165 halaman Naskah: Direktorat Diseminasi Statistik Gambar Kulit: Direktorat Diseminasi Statistik Diterbitkan oleh: Badan Pusat Statistik, Jakarta-Indonesia Dicetak oleh: Badan Pusat Statistik, Jakarta-Indonesia Dilarang mengumumkan, mendistribusikan, mengomunikasikan, dan/atau menggandakan sebagian atau seluruh isi buku ini untuk tujuan komersial tanpa izin tertulis dari Badan Pusat Statistik. ii TIM PENYUSUN Pengarah: Imam Machdi Penanggung Jawab: Pudji Ismartini Penulis: Ahlam Ernani Suhartati Nur Rachmawati Elfirda Nisa Ramadhanira iii iv vi Daftar Isi Kata Pengantar..................................................................................................................... v Daftar Isi................................................................................................................................vii Daftar Gambar...................................................................................................................... xi Daftar Tabel......................................................................................................................... xv BAB 1. Pendahuluan........................................................................................................... 1 1.1. Latar Belakang......................................................................................................... 3 1.2. Deskripsi Singkat.................................................................................................... 4 1.3. Materi Pokok............................................................................................................. 4 1.4. Manfaat....................................................................................................................... 4 BAB 2. Data Statistik dan Indikator.............................................................................. 5 2.1. Pengertian Data dan Statistik............................................................................ 7 2.1.1. Pengertian Data.............................................................................................. 7 2.1.2. Pengertian Statistik....................................................................................... 8 2.2. Jenis Data.................................................................................................................... 9 2.2.1. Data menurut Cara Pengukuran........................................................... 10 2.2.2. Data menurut Tingkat Pengukuran.................................................... 10 2.2.3. Data menurut Waktu Pengumpulan................................................... 13 2.2.4. Data menurut Sumber.............................................................................. 13 2.2.5. Data menurut Cara Memperolehnya.................................................. 13 2.2.6. Data menurut Teknik Pengumpulan Data........................................ 14 2.3. Syarat Data Statistik yang Baik...................................................................... 17 2.4. Pengertian dan Jenis-jenis Variabel............................................................. 20 2.4.1. Pengertian Variabel................................................................................... 20 2.4.2. Jenis-jenis Variabel.................................................................................... 20 2.5. Pengertian Indikator.......................................................................................... 22 BAB 3. Statistik yang Sering Digunakan................................................................... 25 3.1. Penggunaan Penimbang.................................................................................... 27 3.2. Pola Data.................................................................................................................. 29 3.2.1. Ukuran Lokasi atau Ukuran Pemusatan............................................ 29 vii a. Rata-rata Hitung (Aritmatik)...................................................................... 31 b. Rata-rata Ukur (Geometric Mean) Data Tunggal................................ 40 c. Median.................................................................................................................. 43 d. Modus................................................................................................................... 44 e. Ketentuan Penggunaan Rata-rata Hitung, Median, dan Modus.................................................................................................................. 44 3.2.2.Sebaran data (pada data tidak berkelompok).................................. 45 3.2.3.Box Plot sebagai Alat Identifikasi Sebaran Data.............................. 51 3.3. Total........................................................................................................................... 55 3.4. Proporsi.................................................................................................................... 59 3.4.1. Penghitungan Proporsi pada Data Agregat...................................... 59 3.4.2. Penghitungan Proporsi pada Raw Data............................................. 60 3.5. Rasio.......................................................................................................................... 62 3.5.1. Penghitungan Rasio pada Data Agregat............................................ 62 3.5.2. Penghitungan Rasio pada Raw Data.................................................... 63 3.6. Latihan Soal............................................................................................................ 64 BAB 4. Penyajian Data..................................................................................................... 65 4.1. Tabel.......................................................................................................................... 67 4.1.1. Tabel Satu Arah (One Way Table)......................................................... 70 4.1.2. Tabel Dua Arah (Two Way Table)......................................................... 70 4.1.3. Tabel Tiga Arah (Three Way Table)..................................................... 71 4.2. Penggunaan Tabel Pivot.................................................................................... 72 4.3. Tabel Distribusi Frekuensi............................................................................... 79 4.4. Grafik......................................................................................................................... 82 4.4.1. Penentuan Jenis Grafik sesuai Data yang Disajikan...................... 83 4.4.2. Jenis Grafik..................................................................................................... 84 4.4.3. Infografis..................................................................................................... 112 4.4.4. Latihan Soal...................................................................................................... 115 BAB 5. Hubungan Antar Variabel............................................................................. 117 5.1. Analisis Korelasi................................................................................................ 119 5.1.1. Korelasi Linear Sederhana................................................................... 119 viii 5.1.2. Diagram Pencar.........................................................................................121 5.1.3. Koefisien Korelasi.....................................................................................124 5.1.4. Penafsiran Koefisien Korelasi..............................................................124 5.1.5. Koefisien Korelasi Pearson...................................................................126 5.1.6. Koefisien Korelasi Spearman...............................................................128 5.1.7. Koefisien Determinasi............................................................................129 5.2. Latihan Soal..........................................................................................................130 BAB 6. Angka Indeks..................................................................................................... 133 6.1. Pengertian Indeks..............................................................................................135 6.2. Kegunaan angka indeks...................................................................................136 6.3. Cara Menentukan Periode Dasar.................................................................136 6.4. Teknik Penghitungan Angka Indeks..........................................................137 6.4.1. Angka Indeks Tertimbang.....................................................................138 6.4.2. Angka Indeks Berantai...........................................................................157 6.5. Kriteria Indeks yang Baik...............................................................................158 6.6. Indeks Komposit (IK).......................................................................................159 6.7. Beberapa Angka Indeks yang Dihasilkan Oleh BPS.............................160 6.7.1. Indeks Harga Konsumen (IHK)...........................................................160 6.7.2. Inflasi.............................................................................................................161 6.7.3. Nilai Tukar Petani (NTP).......................................................................162 6.8. Latihan Soal..........................................................................................................163 Daftar Pustaka................................................................................................................. 165 ix x Daftar Gambar Gambar 3.1. Perbandingan antara nilai rata-rata dan sebaran data di Desa A (nilai konsumsi hampir seragam dan tidak ada nilai pencilan)... 32 Gambar 3.2. Perbandingan antara nilai rata-rata dan sebaran data di Desa B (nilai konsumsi sangat beragam da nada nilai pencilan)................ 32 Gambar 3.3. Contoh Penghitungan Rata-rata Hitung Sederhana dengan Microsoft Excel.................................................................................................. 34 Gambar 3.4. Penghitungan rata-rata tertimbang pada software Microsoft Excel...................................................................................................................... 36 Gambar 3.5. Hasil penghitungan rata-rata tertimbang.............................................. 36 Gambar 3.6. Contoh penghitungan rata-rata tertimbang yang salah................... 37 Gambar 3.7. Penghitungan rata-rata hitung pada data berkelompok dengan Microsoft Excel.................................................................................................. 39 Gambar 3.8. Hasil Penghitungan rata-rata hitung pada data berkelompok...... 40 Gambar 3.9. Dua macam penggunaan rumus rata-rata perubahan...................... 41 Gambar 3.10. Penghitungan standard deviation dengan Microsoft Excel............. 48 Gambar 3.11. Contoh publikasi yang menampilkan ukuran akurasi data (RSE) (Sumber: Publikasi SUTAS 2018 Seri A1).............................................. 50 Gambar 3.12. Contoh penghitungan minimum, Q1, median, Q3, maksimum, dan IQR pada Microsoft Excel..................................................................... 53 Gambar 3.13. Tampilan jendela “graph box – Box plots” pada aplikasi Stata 14.0........................................................................................................................ 54 Gambar 3.14. Output box plot.................................................................................................. 54 Gambar 3.15. Penghitungan estimasi total jumlah petani di Pulau Sumatera.... 57 Gambar 3.16. Penghitungan estimasi total dengan Microsoft Excel....................... 58 Gambar 3.17. Ilustrasi sebaran proporsi suatu karakteristik dalam populasi... 59 Gambar 3.18. Sebaran proporsi karyawan di Puskesmas Bahagia.......................... 60 xi Gambar 3.19. Sebaran persentase karyawan di Puskesmas Bahagia..................... 60 Gambar 3.20. Data survei tentang partisipasi sekolah penduduk usia 5 tahun ke atas................................................................................................................... 61 Gambar 4.1. Contoh pembuatan tabel............................................................................... 68 Gambar 4.2. Contoh penyajian tabel pada Statistik Indonesia Tahun 2020...... 69 Gambar 4.3. Menu PivotTable pada Microsoft Excel................................................... 74 Gambar 4.4. Kotak dialog Create PivotTable.................................................................. 75 Gambar 4.5. Bidang Pivot Table Kosong dan PivotTable Fields............................. 75 Gambar 4.6. Pembuatan Tabel Pivot.................................................................................. 78 Gambar 4.7. Hasil tabel pivot dan pemilihan field pada PivotTable Fields........ 79 Gambar 4.8. Contoh sumbu x dan y pada penyajian grafik...................................... 84 Gambar 4.9. Menampilkan data dalam grafik garis tunggal menggunakan Microsoft Excel.................................................................................................. 86 Gambar 4.10. Grafik Perkembangan Jumlah Sepeda Motor di DKI Jakarta.......... 86 Gambar 4.11. Grafik Perkembangan Jumlah Kendaraan Bermotor di DKI Jakarta, 2008 – 2012 (Juta).......................................................................... 87 Gambar 4.12. Pembuatan grafik garis komponen berganda dengan menggunakan Microsoft Excel.................................................................... 90 Gambar 4.13. Grafik Perkembangan Jumlah Kendaraan Bermotor di DKI Jakarta, 2008 – 2012 (Juta).......................................................................... 91 Gambar 4.14. Pembuatan grafik garis komponen berganda dalam persentase dengan menggunakan Microsoft Excel.................................................... 93 Gambar 4.15. Grafik Perkembangan Persentase Kendaraan Bermotor di DKI Jakarta, 2008 – 2012 (Juta).......................................................................... 94 Gambar 4.16. Perkembangan Nilai Ekspor dan Impor Melalui DKI Jakarta, 2009 – 2012 (000 US $)................................................................................. 95 Gambar 4.17. Pembuatan grafik batang tunggal di Microsoft Excel........................ 96 Gambar 4.18. Nilai Ekspor Produk DKI Jakarta menurut Negara Tujuan, 2012 (Juta US $)............................................................................................................ 97 xii Gambar 4.19. Jumlah Penduduk DKI Jakarta menurut Kabupaten/ Kota dan Jenis Kelamin, 2012........................................................................................ 98 Gambar 4.20. Jumlah Penduduk DKI Jakarta menurut Jenis Kelamin dan Kabupaten/Kota, 2012.................................................................................. 98 Gambar 4.21. Grafik Proyeksi Jumlah Penduduk DKI Jakarta menurut Kabupaten/Kota dan Jenis Kelamin, 2012............................................ 100 Gambar 4.22. Persentase Proyeksi Penduduk DKI Jakarta menurut Jenis Kelamin dan Kab/Kota, 2012...................................................................... 102 Gambar 4.23. Jumlah Proyeksi Penduduk DKI Jakarta menurut Kab/Kota, 2012....................................................................................................................... 103 Gambar 4.24. Pembuatan grafik lingkaran di Microsoft Excel.................................. 104 Gambar 4.25. Persentase Nilai Ekspor Produk DKI Jakarta menurut Negara Tujuan, 2012...................................................................................................... 104 Gambar 4.26. Grafik Kepadatan Penduduk Per Km2 Menurut Kabupaten/Kota di DKI Jakarta, 2012........................................................................................ 105 Gambar 4.27. Kurva Ogive Tabel Distribusi Frekuensi Berat Badan...................... 112 Gambar 4.28. Contoh Infografis mengenai Hasil Sensus Penduduk 2020............ 113 Gambar 5.1. Contoh Grafik Korelasi Linear Positif...................................................... 121 Gambar 5.2. Contoh Grafik Korelasi Linear Negatif.................................................... 122 Gambar 5.3. Contoh Grafik Korelasi hampir Sempurna............................................ 122 Gambar 5.4. Contoh Grafik tidak ada Korelasi............................................................... 122 Gambar 5.5. Scatter diagram dari Rata-rata Lama Sekolah dan Tingkat Kemiskinan Provinsi X, 2017...................................................................... 124 Gambar 5.6. Penghitungan koefisien korelasi dengan Microsoft Excel.............. 126 Gambar 5.7. Penghitungan koefisien korelasi Pearson di Microsoft Excel........ 127 Gambar 5.8. Hasil penghitungan koefisien korelasi Pearson.................................. 128 Gambar 6.1. Penghitungan Indeks Laspeyres (1)........................................................ 140 Gambar 6.2. Penghitungan Indeks Laspeyres (2)........................................................ 141 Gambar 6.3. Penghitungan Indeks Laspeyres (3)........................................................ 141 xiii Gambar 6.4. Penghitungan Indeks Laspeyres (4)......................................................... 142 Gambar 6.5. Penghitungan Indeks Laspeyres (5)......................................................... 142 Gambar 6.6. Penghitungan Indeks Laspeyres (6)......................................................... 143 Gambar 6.7. Penghitungan Indeks Paasche (1)............................................................. 145 Gambar 6.8. Penghitungan Indeks Paasche (2)............................................................. 145 Gambar 6.9. Penghitungan Indeks Paasche (3)............................................................. 146 Gambar 6.10. Penghitungan Indeks Paasche (4)............................................................. 146 Gambar 6.11. Penghitungan Indeks Paasche (5)............................................................. 147 Gambar 6.12. Penghitungan Indeks Paasche (6)............................................................. 147 Gambar 6.13. Perkalian indeks Laspeyres dan indeks Paasche................................ 149 Gambar 6.14. Penghitungan indeks Fisher........................................................................ 149 Gambar 6.15. Pertambahan indeks Laspeyres dan indeks Paasche........................ 150 Gambar 6.16. Penghitungan indeks Drobisch................................................................... 150 Gambar 6.17. Penghitungan indeks nilai (1)..................................................................... 152 Gambar 6.18. Penghitungan indeks nilai (2)..................................................................... 152 Gambar 6.19. Penghitungan indeks nilai (3)..................................................................... 152 Gambar 6.20. Penghitungan indeks nilai (4)..................................................................... 153 Gambar 6.21. Penghitungan indeks nilai (5)..................................................................... 153 Gambar 6.22. Penghitungan indeks Marshal Edgewarth (1)..................................... 155 Gambar 6.23. Penghitungan indeks Marshal Edgewarth (1)..................................... 155 Gambar 6.24. Penghitungan indeks Marshal Edgewarth (2)..................................... 156 Gambar 6.25. Penghitungan indeks Marshal Edgewarth (3)..................................... 156 Gambar 6.26. Penghitungan indeks Marshal Edgewarth (4)..................................... 157 xiv Daftar Tabel Tabel 2.1. Data Peserta Diklat Pelatihan Dasar.................................................................. 9 Tabel 3.1. Jumlah Produksi Barang A menurut Jumlah Hari Kerja per Bulan Tahun 2002............................................................................................................... 35 Tabel 3.2. Data Jumlah Murid di SDN 01........................................................................... 39 Tabel 3.3. Tabel simulasi penghitungan IPM berdasarkan rata-rata hitung dan rata-rata ukur pada IPM...................................................................................... 43 Tabel 3.4. Data produksi padi di suatu kecamatan....................................................... 46 Tabel 3.5. Jumlah Petani Menurut Provinsi dan Jenis Kelamin, 2018................... 56 Tabel 3.6. Data luas panen setiap rumah tangga di suatu kecamatan................... 58 Tabel 4.1. Nilai Ekspor Batu Apung dan Sejenisnya Menurut Negara Tujuan Utama Tahun 2019................................................................................................ 70 Tabel 4.2. Proyeksi Jumlah Penduduk DKI Jakarta Menurut Jenis Kelamin....... 71 Tabel 4.3. Jumlah TKI Menurut Kawasan/Negara Penempatan dan Jenis Kelamin...................................................................................................................... 71 Tabel 4.4. Data Ekspor Negara “A” menurut Komoditas dan Tujuan.................... 76 Tabel 4.5. Bentuk Tabel Distribusi Frekuensi................................................................. 81 Tabel 4.6. Data berat badan anggota gimnasium........................................................... 81 Tabel 4.7. Distribusi Frekuensi berat badan anggota gimnasium.......................... 82 Tabel 4.8. Perkembangan Jumlah Sepeda Motor........................................................... 85 Tabel 4.9. Jumlah Kendaraan Bermotor di DKI Jakarta, 2008–2012..................... 87 Tabel 4.10. Perhitungan Kumulatif Jumlah Kendaraan Bermotor di DKI Jakarta Tahun 2018-2012.................................................................................................. 89 Tabel 4.11. Persentase Jumlah Kendaraan Bermotor..................................................... 91 Tabel 4.12. Tabel kumulatif Perkembangan Persentase Kendaraan Bermotor di DKI Jakarta, 2008 – 2012 (Juta)....................................................................... 92 xv Tabel 4.13. Perkembangan Nilai Ekspor dan Impor Melalui DKI Jakarta, 2009 – 2012 (000 US $)...................................................................................................... 94 Tabel 4.14. Nilai Ekspor Produk DKI Jakarta menurut Negara Tujuan, 2012 (Juta US $).................................................................................................................. 96 Tabel 4.15. Kumulatif Proyeksi Jumlah Penduduk DKI Jakarta, Dirinci Menurut Jenis Kelamin............................................................................................................ 99 Tabel 4.16. Proyeksi Jumlah Penduduk DKI Jakarta, Dirinci Menurut Jenis Kelamin....................................................................................................................... 101 Tabel 4.17. Contoh tabel "Kurang dari" dan "Lebih dari".............................................. 111 Tabel 4.18. Data Produksi Kota “A” menurut Komoditas Tahun 2015-2017........ 115 Tabel 5.1. Rata-rata Lama Sekolah dan Tingkat Kemiskinan Provinsi X, 2017. 123 Tabel 5.2. Data Jam Kerja Dan Target yang Telah Dicapai oleh Karyawan Perusahaan “D” Tahun 2020.............................................................................. 125 Tabel 5.3. Data Jumlah Puskesmas Dan Tingkat Kematian (Per 1000 Penduduk) Di Kabupaten “D” (2012-2017)................................................ 127 Tabel 5.4. Contoh Perhitungan Koefisien Korelasi Spearman.................................. 129 Tabel 5.5. Data jam belajar dan nilai ujian siswa Kelas A........................................... 130 Tabel 6.1. Tabel Perhitungan Indeks Harga Laspeyres 5 Macam Hasil Pertanian di Jakarta Tahun 2002-2003........................................................ 140 Tabel 6.2. Penghitungan Indeks Harga Paasche 5 Macam Hasil Pertanian di Jakarta Tahun 2002 – 2003................................................................................ 144 Tabel 6.3. Harga dan Jumlah Barang yang Terjual di Departement Store A pada Tahun 2000 dan 2005.......................................................................................... 151 Tabel 6.4. Harga dan Kuantitas dari 5 barang untuk tahun 2003 dan tahun 2004............................................................................................................................. 154 Tabel 6.5. Tabel Harga Komoditas A dari tahun 2010 – 2014.................................. 158 Tabel 6.6. Harga dan kuantitas 5 komoditas hasil pertanian Tahun 2004 dan 2005 di Kota A......................................................................................................... 163 xvi BAB 1. Pendahuluan BAB 1 PENDAHULUAN Pendahuluan 1 BAB I Pendahuluan 2 Pendahuluan 1.1. Latar Belakang Undang-undang No. 16 Tahun 1997 tentang Statistik, memilah penyelenggaraan statistik menjadi tiga, yaitu statistik dasar, statistik sektoral, dan statistik khusus. Statistik dasar diselenggarakan oleh Badan Pusat Statistik (BPS), statistik sektoral diselenggarakan oleh instansi pemerintah selain BPS, sedangkan statistik khusus diselenggarakan oleh masyarakat, baik perorangan maupun lembaga/perusahaan. Berdasarkan ketentuan peraturan perundang-undangan, BPS tidak hanya menjadi penyelenggara statistik dasar, tetapi juga sebagai pembina statistik. Oleh sebab itu, BPS perlu menyiapkan sumber daya yang memadai untuk mendukung penyelenggaraan statistik sektoral. Salah satu yang dilakukan adalah melakukan peningkatan kemampuan sumber daya. Dalam peningkatan kemampuan inilah perlu disusun bahan-bahan ajar yang mudah dipahami dan dilaksanakan oleh penyelenggara urusan statistik di kementerian/lembaga maupun pemerintah daerah. Modul Dasar-Dasar Statistik merupakan salah satu dari beberapa modul pembelajaran yang dirancang untuk peningkatan kemampuan penyelenggara statistik sektoral. Penyelenggaraan statistik sektoral selain dilengkapi dengan pengetahuan proses bisnis penyelenggaraan statistik pada Modul Tata Laksana Penyelenggaraan Kegiatan Statistik, Modul Langkah Praktis dalam Survei dan Kompromin, serta Modul Aplikasi Penyelenggaraan Kegiatan Statistik yang menjabarkan contoh kegiatan statistik dari masing-masing kedeputian di BPS, juga perlu dibekali terkait dengan teori dasar statistik. Modul ini merupakan modul yang berisikan teori dasar statistik. Modul ini mengantarkan para peserta untuk memahami akan arti penting statistik, ukuran-ukuran statistik, dan dasar-dasar penghitungannya. Selain itu, modul ini juga dilengkapi dengan beberapa metode penyajian dan analisis serta pemanfaatan teknologi informasi dalam melakukan proses pengolahan data. Pendahuluan 3 BAB I Pendahuluan 1.2. Deskripsi Singkat Modul ini membahas tentang dasar-dasar statistik, baik dalam menentukan jenis data, ketepatan alat hitung/ukur, ketepatan penyajian, maupun pengenalan analisis. Pengenalan analisis ini hanya dibatasi pada beberapa alat analisis yang sering digunakan. 1.3. Materi Pokok Materi pokok yang dibahas dalam modul ini antara lain: 1) Data statistik dan indikator, 2) Statistik yang sering digunakan, 3) Penyajian data, 4) Hubungan antar variabel, 5) Angka indeks. 1.4. Manfaat Berbekal hasil belajar pada Modul Dasar-dasar Statistik, peserta diharapkan mampu menerapkan beberapa metode statistik pada unit kerjanya. Pada akhirnya diharapkan juga peserta dapat meningkatkan kinerja instansi. 4 Pendahuluan BAB 2. Data Statistik dan Indikator BAB 2 DATA STATISTIK DAN INDIKATOR Data Statistik dan Indikator 5 BAB I Pendahuluan 6 Data Statistik dan Indikator 2.1. Pengertian Data dan Statistik Sebelum pembahasan mengenai statistik secara lebih lanjut, perlu adanya pemahaman/pengertian terhadap data dan statistik terlebih dahulu. Dalam penggunaan biasa, istilah data dan informasi sering dipertukarkan, padahal sesungguhnya secara konsep berbeda. Demikian juga data dan statistik sering dianggap sama saja. Untuk mendapatkan gambaran yang lebih pas, berikut ini diberikan konsep/pengertian dari istilah–istilah tersebut. 2.1.1. Pengertian Data Dalam Kamus Besar Bahasa Indonesia (KBBI), data berarti sekumpulan keterangan yang benar atau nyata. Keterangan tersebut bisa berupa angka, huruf, simbol atau gambar. Sejalan dengan pengertian data menurut KBBI, Undang-Undang Nomor 16 Tahun 1997 tentang Statistik menjelaskan bahwa data didefinisikan sebagai informasi berupa angka tentang karakteristik (ciri- ciri) suatu populasi. Definisi data pada undang-undang tersebut dilengkapi pada Peraturan Presiden Republik Indonesia Nomor 39 Tahun 2019 tentang Satu Data Indonesia, yang dituliskan bahwa “Data adalah catatan atas kumpulan fakta atau deskripsi berupa angka, karakter, simbol, gambar, peta, tanda, isyarat, tulisan, suara, dan/atau bunyi, yang merepresentasikan keadaan sebenarnya atau menunjukkan suatu ide, objek, kondisi, atau situasi”. Data merupakan bentuk jamak dari datum, berasal dari bahasa Latin yang berarti "sesuatu yang diberikan". Dalam penggunaan sehari-hari, data berarti suatu pernyataan yang diterima secara apa adanya. Dari sudut pandang bisnis, data bisnis adalah deskripsi organisasi tentang sesuatu (resources) dan kejadian (transactions) yang terjadi. Pengertian yang lain menyebutkan bahwa data adalah deskripsi dari suatu kejadian yang kita hadapi. Kata data bisa berarti juga fakta mentah dan tidak terukur, yang bila diolah akan menjadi suatu informasi. Atau dengan kata lain tujuan mendasar dari pengumpulan dan pengolahan data adalah untuk menghasilkan informasi. Data Statistik dan Indikator 7 BAB I Pendahuluan Meskipun data merupakan bahan utama informasi, perlu diingat bahwa tidak semua data relevan dan tepat waktu untuk menghasilkan informasi. 2.1.2. Pengertian Statistik Kata statistik sering menimbulkan bayangan akan angka dalam tabel atau grafik-grafik. Kata statistik berasal dari bahasa latin ”status”, yang dalam bahasa Inggris berarti state yang diartikan dalam bahasa Indonesia sebagai ”pernyataan” (Johnson and Bhattacharya, 2010). Memang dalam pengertian awam, statistik bersinonim dengan data, dalam bahasa Inggris disebut dengan statistic. Statistik dalam hal ini juga biasa dikenal dengan informasi, karena telah melalui proses pengolahan, analisis, dan penyajian yang tepat dan menjadi bermakna. Dalam metode sampling, angka statistik bersumber pada data sampel, sedangkan jika bersumber dari data populasi dinamakan parameter. Statistika berarti suatu ilmu yang berkaitan dengan data, dalam bahasa Inggris dikenal dengan istilah statistics. Namun, dalam modul ini selanjutnya kata statistik diartikan sebagai produk kegiatan statistik, khususnya pengumpulan, pengolahan data, meringkas, dan menginterpretasikan sampai pada pengambilan keputusan (Johnson and Bhattacharya, 2010). Apakah suatu statistik sudah berupa informasi? Jawabanya bisa subjektif, tergantung kebutuhan khusus pengguna sendiri karena suatu tabel statistik mungkin sudah merupakan informasi bagi A tetapi belum bagi B (sebab masih perlu diolah lagi). Sementara itu, yang dimaksud dengan data statistik adalah deskripsi numerik dari aspek kuantitatif sesuatu. Namun demikian, tidak semua deskripsi numerik adalah data statistik; dikatakan data statistik jika mempunyai ciri-ciri sebagai berikut. Harus dalam bentuk agregat (seperti: jumlah, rata-rata, proporsi, persentase, dan rasio). Perubahan karakteristik fenomena yang diteliti disebabkan oleh sejumlah kekuatan yang bekerja secara simultan. Contoh: perubahan 8 Data Statistik dan Indikator yang terjadi pada tingkat penjualan, kualitas produk, jumlah penduduk, dan sebagainya. Diperoleh dengan cara pencacahan/pengukuran atau diestimasi dari data sampel berdasarkan standar akurasi yang memadai. Harus dikumpulkan secara sistematik bagi maksud/tujuan yang telah ditetapkan sebelumnya. Oleh karena itu, pada Peraturan Badan Pusat Statistik tentang Petunjuk Teknis Standar Data Statistik, dikatakan bahwa “Data Statistik adalah data berupa angka tentang karakteristik atau ciri khusus suatu populasi yang diperoleh dengan cara pengumpulan, pengolahan, penyajian, dan analisis”. Contoh data statistik: Tabel 2.1. Data Peserta Diklat Pelatihan Dasar No. Variabel Nilai (1) (2) (3) 1. Jumlah Peserta Laki-laki (orang) 16 2. Jumlah Peserta Perempuan (orang) 9 3. Rata-rata umur peserta (tahun) 27 4. Rata-rata nilai ujian komprehensif 87,48 5. Nilai minimum ujian komprehensif 76 6. Nilai maksimum ujian komprehensif 100 2.2. Jenis Data Setelah memahami pengertian data dan statistik, tentunya perlu diperluas wawasan tentang jenis-jenisnya sehingga dapat digunakan sebagai dasar penyusunan kuesioner pengumpulan data, pengolahan data, dan penentuan metode analisis yang tepat. Penggunaan data secara tidak tepat, baik terkait sifat dan jenis data, dapat menimbulkan kekeliruan atau bias dalam penyusunan interpretasi dan kesimpulan. Jenis data dapat dibagi berdasarkan Data Statistik dan Indikator 9 BAB I Pendahuluan sifat, sumber, cara memperoleh, waktu pengumpulan, dan skalanya, sebagai berikut. 2.2.1. Data menurut Cara Pengukuran Menurut Abuzar, 2017, data menurut cara pengukurannya dibedakan menurut dua tipe, yaitu: a. Data kualitatif adalah data yang menunjukkan kualitas, mutu, suatu objek atau pun gambaran suatu fenomena, proses, kejadian/peristiwa dan lain- lain yang dinyatakan dalam bentuk perkataan (tidak berbentuk angka). Namun dalam prakteknya, data kualitatif sering dikuantifikasikan atau disimbolkan dalam bentuk angka agar memungkinkan dilakukannya penghitungan dan analisis secara statistik. Misalnya pada data jenis kelamin: diberi angka 1 untuk laki-laki dan diberi angka 2 untuk perempuan. Biasanya data kualitatif diperoleh berdasarkan pengukuran ciri, sifat, karakter, atau pun berdasarkan pengukuran persepsi atau pandangan/opini unit pengamatan. Data kualitatif tidak dapat dihitung secara matematis. Contoh: data tentang suasana kerja, kualitas pelayanan sebuah rumah sakit, atau gaya kepemimpinan, dll. b. Data kuantitatif adalah data yang berbentuk angka dan dapat dilakukan operasi matematis. Biasanya data kuantitatif diperoleh melalui pengukuran metrik (metric measurement) atau berdasarkan penghitungan (countinig) (Abuzar, 2017). Contoh: harga saham, nilai pendapatan, dll. Penggunaan data kuantitatif dalam penelitian dinilai lebih objektif karena bersifat nyata/konkret untuk dijadikan bukti ilmiah. 2.2.2. Data menurut Tingkat Pengukuran Berdasarkan tingkat pengukurannya, masing-masing data kuantitatif dan data kualitatif menghasilkan skala pengukuran yang berbeda, tergantung pada sifat data. Skala pengukuran merupakan acuan yang digunakan untuk mengubah data hasil pengukuran suatu variabel menjadi data kuantitatif. Pada dasarnya skala pengukuran dapat digunakan dalam berbagai bidang. Dengan 10 Data Statistik dan Indikator menentukan skala pengukuran, nilai variabel yang diukur dengan instrumen tertentu bisa dalam bentuk angka, sehingga lebih akurat, efisien, dan komunikatif. Misalnya berat emas 20 gram, suhu badan orang sehat 37 derajat Celsius, IQ seseorang 150. Dengan demikian, data kuantitatif dapat dibedakan menurut skala pengukuran (Singgih Santoso, 2000&2005). Skala data kualitatif dapat dibedakan menurut tingkat pengukurannya, yaitu: a. Skala nominal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi. Data nominal merupakan ukuran yang paling sederhana karena angka-angka yang diberikan kepada objek penelitian hanya sebagai label, tidak menunjukkan tingkatan apapun. Oleh karena itu, operasi matematika (perkalian, penjumlahan, pengurangan atau pembagian) tidak dapat dilakukan pada data nominal karena tidak bermakna. Misalnya, jenis pekerjaan diklasifikasikan dalam pegawai negeri (kode 1) , pegawai swasta (kode 2 ) dan wiraswata (kode 3). Dari contoh itu, tidak mungkin dilakukan operasi matematik seperti 3-2=1 (wiraswasta – pegawai negeri = pegawai swasta). Begitu pula penjumlahan angka kode tersebut tidak dapat dimaknai. b. Skala ordinal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi, tetapi di antara data tersebut terdapat urutan (order) atau tingkatan tertentu. Operasi matematika juga tidak bisa dilakukan pada data ordinal. Misalnya, kepuasan pelanggan, diklasifikasikan sebagai: sangat puas (diberi tanda 1), puas (diberi tanda 2), cukup puas (diberi tanda 3), tidak puas (diberi tanda 4), dan sangat tidak puas (diberi tanda 5). Posisi tanda 1 lebih tinggi dibanding tanda 2, tetapi tidak bisa dijumlahkan 1+2=3 (artinya tidak bisa dimaknai sangat puas ditambah puas = cukup puas). Sedangkan data kuantitatif yang berdasarkan pengukuran numerik memiliki skata pengukuran sebagai berikut: a. Skala interval adalah data yang berupa nilai berurutan dan masing-masing memiliki jarak atau perbedaan yang bermakna (Abuzar, 2017). Namun, jarak tersebut bukan merupakan kelipatan karena angka nol dalam skala Data Statistik dan Indikator 11 BAB I Pendahuluan interval tidak dianggap nilai nol mutlak. Ini berbeda dengan skala ordinal, yang jarak antara dua titiknya tidak diperhatikan (seperti berapa jarak antara puas dan tidak puas, yang sebenarnya menyangkut perasaan orang saja). Operasi matematika bisa dilakukan pada data interval. Misalnya: Dua orang murid mendapat nilai ujian yang berbeda; si A mendapat 70 sedangkan si B mendapat nilai 35. Dalam kasus tersebut, tidak dapat dikatakan si A dua kali lebih pandai dibanding si B karena nilai tersebut tidak bisa dikatakan kelipatan; nilai 0 dalam penilaian ujian tersebut bukan nilai mutlak dan tidak diartikan sebagai nihilnya kepandaian seseorang. Temperatur ruangan bisa diukur dalam Celsius atau Fahrenheit, yang masing-masing punya skala sendiri. Ukuran derajat air membeku sampai mendidih pada skala Celsius adalah antara 0° C sampai 100° C. Skala ini jelas jaraknya, bahwa 100-0=100; sedangkan pada skala Fahrenheit adalah antara 32° F sampai 212° F. Skala ini jelas jaraknya, 212-32=180, tetapi tidak dapat dikatakan dalam kelipatan (karena nilai 0° tidak mutlak, nilai 0°pada Celsius berbeda dengan nilai 0° pada Fahrenheit). b. Skala Rasio adalah data yang mencakup semua skala di atas, meliputi jarak dua titik pada skala sudah diketahui dan memberikan nilai absolut pada objek yang diukur karena mempunyai titik nol yang absolut. Ini berbeda dengan skala interval yang tidak ada titik nol mutlak/absolut. Operasi matematika dapat dilakukan pada data rasio; hasil penghitungannya memiliki makna terhadap objek yang diukur. Misalnya, jumlah buku di kelas sebanyak lima, berarti ada lima buku. Jika nol, berarti tidak ada buku (nol absolut). Pada data rasio tidak ada kategorisasi atau pemberian kode. Operasi matematika dapat dilakukan pada data rasio, misalnya, 100 cm + 35 cm = 135 cm, 5 mangga + 2 mangga = 7 mangga. 12 Data Statistik dan Indikator 2.2.3. Data menurut Waktu Pengumpulan Data dapat dikumpulkan pada beberapa waktu yang berbeda, maka data berdasarkan waktu pengumpulannya dapat dibedakan menjadi dua tipe. a. Data cross section adalah data yang dikumpulkan pada suatu waktu tertentu (at a point of time) untuk menggambarkan keadaan dan kegiatan pada waktu tersebut. Misalnya data penelitian yang menggunakan kuesioner. b. Data berkala (time series data) adalah data yang dikumpulkan dari waktu ke waktu untuk melihat perkembangan suatu kejadian/kegiatan selama periode tersebut. Misalnya, perkembangan uang beredar, harga 9 macam bahan pokok penduduk. 2.2.4. Data menurut Sumber Bila dilihat dari sudut pandang suatu organisasi, menurut sumbernya data dibedakan menjadi dua jenis. a. Data internal adalah data dari dalam suatu organisasi yang menggambarkan keadaan organisasi tersebut. Contohnya: suatu perusahaan, jumlah karyawannya, jumlah modalnya, atau jumlah produksinya, dll. b. Data eksternal adalah data dari luar suatu organisasi yang dapat menggambarkan faktor-faktor yang mungkin memengaruhi hasil kerja suatu organisasi. Misalnya: daya beli masyarakat memengaruhi hasil penjualan suatu perusahaan. 2.2.5. Data menurut Cara Memperolehnya Menurut cara memperolehnya, data terdiri dari dua tipe. a. Data primer (primary data) adalah data yang dikumpulkan sendiri oleh perorangan/suatu organisasi secara langsung dari objek yang diteliti dan untuk kepentingan studi yang bersangkutan yang dapat berupa interview, observasi. b. Data Sekunder (secondary data) adalah data yang diperoleh/di-kumpulkan tidak langsung dari objeknya, melainkan dikumpulkan dari sumber lain baik Data Statistik dan Indikator 13 BAB I Pendahuluan berupa studi-studi sebelumnya atau yang diterbitkan oleh berbagai instansi lain. Biasanya sumber tidak langsung berupa data dokumentasi dan arsip- arsip resmi. 2.2.6. Data menurut Teknik Pengumpulan Data Data dapat diperoleh melalui cara pengumpulan data yang bereda-beda, yaitu sensus, survei, kompilasi produk administrasi, dan cara lain sesuai dengan perkembangan ilmu pengetahuan dan teknologi. Pengumpulan data secara sensus dan survei menghasilkan data primer yang diperoleh secara langsung dari objek yang diteliti. Data tersebut biasa disebut sebagai data mentah (raw data) yang berisi karakteristik setiap individu atau objek yang ditelitli. Pengggunaan data mentah untuk keperluan analisis perlu melalui proses pengolahan data terlebih dahulu, baik eksplorasi data, tabulasi, pembuatan model statistik, maupun uji statistik. Penggunaan data dan teknik pengolahan yang tepat sangat berpengaruh dalam pengambilan kesimpulan. Setiap cara pengolahan data memerlukan persyaratan tertentu, tergantung dari metode dan jenis data yang digunakan. Sehingga, sebelum melakukan pengolahan data, sangat penting memahami kondisi datanya terlebih dahulu, baik dari segi teknik pengumpulan data maupun skala data. Misalnya, ada data mentah yang dapat disajikan sampai wilayah setingkat desa/kelurahan; dan ada pula yang tidak dapat digunakan untuk menggambarkan suatu kelompok populasi tertentu. Begitu pula setiap metode analisis memerlukan persyaratan dari segi skala pengukuran data dan bahkan ada yang memerlukan suatu asumsi tertentu misalnya terkait distribusi probabilitas data yang digunakan. Dalam penggunaan data mentah untuk analisis, terlebih dahulu harus diketahui cara pengumpulan datanya. Oleh karena itu, sangat penting mengetahui metadata kegiatan statistik yang menghasilkan data tersebut. Metadata ini berisi informasi tentang kegiatan statistik antara lain terkait metode pengumpulan data, teknik pengambilan sampelnya (khusus survei), unit observasi, cakupan wilayah, domain penyajian hasil pengumpulan data, indikator pokok yang dihasilkan. Begitu pula apabila data merupakan agregat 14 Data Statistik dan Indikator hasil pengolahan data (misalnya berupa indikator yang disajikan dalam bentuk tabel), harus disertai dengan metadata indikator. Sehingga, perlu berhati-hati dalam pengambilan kesimpulan, karena dalam kegiatan statistik tidak menutup kemungkinan timbulnya faktor kesalahan dalam pengumpulan data. Dalam praktiknya, sesuai amanat UU No 16 Tahun 1997 Pasal 21, data individu yang disebarluaskan harus terjaga kerahasiaannya. Sehingga data individu hanya dapat dibagikan kepada khalayak bila sudah dilakukan anonimisasi (penggantian atau eliminasi identitas responden, seperti nama dan alamat). Namun ketika raw data hasil pengumpulan data dipergunakan oleh produsen data, maka proses anonimisasi tidak perlu dilakukan. Berikut ini gambaran dan penggunaan data mentah berdasarkan teknik atau cara pengumpulan data: a. Data sensus merupakan data karakteristik seluruh unit populasi yang diperoleh melalui pencacahan lengkap, baik wawancara langsung maupun secara online. Data mentah ini berisi baris-baris data individu yang dilengkapi dengan kolom/field identitas individu, keterangan wilayah, dan karateristik yang dikumpulkan. Data mentah hasil sensus dapat dilakukan pengolahan data untuk menghasilkan parameter populasi sesuai domainnya. Data sensus hasil pencacahan lengkap tidak memerlukan penimbang dalam melakukan generalisasi unit ke dalam populasi. b. Data survei merupakan data karakteristik sebagian unit populasi yang diperoleh melalui pencacahan sampel, baik wawancara langsung maupun secara online. Data mentah ini berisi baris-baris data individu yang dilengkapi dengan kolom/field identitas individu, keterangan wilayah, karateristik yang dikumpulkan, dan penimbang individu (selanjutnya disebut penimbang). Ada dua macam data survei, yaitu yang dikumpulkan dengan survei berkaidah peluang (probability sampling) dan tidak berkaidah peluang (nonprobability sampling) 1) Data hasil survei probability sampling Survei probability sampling merupakan cara pengumpulan data dari sebagian unit populasi (sampel) yang diambil dengan kaidah peluang. Data Statistik dan Indikator 15 BAB I Pendahuluan Sehingga setiap unit dalam sampel representative atau dapat mewakili sejumlah unit dalam populasinya. Data mentah yang dihasilkan dari survei probability sampling dilengkapi dengan penimbang individu (selanjutnya disebut penimbang). Agar data ini dapat digunakan untuk menghasilkan agregat pada domain tertentu sesuai kecukupan sampelnya, maka penimbang harus diikutsertakan dalam pengolahan data. 2) Data hasil survei nonprobability sampling Survei nonprobability sampling merupakan cara pengumpulan data dari sebagian unit populasi (sampel) yang diambil tanpa kaidah peluang. Misal survei yang pengambilan sampelnya secara purposive berdasarkan pertimbangan peneliti, sehingga setiap unit dalam sampel hanya mewakili dirinya sendiri. Penimbang unit sampel yang dipilih dengan cara ini bernilai 1, namun biasanya tidak disertakan pada set data, karena tidak berpengaruh dalam pengolahan data. Angka agregat yang diperoleh dari data semacam ini tidak dapat digunakan untuk generalisasi ke dalam populasi, melainkan hanya sebagai gambaran terhadap sampel yang diteliti. 3) Data hasil kompilasi produk administrasi Data ini biasanya merupakan agregat dari data administrasi. Bisa berupa total (jumlah), persentase, dan lain-lain, menurut domain tertentu. Sedangkan data administrasi sendiri, masih berupa data rinci hasil pencatatan atau registrasi. Seringkali struktur data administrasi tidak baku sehingga sulit diintegrasikan atau ditransfer ke dalam bentuk database. Penggunaan data produk administrasi dalam pengambilan kesimpulan harus memperhatikan basis datanya yang digunakan, apakah mencakup seluruh unit dalam populasi yang diteliti atau hanya sebagian. Misalnya Dinas Pertanian di suatu kecamatan ingin mengetahui jumlah petani di kecamatan untuk pembinaan di bidang pertanian. Data tersebut dapat dikumpulkan dari semua kelompok tani di wilayahnya. Namun, agar data akurat, perlu 16 Data Statistik dan Indikator dipastikan cakupan petani yang tercatat pada kelompok tani, sudah mencakup seluruh petani di kecamatan dan tidak ada yang terlewat. 2.3. Syarat Data Statistik yang Baik Data dan statistik yang dapat dimanfaatkan dalam berbagai sektor adalah data dan statistik yang memiliki kualitas yang baik agar tidak menyesatkan dalam pengambilan kesimpulan atau keputusan. Suatu penelitian atau penyusunan kebijakan yang didasari dengan data yang tidak berkualitas baik akan menimbulkan kekeliruan/bias dalam menyusun interpretasi dan kesimpulan sehingga tidak tepat bagi pemecahan masalah. Penilaian kualitas data dan statistik mencakup faktor-faktor sebagai berikut. a. Objektif Data yang objektif berarti data harus sesuai dengan keadaan yang sebenarnya (as it is) dan diungkapkan apa adanya dengan keterangan yang benar. Contoh data objektif misalnya dilaporkan berat badan ibu hamil usia kandungan 9 bulan rata-rata naik 17 kilogram yang diperoleh dari hasil pengukuran langsung terhadap pasien di suatu Puskesmas. Selain itu, contoh data tidak objektif pada kasus tersebut yaitu pelaporan kenaikan berat badan ibu hamil hanya didasarkan pada perkiraan kasar berdasarkan kondisi biasanya. b. Representatif (mewakili) Data statistik harus mewakili kelompok objek yang diamati. Misalnya data rata-rata produksi padi per hektar di daerah A yang dihitung dari sawah yang subur saja. Data ini tidak mewakili gambaran umum rata-rata produksi padi per hektar yang sesungguhnya dari seluruh sawah di daerah A. c. Akurat dan reliabel Suatu data statistik dikatakan akurat bila mampu secara tepat menggambarkan kondisi yang sebenarnya (true value). Biasanya ketepatan ini diukur dengan error, yaitu perbedaan (atau selisih) antara nilai statistik Data Statistik dan Indikator 17 BAB I Pendahuluan dan nilai yang sebenarnya. Sumber error dapat berasal dari penggunaan sampel untuk melakukan generalisasi populasi dan dari proses pengumpulan dan pengolahan data. Secara umum, kriteria ini mengkait pada kriteria bahwa statistik harus “dapat dipercaya” (reliable) atau “mempunyai kredibilitas” (credible). Contoh: angka rata-rata pengeluaran rumah tangga karyawan suatu kantor yang dihitung berdasarkan data sampel sebesar Rp5.000.000,00. Angka tersebut dikatakan akurat apabila sama dengan angka rata-rata yang dihitung dari seluruh karyawan (populasi) di kantor (sebesar Rp5.000.000,00). d. Tepat waktu (Timeliness). Data dikatakan tepat waktu apabila data yang menggambarkan suatu fenomena/kejadian disajikan tidak lama berselang dari waktu terjadinya fenomena tersebut dan harus tersedia pada saat dibutuhkan; dengan kata lain data harus up to date. Penggunaan data yang tidak tepat waktu (out of date) tentu kurang bermanfaat karena kemungkinan adanya perubahan fenomena yang terjadi. Begitu pula data yang tersedia tetapi tidak pada saat diperlukan tentunya kurang bermanfaat. Misalnya, pimpinan toko buku besar membuat keputusan penambahan pegawai berdasarkan jumlah pengunjung kondisi 2 tahun yang lalu. Padahal, kondisi saat ini pengunjung toko buku tersebut sudah berkurang karena sebagian besar konsumen berbelanja melalui layanan online. Akibatnya, kebijakan penambahan pegawai pada toko tersebut tidak tepat dan mengakibatkan pemborosan anggaran biaya/honor karyawan. 18 Data Statistik dan Indikator e. Relevan Data yang dikumpulkan harus ada hubungannya dengan masalah yang akan diselesaikan. Misalnya, pemerintah ingin menanggulangi korban banjir di daerah A dengan tingkat keparahan tinggi sehingga yang perlu dicatat adalah data para korban banjir di daerah A, bukan data korban banjir di wilayah dengan tingkat keparahan ringan. f. Koheren Data yang koheren merupakan data yang bersifat konsisten dan sesuai dengan indikator lain yang serupa atau saling terkait. Koheren juga dapat diartikan keselarasan suatu indikator yang dihasilkan dari sumber dan metode yang berbeda. Misal angka indeks harapan hidup di suatu wilayah meningkat, maka indeks tersebut dikatakan koheren jika angka kematian di wilayah tersebut menurun dan angka kesejahteraan penduduk meningkat. Contoh lain, angka partisipasi sekolah di desa A yang dihitung dari registrasi penduduk atau dari data survei sesuai dengan angka partisipasi sekolah yang dihitung dari pendataan lengkap hasil sensus di desa tersebut. g. Menyeluruh atau lengkap (comprehensive) Data statistik harus bersifat menyeluruh atau lengkap dalam pengertian dapat memberikan informasi selengkap mungkin sehingga gambaran yang diperoleh tidak bersifat sepotong-sepotong atau parsial. Misalnya dalam penyajian data/infomasi statistik tentang kemiskinan, maka perlu dilengkapi dengan informasi siapa (who) yang miskin, berapa banyak (how many) orang miskin, seberapa parah (how extent) tingkat kemiskinan mereka, di mana (where) kemiskinan terjadi, dan mengapa (why) mereka miskin. Data Statistik dan Indikator 19 BAB I Pendahuluan 2.4. Pengertian dan Jenis-jenis Variabel 2.4.1. Pengertian Variabel Variabel (peubah) adalah sebuah karakteristik, angka, kuantitas, atau sifat-sifat suatu objek atau unit pengamatan yang nilainya dapat bervariasi antar unit pengamatan, dan juga dapat berubah antarwaktu. Sebuah variabel dapat juga disebut sebagai sebuah butir data (data item). Nilai suatu variabel bisa diperoleh berdasarkan pengukuran (measurement) dan ada pula yang bisa diperoleh melalui penghitungan (counting). Umur, berat, tinggi, pendapatan, tempat lahir, pandangan terhadap program pemerintah, misalnya, merupakan contoh variabel yang umum ditemui dalam kehidupan sehari-hari. Suatu unit pengamatan, misal individu, bisa diukur dengan satu variabel atau beberapa variabel, misalnya umur dan banyaknya teman yang dimiliki. 2.4.2. Jenis-jenis Variabel Muhammad Nazir (1988) mengemukakan bahwa variabel dalam penelitian dapat dibagi dalam beberapa jenis. a. Variabel kontinu Variabel yang memiliki nilai sembarang, baik berupa nilai bulat maupun pecahan, di antara dua nilai tertentu atau variabel yang mengambil seluruh nilai dalam suatu interval. Contoh variabel kontinyu: Berat badan, tinggi, luas, pendapatan, dsb. Berat badan dapat ditulis 45 kg; 15 kg; atau 52,125 kg. b. Variabel diskrit Konsep yang nilainya tidak dapat dinyatakan dalam bentuk pecahan atau desimal di belakang koma, sehingga memiliki nilai yang tertentu dan terpisah (menggunakan bilangan diskrit). Variabel diskrit dapat berupa variabel kategori maupun variabel yang nilainya merupakan hasil penghitungan data berskala rasio. Bila dalam satu variabel mempunyai dua 20 Data Statistik dan Indikator kategori saja maka variabel tersebut dinamakan variabel dikotom. Sedangkan bila dapat dikategorikan lebih dari satu kategori dinamakan politom. Contoh variabel diskrit: Dikotom : Jenis kelamin: laki-laki, perempuan; status perkawinan: Kawin, tidak kawin. Politom : Tingkat pendidikan: SD, SMP, SMA, Perguruan Tinggi; partisipasi sekolah: belum/tidak bersekolah, masih bersekolah, tidak bersekolah lagi Sedangkan contoh variabel diskrit yang berasal dari penghitungan data berskala rasio: Jumlah siswa SDN 1 tahun pelajaran 2020-2021, jumlah kecelakaan jalan tol selama Tahun 2020. c. Variabel dependen dan independen Variabel independen (independent variable) adalah tipe variabel yang menjelaskan atau memengaruhi variabel yang lain. Variabel dependen (dependent variable) adalah tipe variabel yang dijelaskan atau dipengaruhi oleh variabel independen. Kedua tipe variabel ini merupakan kategori variabel penelitian yang paling sering digunakan dalam penelitian karena mempunyai kemampuan aplikasi yang luas. Contoh: Jika diketahui ada hubungan antara konsumsi dan pendapatan; bertambahnya pendapatan menyebabkan konsumsi juga akan bertambah, sehingga Konsumsi = variabel dependen (terikat dengan pendapatan), Pendapatan = variabel independen (variabel bebas). d. Variabel moderator dan random Variabel moderator merupakan variabel yang memengaruhi (memperkuat dan memperlemah) hubungan antara variabel independen dan variabel dependen. Variabel moderator disebut juga variabel independen kedua. Data Statistik dan Indikator 21 BAB I Pendahuluan Variabel yang menggambarkan hasil suatu percobaan/penelitian disebut sebagai variabel acak/variabel random. Contoh variabel moderator: Variabel yang memengaruhi kebutuhan (demand) ikan (Y) adalah harga ikan (X1), pendapatan (X2), dan harga daging (X3). Ketiga variabel tersebut adalah variabel utama. Jika umur konsumen (X4) juga berpengaruh, tetapi bukanlah sebagai penyebab utama, umur konsumen (X4) ini lah yang disebut dengan variabel moderator. e. Variabel aktif Variabel aktif adalah variabel independen yang dimanipulasikan oleh peneliti. Manipulasi data yang dilakukan dapat dengan cara memberikan perlakuan yang berbeda antar kelompok unit yang diteliti. Contoh variabel aktif: Jika peneliti menerapkan metode mengajar pada kelompok yang berbeda dan menerapkan pemberian hukuman yang berbeda kepada mahasiswa, variabel metode mengajar dan variabel pemberian hukuman disebut variabel aktif karena variabel ini dapat dimanipulasikan. f. Variabel atribut Variabel atribut merupakan variabel yang tidak dapat atau sukar dimanipulasi. Variabel atribut umumnya merupakan karakteristik manusia, seperti inteligensi, jenis kelamin, status sosial, pendidikan, sikap, dan sebagainya. 2.5. Pengertian Indikator Indikator adalah variabel kendali yang dapat digunakan untuk mengukur perubahan pada sebuah kejadian atau kegiatan. KBBI menjelaskan bahwa indikator merupakan sesuatu yang dapat memberikan petunjuk atau keterangan. Indikator juga diartikan sebagai variabel-variabel yang bisa menunjukkan atau mengindikasikan suatu fenomena atau kondisi tertentu sehingga bisa dipakai untuk mengukur perubahan yang terjadi. Suatu indikator 22 Data Statistik dan Indikator dituangkan berupa suatu angka (dapat disebut angka indeks) dan dapat dirumuskan dari satu atau lebih variabel. Contoh indikator: Perbandingan antara jumlah penduduk dan luas area suatu wilayah dapat menjadi indikator kepadatan penduduk per kilometer persegi, Jumlah penduduk menurut usia dapat menjadi indikator tingkat ketergantungan (dependency ratio) penduduk usia tidak produktif (usia 0- 14 dan usia 65 tahun ke atas) terhadap penduduk produktif (usia 15-64 tahun). Angka indeks ini dapat dijadikan indikasi adanya tekanan terhadap penduduk produktif. Berat badan bayi berdasarkan umur dapat menjadi indikator bagi status gizi bayi. Indikator yang baik harus memenuhi persyaratan spesifik (interpretasi jelas, tidak mengundang multi interpretasi), valid (sahih, absah), reliabel (andal, tepercaya, konsisten), sensitif (dapat mendeteksi perubahan kecil), dan data tersedia (untuk pengukuran, serta keberlanjutan monitoring dan evaluasi). Namun, tidak semua indikator yang diperlukan untuk mengukur suatu fenomena tersedia datanya. Oleh karena itu dapat digunakan indikator proxy. Misalnya indikator untuk mengukur kesejahteraan petani, dapat digunakan perbandingan antara indeks harga yang diterima petani (It) dan indeks harga yang dibayar petani (Ib), atau biasa disebut sebagai Nilai Tukar Petani (NTP). Data Statistik dan Indikator 23 BAB I Pendahuluan 24 Statistik yang Sering Digunakan BAB 3. Statistik yang Sering Digunakan BAB 3 STATISTIK YANG SERING DIGUNAKAN Statistik yang Sering Digunakan 25 BAB I Pendahuluan 26 Statistik yang Sering Digunakan Dalam kegiatan statistik, parameter atau karakteristik populasi seringkali tidak diketahui sehingga harus diestimasi berdasarkan data sampel, disebut sebagai data statistik. Namun, tidak semua set data sampel dapat digunakan untuk menggambarkan populasi, karena ada persyaratan yang harus dipenuhi, yaitu terkait cara pengambilan sampel dan teknik pengolahan data. Oleh karena itu, sangat penting memahami cara penggunaan data sampel dan mengetahui cara pengambilan data sampel tersebut sehingga penghitungan statistik beserta analisisnya menjadi tepat. Informasi mengenai data set umumnya dapat diketahui dari metadata kegiatan statistik penghasil set data jika tersedia. Namun jika tidak tersedia, pengguna data peru mengonfirmasi kepada produsen data. Statistik yang biasa disajikan dan digunakan untuk analisis data sehingga dapat menggambarkan suatu kondisi, antara lain total, rata-rata, proporsi, dan rasio. Setiap statistik dapat dihasilkan dari data, baik yang menggunakan sampel yang dipilih secara acak/random (disebut sampel acak) sehingga dapat mengambarkan parameter populasi, maupun berasal dari data sampel yang tidak berasal dari sampel acak (hanya menggambarkan kondisi sekelompok unit yang diteliti). 3.1. Penggunaan Penimbang Pada sub subbab 2.2.6 telah dijelaskan mengenai data menurut cara pengumpulan data. Pada bagian tersebut, yang menjadi perhatian dalam pengolahan data khususnya penghitungan statistik adalah penggunaan penimbang dan penentuan domain penghitungan yang dapat dilakukan harus sesuai dengan metode pengumpulan datanya. Pada umumnya, set data hasil pengumpulan data secara survei probability sampling telah dilengkapi dengan penimbang individu yang dihitung berdasarkan metode sampling yang digunakan (selanjutnya disebut penimbang). Penimbang merupakan suatu angka yang menggambarkan besarnya satu unit sampel dalam mewakili unit lain dalam populasi yang diteliti. Misalnya dari populasi 60 orang guru sekolah di suatu kecamatan diambil Statistik yang Sering Digunakan 27 BAB I Pendahuluan sampel sebanyak 12 orang untuk didata tentang pengeluaran per bulan. Maka, setiap satu orang guru yang terpilih sampel akan mewakili lima orang lainnya. Penimbang tersebut dihitung dengan merasiokan populasi (N) terhadap sampel (n) atau N/n. Oleh karena itu, setiap data individu harus akurat karena kesalahan yang terjadi pun akan dihitung sejumlah unit yang diwakilinya. Data statistik yang dihitung berdasarkan set data sampel acak dan memperhitungkan penimbang, hasilnya dapat digunakan sebagai gambaran populasi tempat sampel tersebut diambil. Prosedur penghitungan statistiknya pun harus menggunakan kaidah estimasi langsung (direct estimate) atau estimasi tidak langsung (indirect estimate). Kedua cara tersebut melibatkan penimbang. Sedangkan jika dihitung tanpa melibatkan penimbang, tidak dapat digunakan untuk menggambarkan populasi melainkan hanya sebagai gambaran data sampel. Begitu pula data statistik yang dihitung dari data yang tidak berasal dari sampel acak, maka tidak dapat menggambarkan parameter populasi. Contoh: a. Pada set data Survei Sosial Ekonomi Nasional (Susenas) sudah tersedia penimbang rumah tangga dan penimbang individu (bila dipilih secara acak pula). Dalam hal ini, diketahui sampel Susenas dirancang untuk penyajian tingkat kabupaten, provinsi, dan nasional sehingga pengguna data dapat melakukan estimasi populasi tingkat kabupaten, seperti estimasi jumlah anak usia sekolah 6-18 tahun di Kabupaten A dengan menggunakan data Susenas dan penimbang yang sudah tersedia. Namun, pengguna data tidak dapat melakukan estimasi sampai tingkat di bawah kabupaten. b. Suatu penelitian tingkat kepuasan pelayanan sekolah menggunakan data yang berasal dari respons masuk kuesioner online yang disebarkan melalui broadcast ke media sosial seluruh orang tua murid. Jika respons masuk hanya berasal dari sebagian populasi orang tua murid, berarti set data tersebut bukan data populasi dan bukan pula berasal dari sampel acak. Dalam kasus ini, data unit sampel tersebut tidak dapat mewakili populasi seluruh orang tua murid di sekolah tersebut sehingga indikator yang dihasilkan hanya menggambarkan kecenderungan pada kondisi sampel tersebut. 28 Statistik yang Sering Digunakan Selain data yang diperoleh dari survei dengan sampel acak, pengguna data juga dapat melakukan analisis dari data yang sudah tersedia pada buku laporan atau berasal dari publikasi (data sekunder). Dalam penggunaan data sekunder, metadata data tersebut perlu lebih cermat dipahami sebelum dilakukan pengolahan data lebih lanjut, khususnya terkait metadata kegiatan untuk memperoleh data tersebut. Misalnya, cara pengumpulan data, metode pengambilan sampel (untuk mengetahui keterwakilan sampel pada tingkat wilayah tertentu), target populasi yang dicakup, dan metadata indikator data tersebut. Cara pengolahan data yang tepat terhadap data sekunder pun menjadi suatu hal yang penting dalam menghasilkan statistik atau pun indikator untuk analisis selanjutnya. 3.2. Pola Data Kumpulan data yang merupakan hasil pengukuran terhadap variabel tertentu pada umumnya memiliki nilai yang berbeda satu dengan lainnya. Nilai- nilai keberagaman dapat dilihat melalui pola sebarannya. Pola sebaran ini sangat berguna dalam penentuan karakteristik data. Ukuran numerik yang penting meliputi ukuran pemusatan data (central tendency), sebaran data (dispersion), dan bentuk sebaran data (shape) 3.2.1. Ukuran Lokasi atau Ukuran Pemusatan Salah satu tujuan utama dalam statistik deskriptif adalah menyajikan suatu atau beberapa nilai angka ringkasan yang dapat memberikan gambaran umum tentang suatu fenomena yang diwakili oleh sekelompok data. Salah satu angka rigkasan ini biasa dikenal dengan istilah rata-rata. Misalnya angka rata- rata gaji pegawai di Rumah Sakit Umum Daerah, rata-rata produksi gabah di Kecamatan A. Satu aspek yang paling penting untuk menggambarkan distribusi data adalah nilai pusat data pengamatan (central tendency). Rata-rata merupakan ukuran lokasi atau ukuran pusat karena unit pengamatan cenderung berkelompok atau berlokasi di sekitar rata-rata. Selain ntuk memperoleh suatu Statistik yang Sering Digunakan 29 BAB I Pendahuluan nilai yang mewakili kelompok data, rata-rata juga digunakan untuk melakukan perbandingan antara dua atau lebih kelompok data. Selain rata-rata, ada pula ukuran lokasi lainnya, yaitu rata-rata hitung (mean), median, dan modus (atau mode). Masing-masing ukuran tersebut baik digunakan pada sebaran data yang sesuai. Penentuan ukuran lokasi yang akan digunakan ditentukan berdasarkan ukuran yang memiliki sifat-sifat berikut: a. harus mempertimbangkan semua gugus data (data pengamatan). b. tidak boleh terpengaruh oleh nilai ekstrem (outlier) atau pencilan. Sehingga harus dilakukan pemeriksaan penyebab adanya nilai pencilan terlebih dahulu. c. jika ukuran lokasi diukur dari beberapa alternatif gugus data yang berbeda-beda, hasilnya harus bernilai stabil dari setiap gugus data tersebut (bersifat andal/reliable). d. harus mampu digunakan dalam analisis lanjutan. Di antara ketiga ukuran pemusatan (rata-rata, median, modus), rata-rata (mean) merupakan nilai pusat terbaik karena memenuhi tiga dari empat persyaratan di atas selain butir b, sehingga sering digunakan dalam analisis statistik. Sebagai contoh, suatu gugus data sebagai berikut: Data unit ke- 1 2 3 4 5 6 7 8 9 10 Nilai 2 4 5 6 6 6 7 7 8 90 Hasil penghitungan ukuran pemusatan data di atas diperoleh nilai rata- rata 14,10; median 6; dan modus 6. Dalam hal ini, nilai rata-rata tidak mewakili keseluruhan data karena dipengaruhi adanya nilai pencilan pada data ke-10, sedangkan nilai median dan modus tidak dipengaruhi angka pencilan. Namun demikian, median dan modus tidak memenuhi persyaratan butir a,c, dan d, sehingga rata-rata tetap dianggap sebagai ukuran nilai pusat terbaik dengan catatan harus dilakukan pengecekan dan perlakuan lebih lanjut terkait adanya nilai ekstrem. 30 Statistik yang Sering Digunakan a. Rata-rata Hitung (Aritmatik) Rata-rata merupakan nilai yang mewakili himpunan atau sekelompok data. Rata-rata hitung layak digunakan apabila sebaran data merata atau hampir seragam (homogen), artinya nilai data yang satu tidak jauh berbeda dengan nilai data lainnya. Rata-rata hitung digunakan apabila jenis datanya numerik (berskala interval atau rasio), sebaran data simetrik, dan tidak ada nilai pencilan (outlier) atau nilai ekstrem (pencilan jauh). Jika pada saat akan menghitung rata- rata, tetapi data mengandung pencilan, penyebab pencilan perlu dicek terlebih dahulu. Apabila pencilan terjadi karena kesalahan pengukuran, data tersebut dapat dibuang atau diganti dengan data baru yang benar. Namun apabila data pencilan tersebut sesuai kondisi yang sebenarnya, maka data tidak boleh dibuang. Untuk menghilangkan outlier, gugus data tersebut dapat ditambahkan dengan nilai observasi yang berasal dari sampel tambahan. Nilai pencilan yang dilibatkan dalam penghitungan rata-rata akan menyebabkan hasil yang diperoleh tidak mewakili data keseluruhan dan dapat menyebabkan kesalahan dalam kesimpulan dan kebijakan yang diambil. Contoh: Data konsumsi pada dua desa seperti pada grafik di Gambar 3.3 dan Gambar 3.4. Sebaran nilai konsumsi di Desa A lebih merata, sedangkan sebaran nilai konsumsi di Desa B sangat berbeda satu dengan lainnya. Oleh karena itu, nilai rata-rata konsumsi di Desa A lebih menggambarkan populasi dibandingkan nilai rata-rata di Desa B. Statistik yang Sering Digunakan 31 BAB I Pendahuluan Desa A Desa B 30 60 20 40 10 20 0 0 1 2 3 4 5 6 1 2 3 4 5 6 Konsumsi A Rata-rata A Konsumsi B Rata-rata B Gambar 3.1. Perbandingan antara Gambar 3.2. Perbandingan antara nilai nilai rata-rata dan sebaran data di rata-rata dan sebaran data di Desa B Desa A (nilai konsumsi hampir (nilai konsumsi sangat beragam da nada seragam dan tidak ada nilai pencilan) nilai pencilan) Perlu hati-hati dalam penghitungan angka indeks maupun angka rata- rata yang menggambarkan suatu domain yang dibangun dari wilayah satu tingkat di bawahnya. Angka rata-rata harus dihitung dengan melibatkan penimbang, atau dihitung secara langsung pada domain atau tingkat di atasnya. Angka rata-rata suatu domain belum tentu dapat diagregatkan sampai domain di atasnya. Penghitungan angka rata-rata perlu memperhatikan rumus asalnya. Sebagai contoh, diketahui Indeks Pembangunan Manusia (IPM) per kabupaten di suatu provinsi berturut-turut sebagai berikut: 3; 2,88; 2,47. Angka IPM di tingkat provinsi, tidak bisa dihitung dengan merata-ratakan ketiga IPM kabupaten-kabupaten tersebut. 1). Rata-rata Hitung Sederhana untuk Data Tunggal Rata-rata hitung menunjukkan bahwa nilai data hasil observasi cenderung berpusat pada nilai tersebut. Rata-rata hitung sederhana diperoleh dengan menjumlahkan seluruh nilai observasi dibagi dengan frekuensi (banyaknya) observasi. Nilai rata-rata hitung yang menggambarkan data populasi, dilambangkan dengan µ, dihitung dengan cara: ∑𝑁 𝑖=1 𝑥𝑖 µ= 𝑁. (3.1) 32 Statistik yang Sering Digunakan Nilai rata-rata hitung yang menggambarkan data sampel, dilambangkan dengan 𝑥̅ , adalah: ∑𝑛 𝑖=1 𝑥𝑖 𝑥̅ = , (3.2) 𝑛 dengan 𝑥𝑖 = nilai observasi 𝑁 = Frekuensi (banyaknya) observasi populasi, 𝑛 = Frekuensi (banyaknya) observasi dari sampel. 𝑖 = observasi Contoh: Produksi (X) barang A pada Bulan Januari sampai dengan Desember 2002 (dalam ton) sebagai berikut: 3,5 ; 3 ; 4 ; 4 ; 3 ; 4 ; 4 ; 5 ; 4,5 ; 5 ; 3 ; 4,5. Pada data tersebut, ada 𝑛=12 unit observasi (berasal dari pengamat-an selama 12 bulan). Selanjutnya dapat dihitung rata-rata produksi barang A per bulan pada tahun 2002 dengan cara menjumlahkan seluruh nilai observasi kemudian dibagi dengan banyaknya data: 3,5 + 3 + 4 + 4 + 3 + 4 + 4 + 5 + 4,5 + 5 + 3 + 4,5 47,5 𝑥̅ = = = 3,96. 12 12 Angka tersebut menunjukkan rata-rata produksi barang A per bulan (𝑥̅ ) pada tahun 2002 adalah 3,96 ton. Artinya nilai tengah sekumpulan data produksi A tersebut berada di nilai 3,96 ton. Penghitungan nilai rata-rata secara praktis dapat dilakukan dengan bantuan software Microsoft Excel. Langkah yang dilakukan antara lain memilih sel yang kosong, ketikkan =AVERAGE(), kemudian di dalam tanda kurung diisikan sel-sel yang akan dihitung rata-ratanya. Layout data dan formula yang digunakan dapat dilihat pada Gambar 3.5. Statistik yang Sering Digunakan 33 BAB I Pendahuluan Gambar 3.3. Contoh Penghitungan Rata-rata Hitung Sederhana dengan Microsoft Excel 2). Rata-rata Hitung Tertimbang ( 𝐱̅ ) Pada umumnya, penggunaan rata-rata tertimbang diterapkan pada set data yang sudah dilengkapi dengan penimbang, baik berasal dari penimbang sampling maupun yang berasal dari kajian empiris lainnya. Penimbang (w) adalah suatu angka yang digunakan sebagai pengali setiap nilai (x) pada data agar nilai statistik yang dihasilkan lebih akurat/teliti. Artinya, setiap nilai dianggap mewakili data sebanyak pengali tersebut. Sehingga, pada dasarnya, formula rata-rata hitung tertimbang sama dengan rata-rata data berkelompok. Dalam hal ini, kedudukan penimbang sama dengan frekuensi data. Khusus data yang berasal dari survei dengan probability sampling, rata-rata tertimbang dapat menggambarkan parameter (karakteristik) populasi. Perhatikan contoh-contoh di bawah ini. Contoh benar penghitungan rata-rata tertimbang: Suatu Dinas Pertanian akan mengetahui rata-rata produksi beras per hari suatu perusahaan penggilingan besar di suatu kabupaten. Data yang dimiliki adalah total produksi per bulan dan jumlah hari kerja dalam setiap bulan, seperti di Tabel 3.3. 34 Statistik yang Sering Digunakan Tabel 3.1. Jumlah Produksi Barang A menurut Jumlah Hari Kerja per Bulan Tahun 2002 Hari Kerja Bulan Produksi (ton) (xi wi) (wi) (1) (2) (3) (4) Januari 3,5 20 70 Februari 3 18 54 Maret 4 22 88 April 4 21 84 Mei 3 19 57 Juni 4 21 84 Juli 4,5 22 99 Agustus 4,5 21 94,5 September 5 21 105 Oktober 3 17 51 November 4 21 84 Desember 5 23 115 Jumlah 246 985,5 Sumber: Perusahaan B Rata-rata produksi beras per bulan dihitung berdasarkan total produksi per bulan dan jumlah hari kerja dalam satu bulan, adalah: ∑𝑘 𝑖=1 𝑥𝑖 𝑤𝑖 985,5 𝑥̅ = ∑ 𝑤𝑖 = = 4,00 , dengan 𝑘 = 1,2, …, 12. 246 Dalam penghitungan tersebut, jumlah hari kerja digunakan sebagai penimbang produksi per bulan. Interpretasi hasil penghitungan tersebut menyatakan rata- rata produksi beras per bulan (𝑥̅ ) di kabupaten selama tahun 2002 adalah 4 ton. Penghitungan rata-rata produksi per hari dengan rumus rata-rata tertimbang pada software Microsoft Excel dilakukan dengan formula yang dijelaskan pada Gambar 3.4. Statistik yang Sering Digunakan 35 BAB I Pendahuluan Gambar 3.4. Penghitungan rata-rata tertimbang pada software Microsoft Excel Hasil penghitungannya terdapat pada Gambar 3.5. Gambar 3.5. Hasil penghitungan rata-rata tertimbang 36 Statistik yang Sering Digunakan Pengecekan hasil penghitungan dapat dilakukan dengan mengem- balikan hasil penghitungan rata-rata untuk memperoleh nilai total produksi 1 tahun, yaitu: 𝑃𝑟𝑜𝑑𝑢𝑘𝑠𝑖 1 𝑡𝑎ℎ𝑢𝑛 = 𝑟𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎 𝑡𝑒𝑟𝑡𝑖𝑚𝑏𝑎𝑛𝑔 𝑝𝑒𝑟 𝑏𝑢𝑙𝑎𝑛 × 𝑗𝑢𝑚𝑙𝑎ℎ ℎ𝑎𝑟𝑖 = 4,01 × 246 ℎ𝑎𝑟𝑖 = 985,5 𝑡𝑜𝑛 ℎ𝑎𝑟𝑖 Contoh salah penghitungan rata-rata tertimbang: Kekeliruan penghitungan rata-rata tertimbang dapat menyebabkan kesalahan interpretasi. Contoh salah dalam penghitungan rata-rata produksi per bulan (tidak tertimbang) pada Gambar 3.8 misalnya ketika rata-rata produksi per bulan dihitung berdasarkan jumlah produksi dibagi jumlah bulan dalam satu tahun; tidak mempertimbangkan jumlah hari kerja yang berbeda- beda pada setiap bulan. Gambar 3.6. Contoh penghitungan rata-rata tertimbang yang salah Angka rata-rata produksi per bulan yang tidak tertimbang jumlah hari kerja sebesar 3,958 ton underestimate (di bawah nilai yang sebenarnya). Pengecekan dapat dilakukan dengan mengalikan rata-rata produksi per bulan dengan jumlah hari kerja dalam 1 tahun, sebagai berikut: Statistik yang Sering Digunakan 37 BAB I Pendahuluan 𝑃𝑟𝑜𝑑𝑢𝑘𝑠𝑖 1 𝑡𝑎ℎ𝑢𝑛∗ = 3,958 𝑡𝑜𝑛 × 246 ℎ𝑎𝑟𝑖 𝑘𝑒𝑟𝑗𝑎 = 973,75 𝑡𝑜𝑛 ℎ𝑎𝑟𝑖. Artinya, berdasarkan pengecekan tersebut, penghitungan produksi 1 tahun dengan formula yang tidak tepat akan menghasilkan angka produksi yang tidak sama dengan angka total produksi 1 tahun sebenarnya, atau ditulis: Produksi 1 tahun* ≠ 985,5 ton hari (angka sebenarnya). 3) Rata-rata Data Berkelompok Cara penghitungan yang sama dengan rata-rata tertimbang, dapat dilakukan pada deretan data yang terdapat beberapa nilai yang sama. Deretan data seperti itu dapat dikelompokkan terlebih dahulu, dan biasa disebut sebagai data berkelompok. Rumus penghitungan rata-rata hitung untuk data berkelompok sebagai berikut. ∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖 𝑥̅ = ∑𝑘𝑖=1 𝑓𝑖 dengan 𝑓𝑖 = frekuensi kelas ke 𝑖, 𝑥𝑖 = nilai tengah kelas ke 𝑖, 𝑖 = 1, 2, 3,..., 𝑘, 𝑘 = banyaknya kelas. Contoh benar penghitungan rata-rata hitung data berkelompok: Dinas Pendidikan di suatu kabupaten akan menghitung rata-rata jumlah murid per kelas di SDN 01 tanpa dibedakan menurut jenjang Kelas 1, Kelas 2, …, Kelas 6. Data awal jumlah murid di setiap kelas terdapat di Tabel 3.4. 38 Statistik yang Sering Digunakan Tabel 3.2. Data Jumlah Murid di SDN 01 Jenjang Kelas Jumlah Murid Jenjang Kelas Jumlah Murid a 25 a 30 Kelas 4 Kelas 1 b 25 b 30 c 25 a 30 a 22 Kelas 5 b 30 b 22 c 30 Kelas 2 c 22 a 25 d 22 Kelas 6 b 25 a 30 c 25 Kelas 3 b 30 Proses penghitungan dapat dilakukan dengan mengelompokkan data tersebut terlebih dahulu, kemudian penghitungan dengan menggunakan rumus rata-rata hitung pada data berkelompok ∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖 (3 × 25) + (4 × 22) + ⋯ + (3 × 25) 𝑥̅ = = = 26,35 ≈ 26 𝑜𝑟𝑎𝑛𝑔 ∑𝑘𝑖=1 𝑓𝑖 3+4+2+2+3+3 Atau penghitungan pada Microsoft Excel dapat dilihat pada Gambar 3.7. Gambar 3.7. Penghitungan rata-rata hitung pada data berkelompok dengan Microsoft Excel Statistik yang Sering Digunakan 39 BAB I Pendahuluan Hasil penghitungannya terdapat pada Gambar 3.8. Gambar 3.8. Hasil Penghitungan rata-rata hitung pada data berkelompok b. Rata-rata Ukur (Geometric Mean) Data Tunggal Rata-rata ukur digunakan untuk mengukur rata-rata persentase tingkat perubahan dalam suatu rentang waktu. Rata-rata ukur tersebut dapat digunakan untuk data tunggal dan data berkelompok. Rata-rata ukur cocok digunakan apabila data dasar yang digunakan saling terkait atau tidak independen. Dalam perstatistikan nasional, penerapan rata-rata ukur (geometrik) antara lain dalam penghitungan IPM karena rata-rata ukur lebih responsif dalam mengukur perubahan suatu fenomena dibanding rata-rata hitung. IPM yang dibangun dengan rata-rata ukur dapat mendeteksi adanya ketimpangan capaian pembangunan, yaitu ketika terdapat satu indikator yang rendah, indikator tersebut tidak akan tertutupi oleh indikator yang lain yang memiliki nilai yang tinggi. Adanya ketimpangan tersebut akan menyebabkan nilai IPM menjadi lebih rendah. Pada modul ini, rata-rata ukur yang dibahas hanya mencakup rata-rata ukur data tunggal. Rata-rata ukur data tunggal dapat digunakan untuk menghitung rata- rata persentase tingkat perubahan hasil penjualan, produksi, harga dan pendapatan selama beberapa tahun tertentu. Rata-rata ukur cocok digunakan 40 Statistik yang Sering Digunakan pada data yang tidak terlalu banyak, nilainya tidak besar, dan tidak ada angka negatif, karena diproses dengan perkalian semua data dalam suatu kelompok sampel, kemudian diakarpangkatkan dengan banyaknya data sampel tersebut. Rumus untuk menghitung rata-rata ukur (𝐺𝑚 ) adalah sebagai berikut. 1⁄ 𝐺𝑚 = 𝑛√𝑥1. 𝑥2 … 𝑥𝑛 = (𝑥1. 𝑥2 … 𝑥𝑛 ) 𝑛, (3.3) dengan n = Jumlah atau banyaknya data, xi = Nilai perubahan relatif (dalam persentase) per satuan waktu. Contoh: Suatu pemerintah daerah memiliki realisasi anggaran untuk pembangunan di daerah dari Tahun 2000 sampai dengan 2002 seperti tabel yang teradat di Gambar 3.11. Berapa tingkat perubahan realisasi anggaran tersebut, dan apakah dapat disimpulkan tingkat keberhasilan pimpinan daerah tersebut dalam efisiensi anggaran untuk pembangunan? Sebagai contoh penghitungan, disajikan dua macam penggunaan rumus rata-rata perubahan, yaitu dengan rata-rata ukur dan rata-rata hitung sebagai gambaran cara penghitungan yang benar dan salah dalam kasus ini. Rumus rata- rata ukur (geometri) pada Ms Excel Gambar 3.9. Dua macam penggunaan rumus rata-rata perubahan Statistik yang Sering Digunakan 41 BAB I Pendahuluan Hasil yang diperoleh sebagai berikut: ∑𝑁 𝑖=1 𝑥𝑖 Berdasarkan hasil rata-rata hitung (menggunakan persamaan (µ = 𝑁. ∑𝑛 𝑖=1 𝑥𝑖 (3.1𝑥̅ = 𝑛 , (3.2)), diperoleh rata-rata tingkat perubahan pagu anggaran sebesar 0,572 dalam jangka waktu 2000-2004. Pada penghitungan rata-rata perubahan dengan rumus rata-rata hitung, tidak nampak adanya perubahan nyata pagu anggaran, sehingga peningkatan efisiensi anggaran yang sebenarnya ada, tetapi tidak terlihat. Sedangkan dengan penghitungan rata-rata ukur menggunakan persamaan 1⁄ 𝐺𝑚 = 𝑛√𝑥1. 𝑥2 … 𝑥𝑛 = (𝑥1. 𝑥2 … 𝑥𝑛 ) 𝑛, (3.3), diperoleh tingkat perubahan pagu 0,399 selama tahun 2000-2004. Perbedaan yang mendasar adalah penurunan perubahan yang nyata pada tahun 2002-2003 dari sebesar 1,084 menjadi 0,170. Dengan penggunaan rumus rata-rata ukur (geometri), tingkat perubahan yang berbeda nyata dari sebesar 1,084 pada 2001-2002 menjadi sebesar 0,170 pada 2002-2003 jelas terlihat. Ini dapat menunjukkan peningkatan efisiensi penggunaan pagu anggaran Artinya, dari kedua cara penghitungan di atas, dapat dipastikan penghitungan tingkat perubahan selama kurun waktu tertentu dapat diidentifikasi secara lebih baik dengan rumus rata-rata ukur (geometri). Contoh penghitungan rata-rata pada Indek Pembangunan Manusia (IPM): Contoh lain rata-rata ukur diterapkan pada penghitungan IPM suatu wilayah. IPM dibangun dari tiga indeks utama, yaitu indeks tingkat pendidikan, indeks kesehatan, dan indeks pengeluaran dengan data seperti pada Tabel 3.5. Tabel ini menyajikan perbandingan angka IPM dengan dua cara yang berbeda, yaitu dengan rata-rata hitung dan rata-rata ukur (geometrik). 𝐼𝑝 +𝐼𝑠 +𝐼𝑒 IPM rata-rata hitung = 𝐼𝑃𝑀∗ = 3 IPM rata-rata ukur = 𝐼𝑃𝑀∗∗ = √𝐼𝑝 × 𝐼𝑠 × 𝐼𝑒 𝑠 42 Statistik yang Sering Digunakan Tabel 3.3. Tabel simulasi penghitungan IPM berdasarkan rata-rata hitung dan rata-rata ukur pada IPM IPM* IPM** berdasarkan Pendidikan Kesehatan Pengeluaran berdasarkan Wilayah rata-rata (Ip) (Is) (Ie) rata-rata ukur hitung (geometrik) (aritmatik) (1) (2) (3) (4) (5) (6) A 3 3 3 3,00 3,00 B 2 3 4 3,00 2,88 C 1 3 5 3,00 2,47 Dari hasil penghitungan pada Tabel 3.5, terlihat kelemahan dari rata-rata hitung, yaitu tidak mampu melihat adanya ketimpangan capaian dimensi pembangunan manusia. Artinya, ada atau tidak adanya ketimpangan, nilai IPM tetap sama. Sebaliknya, rata-rata ukur (geometrik) lebih peka terhadap adanya ketimpangan capaian dimensi pembangunan manusia. Makin timpang capaian yang terjadi di antara ketiga indeks pendukung pembangunan (indeks pendidikan, indeks kesehatan, dan indeks pengeluaran), makin rendah rata-rata IPM. Oleh karena itu, rata-rata ukur (geometrik) lebih tepat digunakan pada pengukuran indeks yang dibangun dari beberapa indeks lain. c. Median Median adalah nilai suatu pengamatan yang terletak di tengah-tengah setelah nilai pengamatan diurutkan menurut besarnya nilai (dari nilai terkecil sampai terbesar atau sebaliknya). Keuntungan penggunaan median adalah tidak terpengaruh adanya nilai ekstrem dan dapat diperoleh gambaran bahwa sekitar 50 persen dari pengamatan yang ada bernilai kurang dari nilai median, dan 50 persen lainya bernilai kurang dari nilai median. Median baik digunakan pada data numerik ordinal. Contoh median: Nilai ujian matematika 11 orang siswa diperoleh nilai sebagai berikut 8; 4; 5; 6; 7; 6; 8; 10; 2; 9; 8; 10. Maka median nilai ujian matematika diproses dengan cara: urutkan data menjadi: 2; 4; 5; 6; 6; 7; 8; 8; 8; 9; 10; 10 Statistik yang Sering Digunakan 43 BAB I Pendahuluan banyaknya data (n)=12 posisi median=1⁄2 (12 + 1) = 6,5 Jadi, median nilai hasil ujian matematika terletak pada data urutan ke-6,5 atau antara urutan ke-6 dan ke-7, yaitu bernilai 1⁄2 (7 + 8) = 7,5. Pada Microsoft Excel, nilai median dapat diperoleh dengan rumus =MED