Pengertian Statistika



BAB I

PENDAHULUAN

Hampir di setiap bidang, baik pemerintahan, pendidikan, perekonomian, perindustrian, perdagangan, perusahaan, ataupun lainnya, setiap pejabat atau setidak-tidaknya pimpinan, sudah pernah, sedang atau akan menghadapi persoalan yang antara lain dinyatakan oleh angka-angka. Dari kumulan angka-angka ini ia berusaha membuat kesimpulan yang dianggap atau diharapkan cukup beralasan memberikan gambaran atau penjelasan mengenai persoalan itu. Salah satu usaha ke arah ini, yang telah dilakukan secara bertahun-tahun, ialah menyusun atau menyajikan angka-angka tersebut di dalam bentuk sebuah daftar atau tabel. Orang mengatakan, bahwa itu adalah statistik. Memang, pada umumnya masyarakat menafsirkan statistik tiada lain daripada tabel atau daftar angka tentang sesuatu hal atau kegiatan yang terdapat di kantor-kantor pemerintah, di jawatan-jawatan, di perusahaan-perusahaan, perindustrian, dan lain sebagainya. Sering pula daftar atau tabel tersebut disertai dengan gambar-gambar, yang biasa disebut diagram atau grafik, untuk dapat menjelaskan lagi persoalan atau kegiatan yang sedang dibahas. Karena inilah pula, orang mendapat pengertian statistik, yakni laporan atau lukisan tentang suatu hal dalam bentuk diagram-diagram, grafik-grafik, gambar-gambar, berbentuk lingkaran, tumpukan gambar mata uang, deretan gambar manusia dan lain-lain.

BAB II

PEMBAHASAN

  1. Pengertian Statistika

Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan bahan-bahan atau keterangan, pengolahan serta penganalisisannya, penarikan kesimpulan serta pembuatan keputusan yang beralasan berdasarkan penganalisisan yang dilakukan[1].

Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan fakta, pengolahan serta penganalisisannya, penarikan kesimpulan serta pembuatan kesimpulan yang cukup beralasan berdasarkan fakta dan penganalisisan yang dilakukan[2].

Para ahli matematika mengembngkan statistika, diatas teori peluang, sebagai alat untuk membantu manusia, secara matematis, memecahakan berbagai persoalan yang dihadapi. Oleh karena itu, statistika tidak dapat dipisahkan dari teori peluang dan merupakan bagian dari matematika.

Statistika yang telah dikembangkan secara matematis kemudian digunakan di berbagai bidang untuk membantu memecahkan berbgai persoalan yang ditemukan di masing-masing bidang. Keragaman permasalahan yang ditemukan pada berbagai bidang juga telah mendorong para ahli metematika (statistika matematik) untuk mengembangkan berbagai teknik statistika yang sesuai dengan kondisi permasalahannya. Sungguh, suatu konsep statistika dapat muncul ke dalam sejumlah teknik statistka karena perbedaan asumsi mengenai permasalahan yang hendak dipecahkan. Suatu teknik statistika akan menghasilkan suatu ukuran deskriptif tentang suatu peubah (variabel) atau hubungan antara dua atau sejumlah peubah.

Dalam memecahkan suatu masalah, karena alasan tertentu, kita seringkali tidak memiliki data dari seluruh anggota populasi yang hendak difahami. Alih-alih, kita biasanya hanya memiliki data dari sebagian anggota populasi yang kemudian disebut sampel. Oleh karena itu, para ahli matematika juga mengembangkan rumusan-rumusan yang dapat membantu kita dalam menarik sampel sehingga data yang ada di tangan dapat mewakili keadaan populasinya. Dengan kata lain, statistika juga membicarakan cara-cara pengumpulan data, terutama mengenai penarikan sampel.

Data dari sampel yang diperoleh kemudian dianalisis dengan menggunakkan teknik tertentu sesuai dengan permasalahan dan jenis datanya. Ukuran-ukuran statistik hasil analisis tersebut lalu digunakan untuk melekukan inferensi tentang persoalan yang dikaji pada populasi mana sampel diambil. Oleh karena itu, para ahli juga telah melengkapi teknik analisis data dengan cara melkukan inferensi tentang ukuran-ukuran populasi melalui statistik yang diperoleh. Dengan kata lain  perkataan, statistika juga meliputi cara-cara untuk menafsirkan suatu ukuran statistik serta melakukan inferensi tentang parameter populasinya.

Berdasarkan uraian diatas, kita dapat memahami bahwa statistika adalah bagian dari matematika yang secara khusus membicarakan cara-cara pengumpulan, pengolahan, penyajian, analisis dan penafsiran data. Dengan kata lain, istilah statistika disini digunakan untuk menunjukkan tubuh pengetahuan (body of knowledge) tentang cara-cara penarikan sampel (pengumpulan data), serta analisis dan penafsiran data. Istilah statistik diatas juga digunakan untuk menunjukan ukuran-ukuran yang langsung diperoleh dari data sampel untuk menarik parameter populasinya. Sebagai contoh, rata-rata dari variansi yang diperoleh dari perhitungan terhadap data sampel disebut statistik sedangkan rata-rata dan variansi populasi disebut parameter. Jadi parameter menunjukkan ukuran-ukuran yang menjelaskan ciri atau karakteristik yang diperoleh langsung dari populasi[3].

  1. Jenis Statistika

Statistika dapat dibedakan berdasarkan orientasi pembahasannyam yaitu :

  1. Statistika matematik (mathemaatical statistics) atau statistika teoritis yang lebih berorientasi pada pemahaman model dan teknik-teknik statistika secara matematis-teoritis,
  2. Statistika terapan (applied statistics) yang lebih berorientasi kepada pemahaman intuitif atas konsep dan teknik-teknik statistika seta penggunaannya di berbagai bidang.

Sebagian penulis juga ada yang membedakan statistika berdasarkan tahapan atau tujuan analisisnya, yakni menjadi statistika deskriptif dan statistika inferensial atau statistika induktif.

Seperti dikatakan diatas, untuk menyimpulkan sesuatu persoalan diperlukan bahan atau keterangan yang dikumpulkan sebagaian atau seluruhnya dari persoalan yang sedang diselidiki. Biasanya bahan atau keterangan yang didapat dinyatakan dalam angka-angka. Bahan atau keterangan demikian, yang kebenarannya harus dapat dipercaya atau dapat diandalkan, disebut data statistik atau sering disebut data. Kebenaran atau keterandalan data adalah betul-betul hal yang perlu diperhatikan sebelum penelaahan lebih lanjut dilakukan.

Telah dikatakan, bahwa berdasarkan data yang dianalisis, kesimpulan-kesimpulan yang dibuat diharapkan cukup beralasan dan berlaku untuk persoalan secara keseluruhn. Persoalan yang menyeluruh ini, disertai dengan definii dan batas-batasnya yang jelas, di dalam statistika biasa dinamakan universum atau populasi atau kadang-kadang diberi nama status alami. Di dalam statistika yang lebih teoritis lagi, hal ini juga sering disebut ruang kesimpulan.

Dinyatakan dengan istilah baru ini statistika adalah pengetahuan yang membahas tentang cara-cara pengumpulan data serta penganalisisannya dan pembuatan kesimpulan berdasarkan analisis tersebut mengenai populasi dari mana data itu diambil.

Bagian statistika yang berhubungan dengan pembuatan kesimpulan mengenai populasi dinamakan  statistika induktif. Bagian lainnya dinamakan statistika deskriptif. Pengumpulan data, penyajian data, pembuatan tabel-tabel dan grafik-grafik dan melakukan perhitungan-perhitungan untuk menentukan statistik misalnya, termasuk ke dalam tugas statistika deskriptif. Hal-hal yang termasuk ke dalam statistika induktif anatara lain melakukan penaksiran tentang karakteristik daripada populasi, pembuatan prediksi, menentukan ada atau tidaknya asosiasi anatara karakteristik-karakteristik populasi dan pembuatan kesimpulan secara umum mengenai populasi.

Sesuai dengan namanya, statistika deskriptif bertugas hanya untuk memperoleh gambaran (description) atau ukuran-ukuran tentang data yang ada di tangan. Jika data yang dianalisis merupakan sampel dari suatu populasi maka statistika deskriptif akan menghasilkan ukuran-ukuran sampel (statistik), sedangkan jika data yang dianalisis merupakan keseluruhan populasi maka statistika deskriptif akan menghasilkan ukuran-ukuran populasi (parameter). Jadi, apabila kita menganalisis data dari 100 orang subjek sebagai sampel dari suatu populasi dan memperoleh nilai rata-rata (misalnya 69,7) dan variansinya (misalnya 11,4), maka prosedur yang digunakan sampai disini disebut statistika deskriptif. Demikian pula kita dapat menggunakkan prosedur yang sama untuk menganalisis dan memperoleh nilai rata-rata (misalnya 70,2) dan variansi (misalnya 10,9) dari seluruh populasi yang jumlahnya terhingga (misalnya 1.000 orang). Dalam contoh tersebut, angka 69,7 (rata-rata) dan 11,4 (variansi) disebut statistik, sedangkan angka 70,2 (rata-rata) dan 10,9 (variansi) disebut parameter.

Untuk memperoleh kesimpulan yang cukup beralasan, dapat dapat dipertanggungjawabkan sebaik mungkin, seperti telah berulang kali dikemukakan, kita harus menggunakkan data dan analisis yang benar. Dengan kata lain, adalah suatu keharusan untuk menempuh cara sedemikian rupa sehingga diharapkan akan diperoleh hasil kesimpulan yang sesuai dengan keadaan sebenarnya daripada populasi yang sedang diselidiki.

Cara yang seperti demikian dinamakan tak bias. Dalam statistika, cara yang sebaliknya, yakni cara bias, tersering tidak dikehendaki. Dengan demikian setiap langkah atau cara yang ditempuh dalam statistika hendaknya disebut takbias.

Namun, seringkali hanya mengumpulkan dan memperoleh data dari sejumlah sampel. Dengan menganalisis data sampel itu kita akan memperoleh sejumlah statistik yang kemudian dapat digunakan untuk menaksir ukuran populasi atau menguji hipotesis yang berlaku untuk populasi. Dengan kata lain, kita dapat menggunakkan data dan ukuran-ukuran sampel untuk melakukan inferensi tentang populasi. Statistika yang digunakan untuk tujuan ini disebut statistika inferensial. Sebagai contoh, statistika inferensial memungkinkan kita untuk menaksir rata-rata populasi dengan menggunakkan nilai rata-rata (69,7) dan variansi (11,4) yang diperoleh dari 100 orang sampel tanpa harus mengumpulkan data dari seluruh populasi (1.000 orang). Contoh ini menggambarkan bahwa statistika inferensial memungkinkan kita untuk bekerja lebih cermat (dengan meminimal kemungkinan kekeliruan manusia yang terlibat) dan lebih efisien (dengan meminimalkan waktu, biaya dan tenaga).

Dilihat dari asumsi mengenai distribusi populasi data yang dianalisis, statistika dibedakan menjadi :

  1. Statistika parametrik, teknik-teknik yang tergolong kaepada statistika parametrik didasrkan pada model distribusi normal,
  2. Statistika non-parametrik, teknik-teknik yang tergolong kepada statistika non-parametrik tidak didasarkan pada suatu model distribusi tertentu. Oleh karena itu, statistika non-parametrik dikenal juga dengan sebutan statistika bebas distribusi (distribution free statistics).

Pada umumnya, setiap teknik pengujian hipotesis pada statistika parametrik ada teknik padanannya dengan statistika non-perametrik.

Statistika juga dibedakan berdasarkan jumlah peubah (variabel) terikat (dependent variable) yang dianalisi yakni menjadi statistika unvariant, dan statistika multi variant. Teknik analisis statistik yang melibatkan hanya satu peubah terikat termasuk kadalam statistika unvariant, terlepas dari beberapa banyak peubah bebasnya. Sebaliknya, statistika multivariantmeliputi semua teknik analisis statistikyang melibatkan paling tidak dua peubah terikat sekaligus. Namun demikian, disini perlu diinformasikan bahwa klasifikasi yang ditmukan pada sejumlah buka yang baik secara implisit maupun eksplisit, mendasar penggolongan tersebut hanya pada jumlah peubah yang dianalisis, terlepas apakah itu peubah bebas (independent variable) atau peubah terikat (dependent variable).

Jenis-jenis statistika yang dibedakan atas dasar kajiannya ini terlalu banyak untuk disebutkan satu-persatu. Sebagai contoh statistika yang dipergunakkan di bidang pertanian disebut statistika pertanian. Demikian pula dengan istilah biostatistics, statistika ekonomi, statistika pendidikan, dan lain-lain. Pada prinsipnya, semua konsep dan teknik statistika yang ada dapat digunakan pada seluruh bidang jadi tidak ada perbedaan konseptual antara statistika pertanian dengan statistika ekonomi.

  1. Pengukuran dan Data Statistik
  2. Pentingnya Pengukuran dalam Penelitian

Analisis data secara kuantitatif dan teknik statistik merupakan dua hal yang berbeda tetapi sangat berkaitan satu sama lain. Analisis data adalah suatu kegiatan yang dinamis dan kreatif dengan bantuan teknik statistik yang bersifat mekanistik. Kegiatan analisis data melibatkan pertimbangan dan kebutuhan subjektif, sedangkan teknik statistik terdiri atas rumus atau alogaritma yang baku. Dengan demikian suatu analisis data, sampai batas tertentu bergantung pada kemampuan dan pengalaman orang yang melakukannya.

Suatu teknik analisis statistik merupakan seperangkat prosedur yang siap digunakan untuk memproses data dan menghasilkan ukuran-ukuran tertentu mengenai kecenderungan dan karakteristik data yang bersangkutan. Teknik analisis statistik dan perangkat elektroniknya (kalkulator dan komputer) akan memproses perangkat apa saja, sesuai dengan konstrein yang ada, tanpa memperhatikan maknanya. Secara singkat, dapat dikatakan bahwa makna hasil analisis statistika sangat bergantung pada makna data yang diolah. Teknik statistik bukanlah prosedur yang dapat mengubah sampah menjadi kaertas atau pupuk yang berharga.

Uraian diatas dimaksudkan untuk menekankan bahwa pengukuran merupakan kegiatan awal yang esensial dalam analisis data. Pengukuran merupakan kegiatan untuk menyediakan data yang akan dijadikan masukan dalam anlisis statistika. Makna suatu angka atau bilangan merupakan tanggungjawab kegiatan pengukuran.

Secara teknis, isu tersebut dikenal dengan istilah validitas data. Validitas merupaka isu sentral dalam setiap penelitian. Validitas penelitian antara lain amat bergantung pada validitas data yang diperoleh. Jika data yang diperoleh tidak valid, maka kegiatan analisis dan penafsiran data yang mengikutinya tidak ada gunanya lagi. Hasil penelitian dan kesimpulan yang diperoleh berdasarkan data yang tidakvalid bukan hanya keliru melainkan juga dapat menjerumuskan pengambil keputusan dan masyarakat pada umumnya pada tindakan yang salah. Uraian ini, sekali lagi menekankan esensi pengukuran sebagai kegiatan untuk memperoleh data yang valid.

  1. Jenis Data dan Skala Pengukuran

Data dapat digolongkan menjadi data diskrit dan data kontinu. Banyaknya anak di suatu keluarga, jumlah rumah di suatu desa, banyaknya penduduk di suatu daerah, dan jumlah mobil di kantor tertentu merupakan data diskrit. Sedangkan tingkat kecerdasan, prestasi belajar, berat badan, dan daya tahan mobil merupakan contoh data kontinu.

Sesuai dengan nama yang digunakan, data diskrit bersifat terkortak-kotak, yaitu tidak dikonsepsikan adanya nilai-nilai diantara data (bilangan) yang satu dengan data (bilangan) lain yang terdekat. Misalnya jika bilangan 2 dan 3 menunjukkan jumlah anak di keluarga A dan keluarga B, maka diantara kedua bilangan tersebut tidak ada bilangan-bilangan lain. Tidak pernah kita mnengatakan bahwa jumlah anak di suatu keluarga adalah 2,4 atau 2,9.

Berbeda dengan data diskrit, diantara dua data kontinu dikonsepsikan adanya sejumlah nilai dengan jumlah yang tidak terhingga. Jika bilangan 2 dan 3 diatas menunjukkan berat suatu benda, maka iantara keduantya terdapat kemungkinan adanya sejumlah bilangan lain yang tidak terhingga, seperti 2,0001, 2,0002, 2,0010, 2,0021 dan sebagainya. Dikatakan tidak terhingga jumlahnya, karena kemungkinan nilai yang terjadi memang terlalu banyak dan tidak dapat ditentukan. Jika kita mencatat data dalam dua desimal di belakang koma, maka diantara 2 dan 3 akan terdapat 99 nilai. Coba bayangkan, jika setiap data harus dicatat dalam 5, 10 atau 15 desimal di belakang koma.

Dilihat dari skala pengukuran yang digunakan, data dibagi 4 jenis yang bersifat hirearkhis, yaitu data yang berskala nominal (data nominal), data yang berskala ordinal (data ordinal), dan data yang berskala interval (data interval), dan data yang berskala rasio (data rasio). Skala nominal merupakan jenis skala yang paling rendah, diikuti oleh skala ordinal, skala interval, dan kemudian skala rasio.

Data nominal memiliki skala yang bersifat kategorikal atau pengelompokkan. Jenis kelamin, warna kulit, dan agama merupakan contoh data nominal yang sering dijumpai pada buku-buku statistika. Pada contoh tersebut, kita memahami bahwa dengan data nominal kita hanya dapat mengetahui gahwa subjek termasuk ke dalam kategori tertentu (pria dan wanita hitam atau putih atau sawo matang, Islam atau Kristen atau Hindu atau lainnya): sekali-kali lagi kita tidak mengatakan bahwa pria lebih rendah atau lebih tinggi dari wanita, kulit hitam memiliki nilai yang lebih rendah dari warna putih, dan sebagainya. Nama kelompok atau kategori digunakkan disini hanya untuk mengenali identitas subjek dilihat dari variabel tertentu. Perbedaan subjek dalam data nominal bersifat kualitatif dann tidak mempunyai makna kuantitatif.

Data ordinal memiliki skala yang menunjukkan perbedaan tingkatan subjek secara kuantitatif. Contoh dari yang paling gamblang dari data ordinal adaklah data yang dinyatakan dalam bentuk peringkat atau ranking. Selain kita dapat menyatakan bahwa seorang subjek termasuk kelompok yang menduduki peringkat tertentu (sifat data nominal), pada data ordinal kita juga, dapat menyatakan bahwa subjek atau kelompok yang menduduiki peringkat lain (dibawahnya). Kita dapat mengatakan bahwa siswa yang menduduki peringkat kedua pada suatu variabel memiliki kemampuan atau skor yang lebih tinggi pada variabel itu daripada siswa yang menduduki peringkat ketiga. Secara singkat, dapat dikatakan bahwa data ordinal, disamping memiliki sifat yang terdapat pada data nominal juga menunjukkan kedudukan (tingkatan) subjek dalam suatu kelompok pada suatu variabel.

Data yang berskala rasio (data rasio) hampir sama dengan data interval, yakni keduanya memiliki ketiga sifat diatas (menunjukkan klasifikasi dan kedudukan subjek dalam suatu kelompok, serta sifat persamaan jarak). Data rasio berbeda dengan data interval karena yang pertama (data rasio) memiliki nilai mutlak nol. Sebagai konsekuensi dari asumsi tentang adanya nilai mutlak nol, kita dapat membuat perbandinga (rasio) antara skor-skor yang berskala rasio. Sebagai contoh, 20 kg adalah 2 kali 10 kg, 15m = 3 x 5m, dan sebagainya. Kita dapat bermakana menyatakan bahwa orang yang beratnya 80kg adalah dua kali berat orang yang berat badannya 40kg. Pernyataan semacam ini tidak dapat dibuat dengan menggunakkan data interval. Kita tidak dapat mengatakan bahwa tingkat kecerdasan orang yang memiliki I.Q. sebesar 150 adalah satu setengah kali tingkat kecerdasan orang yang memiliki I.Q. sebesar 100.

  1. Tabel dan Grafik

Data statistik dan hasil penelitian sering disajikan dalam bentuk tabel dan grafik. Kedua hal ini merupakan ringkasan data statistik yang sangat menarik dan komunikatif seperti suatu pepatah yang mengatakan : “a picture is worth a thousand of words”. Memang sebuah grafik atau tabel dapat mewakili ratusan atau bahkan ribuan kata dalam suatu bentuk yang kompak dan menarik.

Kegiatan pengukuran akan menghasilkan seperangkat data yang disebut data mentah atau skor mentah (raw score) jika data itu berbentuk skor. Untuk menghayati pentingnya tabel dan grafik, perhatikanlah data (skor) fiktif berikut yang mungkin diperoleh dari suatu kegiatan pengukuran.

89 79 67 62 69 69 67
65 36 64 65 59 56 91
73 81 71 95 86 45 48
66 83 77 82 41 56 43
50 55 72 66 68 75 63
46 47 57 41 64 54 38
81 85 77 70 57 41 64
68 60 43 45 72 93 54

Makna apa yang dapat ditafsirkan dari perangkat data tersebut? Walaupun dikatakan bahwa 80 skor merupakan hasil tes kemampuan Matematika yang terdiri dari 100 butir sioal, tampaknya kita umumkan masih mengalami kesulitan untuk memberikan makna terhadap perangkat data tersebut. Penyajian data seperti ini tidak kompak dan tidak menarik. Lebih dri itu, data diatas sulit dibaca maknanya. Kalaupun ada orang yang dapat menemukan makna tertentu, tafsirannya belum tentu sesuai dengan maksud yang hendak ditekankan oleh penyaji karena banyaknya kemungkinan tafsiran yang dapat dijabarkan dari data itu sesuai dengan sudut pandang masing-masing. Pendek kata, penyajian data seperti diatas tidak komunikatif.

Dalam statistik deskriptif, grafik merupakan alat yang tidak dapat digantikan oleh alat lain. Sejumlah software komputer menyediakan fasilitas yang sangat intensif untuk mendesain da menghasilkan grafik, seperti Harvard Graphic, dan SYTAT. Hal ini antara lain karena grafik lebih mudah difahami, dan banyak hal daripada tabel yang terbaik sekalipun.

  1. Daftar Distribusi Frekuensi

Daftar distribusi frekuensi menunjukkan rincian skor dari suatu perangkat data beserta frekuensinya masing-masing dalam suatu pengukuran. Daftar distribusi frekuensi menggambarkan seberapa sering masing-masing skor pada perangkat data itu muncul. Jilka kita melempar uang logam, maka ada dua kemungkinan gambar yang muncul, yaitu gambar muka (M) dan gambar belakang (B) hanya muncul sebanyak 4 kali. Dengan perkataan lain, M memiliki frekuensi 6 sedangkan B memiliki frekuensi 4. Data tersebut dapat digambarkan dalam sebuah daftar distribusi frekuensi seperti tabel 2.1.

Tabel 2.1.

Daftar Distribusi Frekuensi Hasil Pelemparan

Sebuah Uang Logam

Bagian yang Muncul Frekuensi
Muka (M) 6
Belakang (B) 4
Jumlah 10

Tabel 2.1. merupakan conto daftar distribusi sederhana yang terdiri atas empat barisdan dua kolom dimana baris pertama berisi judul setiap kolom. Disamping judul tabel, untuk memudahkan pembaca , setiap kolom dan baris juga sebaiknya diberi judul sesuai keperluan. Jika diperluka sumber dari mana data diperoleh dicantumkan pada bagian bawah tabel.

Tabel 2.2

Nilai Akhir Mata Kuliah X Berdasarkan

Jenis Kelamin Mahasiswa

Nilai Akhir Pria Wanita Jumlah
f % f % f %
A 20 22 23 25 43 24
B 35 39 31 34 66 36
C 29 32 27 30 56 31
D 5 6 8 9 13 7
E 1 1 2 2 3 2
Jumlah 90 100 91 100 181 100

Untuk menghemat tempat, judul setiap kolom dan baris dari tabel yang kompleks dapat disingkat dengan menggunakkan simbol-simbol yang yang lazim atau dengan disertai keterangan sesuai keperluan. Sebagai contoh, huruf f biasanya digunakkan untuk menunjukkan frekuensi, huruf n digunakkan untuk menunjukkan sebuah sampel, dan N untuk menunjukkan besarnya populasi.

Tabel 2.2 merupakan contoh daftar distribusi frekuensi (data fiktif) yang sebagian judul kolomnya dipendekkan, yaitu f untuk frekuensi dan % untuk persen.

Tabel 2.1. dan 2.2. diatas merupakan contoh daftar distribusi frekuensi data yang tidak dikelompokkan karena frekuensinya dicantumkan untuk setiap skor (nilai) yang muncul. Daftar distribusi frekuensi seperti ini dapat digunakkan jika skor (nilai) yang diperoleh relatif tidak beragam. Namun, jika skor atau nilai yang hendak dianilisis cukup beragam, maka daftar distruibusi frekuensi seperti diatas tidak memadai lagi. Sebagai contoh, perhatikan perangkat dat fiktif pertama diatas dengan jumlah sampel sebanyak 80. Data tersebut cukup beragam dengan skor terkecil 36 dan skor terbesar 95, sehingga jika distribusi frekuensinya dibuat seperti diatas tidak akan membantu memudahkan dalam menafsirkannya.

Secara berurutan, langkah-langkah untuk menusun daftar distribusi data yang deikelompokkan adalah sebagai berikut :

  1. Menentukkan rentang,

Rentang (range) suatu perangkat data yang biasanya dilambangkan dengan huruf R adalah skor terbesar dikurangi skor terkecil. Dengan demikian rentang perangkat data diatas dapat ditemukan yaitu,

R = 95 – 36 = 59.

  1. Panjang Kelas,

Panjang kelas (p) atau interval (i) menunjukkan banyaknya angka (nilai) yang tercakup oleh suatu interval kelas. Sebagai contoh, pada interval 4 -8 (untuk data yang dicatat dalam bilangan bulat) terdapat lima buah angka, yaitu 4, 5, 6, 7, dan 8. Dengan demikian panjang kelas (p atau i) untuk interval kelas tersebut adalah 5; jadi p = 5.

Panjang kelas dapat ditentukkan dengan beberapa cara. Salah satu cara yang dapat membantu menentukkan panjang kelas adalah rumus yang diusulkan oleh Sturgess (Sudjana, 1975: 46), yaitu

Dengan menggunakkan rumus diatas, panjang kelas yang diperlukan untuk mengelompokkan data diatas dapat ditentukan seperti berikut:

P = 1 + 3.3 log 80 = 7,3

Jadi panjang kelas untuk pengelompokkan data dari 80 subjek adalah sekitar 7 atau 8. Hal yang perlu dicatat disini adalah bahwa panjang kelas dapat berupa bilangan desimal atau bilangan bulat bergantung pada pencatatan data yang dikelompokkan. Oleh karena data dalam contoh diatas dicatat dalam bilangan bulat, maka panjang kelasnya pun harus berupa bilangan bulat.

  1. Banyak Kelas

Banyak kelas (bk) mrnunjukkan jumlah interval kelas yang diperlukan untuk mengelompokkan suatu perangkat data. Banyak kelas selalu berbentuk bilangan bulat dan sebaiknya berkisar antara 5 sampai 20. Banyak kelas suatu perangkat data dapat ditemukan dengan rumus :

Dengan menggunakkan R = 59 dan p = 7, maka banyak kelas yang diperlukan perangkat data pada contoh datas adalah:

bk = 59 : 7 = 8,43

Dengan demikian untuk pengelompokkan perangkat data pada contoh diatas   diperlukan sekitar 8 atau 9 interval kelas.

  1. Interval Kelas

Untuk menyusun interval kelas, perlu ditentukan dahulu bilangan awal untuk interval kels pertama (paling bawah). Bilangan awal ini sebaiknya merupakan kelipatan dari panjang kelas (p) dan tidak lebih kecil dari sko terkecil dikurangi panjang kelas. Bilangan awal ini harus sama dengan atau lebih kecil dari skor terkecil. Sejalan dengan prinsip-prinsip tersebut, maka untuk mengelompokkan contoh data diatas sebaiknya dipilih angka 35 sebagai bilangan awal. Angka 35 merupakan kelipatan dari panjang kelas (p = 7), lebih kecil dari skor terkecil dan selisihnya dengan skor terkecillebih besar dari panjang kelas.

Tabel 2.3.

Daftar Distribusi Frekuensi Contoh Data Fiktif

Interval Kelas Turus Frekuensi
91-97 III 3
84-90 IIIII 5
77-83 IIIII III 8
70-76 IIIII IIIII III 13
63-69 IIIII IIIII IIIII IIII 19
56-62 IIIII IIIII IIIII 15
49-55 IIIII IIII 9
42-48 IIIII I 6
35-41 IIII 4
Jumlah - 80

Dengan bilangan awal 35 dan panjang kelas 7, maka kelas pertama untuk contoh data diatas adalah 35-41 yang meliputi 7 macam nilai yaitu, 35, 36, 37, 38, 39, 40, dan 41. Interval kelas berikutnya adalah 42-48, 49-55 dan seterusnya.

  1. Frekuensi setiap kelas diperoleh dengan turus (tally) setiap nilai yang ada pada interval kelas masing-masing dan kemudian menjumlahnya banyaknya turus yang didapat. Melalui kelima langkah ini, maka daftar distribusi frekuensi untuk contoh data diatas dapat dibuat seperti tabel 2.3.

Tabel 2.3. terdiri atas 9 kelas dengan panjang masing-masing kelas sama dengan 7. Setiap kelas dibatasi oleh dua buah skor, yaitu batas bawah (lower limit) dan batas atas (upper limit). Batas bawah suatu els adalah skor (nilai) terkecil (terendah) pada kelas itu, misalnya 35 untuk nilai kels terbawah, 42 untuk kelas kedua, dan 91 untuk kelas teratas. Sedangkan batas suatu kelas adalah skor terbesar atau tertinggi pada kelas yang bersangkutan, seperti nilai-nilai yang ada di sebelah kanan setiap kalas (41, 48, 55,…, dan 97).

Selain itu karena datanya bersifat kontinu (bukan diskrit), maka setiap kelas juga memiliki batas nyata (real limit), yaitu batas nyata bawah (lower real limit) dan batas nyata atas (upper real limit).

  1. Titik Tengah

Istilah lain yang perlu difahami adalah titiktengah (midpoint). Sesuai dengan namanya titik tengahsuatu kelas merupakan nilai yang membagi kelas itu menjadi dua bagian sama besar. Dengan kata lain, titik tengah suatu kelas adalah setengah dari umlah batas bawah dan batas atas kelas itu. Secara aljabar, pengertian tersebut dapat ditulis

Sebagai contoh, titik tengah kelas 35-41 adalah  (35 + 41) = 38; ada tiga nilai dibawahnya (35, 36, dan 37) dan tiga nilai lain diatasnya (39, 40, dan 41). Titiktengah ini sering digunakkan sebagai wakil kelas yang bersangkutan dalam analisis statistika.

Dalam suatu penelitian, jumleh atau presentase subjek yang mendapat nilai lebih daripada skor tertentu mugkin merupakan hal yang menarik untuk ditelaah. Informasi tentang hal ini dapat dngan mudah diperoleh dengan menambahkan frekuensi kumulatif (fk) pada daftar distribusi frekuensi diatas (Tabel 2.3.). frekuensi kumulatif dapat diperoleh dengan cara menambahkan frekuensi (f) di setiap kelas dari bawah ke atas. Jika tabel 2.3. diatas dilengkapi dengan presentasi kumulatif maka akan terlihat daftar distribusi frekuensi pada tabel 2.4.

Daftar distribusi frekuensi seperti Tabel 2.4. memberikan informasi yang lebih lengkap dibandingkan dengan Tabel 2.3. Dari Tabel 2.4, misalnya, dapat dikatakan bahwa 66 atau sekitar 82,5% subjek memperoleh skor tidak lebih dari 76. Contoh lain adalah bahwa subjek yang memperoleh skor 70 keatas berjumlah sekitar 17,5%.

Tabel 2.4.

Frekuensi dan Presentase Kumulatif Data pada Tabel 2.3.

skor f fk %
91-97 3 80 100,0
84-90 3 77 96,3
77-83 8 74 92,5
70-76 13 66 82,5
63-69 19 53 66,3
56-62 15 34 42,5
49-55 9 19 23,8
42-48 6 10 12,5
35-41 4 4 5,0
Jumlah 80 - -

Uraian dan contoh sederghana tersebut menunjukkan bahwa penyajian data melalui tabel mempermudah peneliti atau pembaca memahami fenomena yang diamati dan maksud yang hendak disampaikan. Bentuk dan tafsiran yang akan ditonjolkan bergantung pada permasalahan atau isu yang tengah dikaji.

  1. Grafik

Perangkat data dapat ditampilkan secara visual dalam bentuk grafik. Dengan bantuan grafik, perangkat data yang besar dan kompleks dapat disajikan secara menarik menjadi suatu tampilan sederhana dan kompak. Grafik yang dipersiapkan dan dibuat secara baik akan menambah keindahan dan daya tarik laporan penelitian. Lebih dari itu, grafik akan membantu menyederhanakan keadaan yang kompleks sehingga mudah difahami oleh para pembaca. Sejumlah laporanpenelitian, urnal, koran, dan majalah memanfaatkan grafik sebagai alat bantu yang efektif dalam menyampaikan informasi.

Sejumlah jenis grafik dapat ditemukan pada berbagai sumber informasi, seperti buku, jurnal, dan kantor. Sudjana (1986) merupakan buku statistika yang mmberikan penjelasna dan contoh bermacam grafik secara intensif. Wilkinson (1990), SYSGRAPH, adalah salah satu buku manual yang secara khusus menyajikan berbagai macam grafik dan cara membuatnya dengan menggunakkan SYSTAT.

  1. Histogram

Histogram adalah suatu bentuk grafik yang menggambarkan sebaran (distribusi) frekuensi suatu perangkat data dalam bentuk batang. Histogram digunakkan untuk menggambarkan secara visual frekuensi data yang bersifat kontinu, untuk data yang berbentuk kategori, tampilan visual yang serupa disebut diagram batang (bar chart).

Untuk menggambar hisogram iperlukan sumbu datar (absis) dan sumbu tegak (ordinat). Sumbu datarnya selalu melukiskan data yang telah dintyatakan dalam kelas-kelas interval. Titik-titik pembagian pada sumbu ini, yang sering diambil ialah ujung-ujung bawah dari tiap kelas interval. Jika ujung bawah kelas interval pertama cukup besar harganya, maka sumbu datar, antara titik asal dan harga tersebut, seperti biasa dilakukan pemutusan. Pada sumbu tegaknya selalu menyatakan banyak data (frekuensi), baik mutlak ataupun relatif. Pemutusan pada sumbu ini tidak pernah dilakukan[4].

Gambar 2.1. merupakan histogram distribusi frekuensi data pada tabel 2.4.

38
45
52
59
66
73
80
87
94

33

S k o r

Pada gambar 2.1., angka 38, 45, 52,…, 87 dan 94 merupakan titiktengah setiap kelas, dan bersedia di antara dua batas nyata kelas yang bersangkutan.

  1. Frekuensi Poligon

Pada histogram diasumsikan bahwa skor-skor suatu interval kelas menyebar secara merata. Sebagai contoh, tinggi grafik semua skor pada kelas pertama, 35-41, contoh diatas (Tabel 2.4.) adalah sama (f = 4). Pada frekuensi poligon, skor-skor itu diasumsikan terpusat pada titiktengah kelasnya.

  1. Ogif

Ogif (ogive) merupakan poligon yang dibuat atas dasar frekuensi kumulatif seperangkat data. Secara lebih tegas dapat dikatakan bahwa grafik ogif merupakan gambaran visual dari frekuensi kumulatif perangkat data. Sehubungan dengan hal itu, sebagian penulis seperti Ferguson dan Takane (1989) menyebut grafik ogif dengan istilah frekuensi poligon kumulatif. Garis suatu ogif menghubungkan batas nyata atas/bawah setiap interval kelas.

  1. Bentuk Grafik Lain

Hal yang terpenting untuk diperhatikan adalah bahwa grafik itu dibuat untuk merangkum dan menyederhanakan data yang kompleks menjadi suatu gambar yang informatif dan mudah difahami oleh pembaca yang menjadi sasaran. Grafik yang kompleks dapat merangkum dan memberikan informasi tentang banyak hal, namun sering menuntut kejelian dan kecermatan pembaca untuk memahaminya.

  1. Pengujian Hipotesis Menggunakan Rumus Statistika
  2. Inferensi tentang Koefisien Korelasi Populasi

Walaupun perhitungan koefisien korelasi tidak menuntut asumsi tertentu mengenai distribusi perubah X dan Y (Edwards, 1984), namun sejumlah faktor yang mempengaruhi besarannya perlu dipertimbangkan sehingga tafsiran yang diberikan terhadapnya tidak salah arah. Diantara faktor-faktor dimaksud, titik-titik kordinat yang menyimpang dari garis lurus dan besarnya variasi masing-masing peubah perlu mendapat perhatian khusus.

Lebih dari itu, manakala peneliti hendak menggunakkan koefisienkorelasi sampel () untuk melakukan inferensi tentang parameter populasinya () maka ia perlu memperhatikan beberapa asumsi mengenai distribusi kediua peubah yang bersangkutan, yaitu :

  1. Nilai (skor) yang berpasangan sebanyak n telah disampel secara acak dan populasinya.
  2. Skor anatara subjek yang diteliti tidak saling mempengaruhi satu sama lain (bersifat independent).
  3. Distribusi bersama kedua peubah itu adalah normal (bivariate normal distribution).

Kedua asumsi pertama (keacakan sampel dan independensi antara skor subyek) juga merupakan asumsi yang mendasari uju perbedaan dua buah rata-rata. Distribusi (populasi) bersama seperangkat pasangan skor (katakanlah, X dan Y) disebut bivariate normal, jika :

  1. Populasi masing-masing peubah tersbut berdistribusi normal.
  2. Untuk setiap kemungkinan nilai X, populasi skor Y berdistribusi normal.
  3. Variansi populasi skor Y antar setiap kemungkinan nilai X sama besar.
  4. Untuk setiap kemungkinan nilai Y, populasi skor X berdistribusi normal.
  5. Variansi skor distribusi X antar setiap kemungkinan nilai Y sama besar.

Jika kelima kondisi tersebut terpenuhi maka tidak ada kemungkinan lain kecuali bahwa kedua peubah berhubungan secara linier. Persoalannya adalah bahwa, secara teknis, pengujian atas lima kondisi itu tidak mudah dilakukan. Kedua asumsi yang dimaksud adalah :

  1. Kedua peubah yang dikorelasikan, masing-masing, berasal dari populasi yang berdistribusi normal,
  2. Hubungan anatara keduanya (misalnya Y atas X) dapat dihampiri oleh model regresi linier.

Dalam praktek sehari-hari terpenuhinya kedua asumsi tersebut sering digunakkan untuk memuaskan asumsi bivariate normal. Para peneliti seringkali menguji kedua asumsi tersebutr secara visual melalui grafik atau distribusi unvariant (asumsi normalitas distribusi masing-masing peubah) dan bivariate (linieritas regresi). Teknik pengujian yang lebih sitematik atas kedua asumsi tersebut juga telah dikembangkan seperti uji kuadrat-chi (normalitas distribusi populasi) dan uji linieritas regresi populasi dengan menggunakkan distribusi F.

  1. Distribusi Sampel Koefisien Korelasi

Bayangkan suatu populasi nmengenai pasangan dua peubah (X dan Y) yang memiliki koefisien korelasi sebesar . Dari populasi tersebut, sejumlah pasangan skor (X dan Y) sebesar n disampel secara acak. Atas dasar itu, sampel koeisien korelasi sebesar  kemmudian dapat dihitung dan ditentukan. Jika kegiatan semula dilakukan secara berulang maka akan diperoleh sejumlah sampel koefisien korelasi sebesar   ….,

Bayangkan lagi bahwa dari sejumlah koefisien korelasi sampel tersebut, kita kemudian membuat sebuah daftar distribusi frekuensi dengan koefisien korelasi sebagai absisnya. Hasilnya adalah sebuah distribusi koefisien korelasi sampel. Disini setiap nilai koefisien korelasi diperlakukan seperti X (skor) pada daftar distribusi frekuensi.

Bentuk distribusi korelasi koefisien sampel tidak tetap bergantung kepada nilai koefisien korelasi populasinya (). Jika  sama dengan atau mendekati nol dan n masing-masing relatif besar maka distribusi nilai-nilai koefisien korelasi sampel akan berbentuk atau mendekati bentuk normal. Namun, jika  tidak sama dengan atau mendekati nol n masing-masing sampel relatif kecil maka distribusi nilai-nilai koefisien korelasi sampel cenderung lancip atau juling ke kiri atau ke kanan.

  1. Pengujian Hipotesis dalam Analisis Korelasi

Sekurang-kurangnya ada dua macam hipotesis nol yang mungkin menarik untuk diuji melalui analisis korelasi sederhana. Pertama, hipotesis nol bahwa kedua peubah tidak berhubungan satu sama lain. Seringkali, peneliti menduga bahwa suatu peubah berhubungan secara positif atau negatif dengan satu peubah lainnya. Jika dugaan seperti ini diterjemahkan ke dalam hipotesis statistik maka menjadi sebagai berikut :

Hubungan Positif

:  = 0

:   > 0

Hubungan Negatif

:  = 0

:  < 0

Kedua, hipotesis nol bahwa koefisien korelasi antara dua peubah sama dengan nilai tertentu. Misalnya seorang peneliti menduga bahwa tingkat ekonomi orangtua berhubungan erat dengan asprirasinya atas pendidikan anak; dalam arti bahwa aspirasi seseorang atas pendidikan anak cenderung meningkat seiring dengan peningkatan tingkat ekonomninya. Misalnya lagi, peneliti mendefinisikan bahwa hubungan erat antara keduanya harus ditunjukkan oleh koefisien korelasi diatas 0,40. Jika tingkat ekomnomi tersebut peubah X dana aspirasi atas pendidikan anak tersebut peubah Ymaka dugaan peneliti tersebut dapat diterjemahkan ke dalam hipotesis statistik seperti beriikut :

:  = 0,40

:   > 0,40

  1. Pengujian Hipotesis nol bahwa  = 0

Untuk menguji bahwa koefisien korelasi populasi antara dua peubah sama dengan nol (tidak ada hubungan) dapat dilakukan melalui beberapa cara. Jika dilakukan dengan benar, seluruh cara itu akan menghasilkan kesimpulan yang sama. Salah satu cara yang lazim digunakan adalah dengan menghitung t seperti dalam rumus (13.1)

t =

Dimana

= koefisien korelasi sampel yang diperoleh

jumlah sampel

  1. Pengujian hipotesis nol bahwa  = nilai tertentu

Diatas telah dijelaskan bahwa bentuk distribusi sampel koefisien korelasi berbeda-beda bergantung pada nilai-nilai koefisien korelasi populasinya.model distribusi sampel itu sulit digunakan sebagai patokan dalam pengujian hipotesis nol bahwa  = nilai tertentu. Untuk mengatasi kesulitan ini, nilai  perlu diubah menjadi peubah baru ()

(1-)
  1. Pengujian Hipotesis dalam Analisis Regresi

Pengujian tentang hipotesis nol tentang nilai koefisien regresi di dalam populasi dilakukan dengan rumus (13,5).

t =

BAB III

KESIMPULAN

Kemajuan ilmu pengetahuan dan teknologi tidak dapat dipisahkan dari statistika. Para peneliti menggunakkan statistika sebagai alat bantu dalam memahami gejala-gejala yang diamatinya. Statistika membantu para peneliti mampu menyederhanakan kompleksitas suatu gejala sehingga lebih mudah difahami pemikiran manusia yang terbatas. Atas bantuan statistika, penemuan-penemuan yang dihasilkan oleh para ilmuwan juga dapat dikomunikasikan ke masyarakat secara kompak, singkat dan akurat.

DAFTAR PUSTAKA

  1. Nurhasan, 1998. Handout Statistik. Bandung : FPOK IKIP.
  2. Sudjana, 2000. Statistika “Untuk Ekonomi Dan Niaga”. Bandung : Tarsito.
  3. Furqan. 2009. Satistika “Terapan untuk Penelitian”. Bandung : Alfabeta.
  4. Jalaludin Rakhmat. Metodologi Penelitian Komunikasi “Disertai Contoh Statistik”. Bandung : Remaja Rosdakarya.

[1] Sudjana, Statistika untuk Ekonomi dan Niaga, Bandung : Tarsito 2000, p. 3.

[2] Nurhasan, Handout Statistik, Bandung : FPOK IKIP 1998, p.2.

[3] Furqan, Statistika Terapan Untuk Penelitian, Bandung : Alfabeta 2009, p. 3.

[4] Sudjana, Statistika untuk Ekonomi dan Niaga, Bandung : Tarsito 2000, p. 92.

One response to “Pengertian Statistika

  1. Pingback: Pendahuluan Statiska Ekonomi | M. Arief Fauzi

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s