Friday, September 28, 2007

Jenis-jenis Validitas

VALIDITAS

Jika kita membandingkan sejumlah buku metode penelitian, maka Anda pasti tidak akan menemukan “kesepakatan” di antara para penulis buku tersebut terutama dalam dalam jumlah/ragam jenis validitas dan pengelompokkannya. Saya sudah melakukan content analysis kecil-kecilan terhadap sejumlah buku metode penelitian baik di bidang sosial maupun pemasaran, hasilnya saya menemukan ada 4 jenis validitas yang sering disebutkan yaitu : Face Validity, Content Validity, Criterion Validity, dan Construct Validity. Sebaiknya Anda tetap menyebutkan jenis-jenis validitas ini dalam “bahasa londo”-nya karena di antara para penulis buku-buku metode penelitian sepertinya belum ada kesepakatan penerjemahan. Jenis validitas yang paling beragam terjemahannya adalah Face Validity. Terjemahan yang digunakan terhadap Face Validity di antaranya : validitas rupa, validitas muka, validitas paras, dan validitas permukaan (saya pribadi setuju yang ini…). Yang rada ngaco adalah terjemahan Content Validity, manakala sebagian besar buku menerjemahkannya sebagai validitas isi, eh ada buku yang menerjemahkannya dengan validitas kandungan (validitas ibu-ibu hamil kalee …). Sepertinya memang sudah saatnya ada suatu standar baku dalam menerjemahkan istilah-istilah di dunia metode penelitian (ada yang berminat mempeloporinya?…)

Oke, lalu apa sebenarnya validitas? Judul tulisan ini adalah defenisi validitas yang paling sederhana, benar-benar benar! Dengan kata lain suatu instrumen penelitian dikatakan valid jika mampu menghasilkan data yang benar-benar benar. Data yang benar-benar benar dihasilkan oleh instrumen yang mengukur apa yang seharusnya diukur. Contoh dalam kehidupan sehari-hari, timbangan beras valid untuk menimbang sekarung beras tapi tidak valid menimbang sehelai surat, termometer tubuh valid untuk mengukur suhu tubuh tapi tidak valid mengukur suhu air mendidih, jika dipaksakan dijamin ancur tuh termometer (sure deh, percaya deh, saya pernah membuktikannya waktu kecil, alhasil uang jajan saya dipotong oleh ibu saya untuk mengganti termoternya yang pecah). Contoh yang lebih relevan dengan dunia penelitian, apakah cukup dengan hanya menanyakan pengeluaran rutin perbulan maka kita sudah mengukur status sosial dan ekonomi seseorang? Ukuran pengeluaran rutin perbulan tidak valid dalam mengukur status sosial dan ekonomi seseorang, alat ukur tersebut hanya mengukur status ekonomi!

Validitas terdiri dari beberapa jenis, seperti yang telah disebutkan sebelumnya. Ke empat jenis validitas tersebut masih bisa dikelompokkan menjadi validitas konsensus dan validitas komparasi. Termasuk dalam validitas konsensus adalah face validity dan content validity. Pengertian konsensus disini adalah kesepekatan para ahli/pakar dibidangnya bahwa suatu ukuran/instrumen memang benar atau tepat adanya mengukur suatu fenomena/gejala. Misalnya untuk menentukan dominasi suatu produk atau perusahaan di pasar tertentu maka kita bisa mengukurnya dengan menghitung market share (pangsa pasar) dari produk atau perusahaan tersebut baik secara unit maupun sales. Semua ahli marketing pasti menyarankan alat ukur ini jika Anda ingin mengetahui dominasi produk atau perusahaan Anda dalam pasar tertentu. Validitas konsensus ini merupakan validitas yang “cetek”, alias paling sederhana, cenderung subjektif, sehingga kurang menantang gitu loh. Tidak diperlukan perhitungan matematis untuk meloloskan suatu alat ukur dari saringan validitas ini. Perbedaan antara face dengan content validity hanyalah pada jumlah dimensi konsep yang diukur. Jika suatu konsep cukup diukur dengan satu atau dua variabel maka loloslah dia dari saringan face validity, misalnya konsep market share. Namun jika suatu konsep melibatkan banyak dimensi maka dia harus menjalani saringan content validity. Misalnya pengukuran status sosial dan ekonomi yang dilakukan oleh AC Nielsen di Indonesia, karena hanya melibatkan satu dimensi saja (pengeluaran rutin perbulan) jelas tidak lolos dari saringan content validity! Alat ukur AC Nielsen tidak valid untuk mengukur konsep status sosial dan ekonomi masyarakat Indonesia!

Jika gerombolan yang tergabung dalam validitas konsensus berfokus pada dirinya sendiri, sudah memang begitu adanya, karena pakar said so, tidak demikian adanya dengan validitas yang tergabung dalam komplotan validitas komparasi. Para member gank validitas komparasi ini justru lolos uji validitas jika dia menakar diri, alias membandingkan diri. Anggota pertama gank komparasi adalah criterion validity. Criterion validity diperoleh dengan membandingkan instrumen dan hasil pengukurannya. Criterion validity punya dua “downline” yaitu concurrent validity dan predictive validity.

Suatu instrumen dikatakan lolos dari saringan concurrent validity jika instrumen tersebut menghasilkan ukuran yang relatif sama dengan instrumen lain yang telah lebih dahulu dikenal valid. Jadi ada faktor senioritas di sini :-)…Contohnya tes TOEFL, digunakan untuk mengukur kemampuan seseorang berbahasa Inggris. Suatu waktu Anda misalnya iseng-iseng membuat instrumen baru dalam mengukur kemampuan seseorang berbahasa Inggris, sebut saja namanya tes TUPEL. Seandainya seseorang mendapat skor yang tinggi pada tes TOEFL maka dia juga seharusnya mendapat skor yang tinggi pada tes TUPEL. Jika demikian yang terjadi maka instrumen baru Anda tersebut valid secara concurrent.

Selanjutnya, suatu instrumen lolos dari saringan predictive validity jika instrumen tersebut punya kemampuan layaknya seorang cenayang, alias mampu meramal konsep pada waktu tertentu di masa depan berdasarkan pengukuran di masa sekarang. Misalnya tes potensi akademik (TPA) yang dibuat oleh suatu perguruan tinggi untuk menyeleksi calon mahasiswa yang hendak melanjutkan kuliah pada program pasca sarjana. Diharapkan setiap calon mahasiswa yang lolos TPA berpeluang besar mampu mengikuti dan menyelesaikan kuliah dengan baik. Jika ternyata kenyataanya seluruh atau sebagian besar mahasiswa yang dulunya dinyatakan lolos TPA bisa mengikuti dan meyelesaikan kuliah dengan baik maka TPA tersebut valid secara predictive.

Anggota kedua dari gank komparasi adalah construct validity, seperti halnya criterion validity dia juga punya dua “downline” yaitu convergent validity dan discriminant validity. Jika pada criterion validity instrumen head to head dengan dengan hasil pengukurannya, maka pada construct validity instrumen head to head dengan instrumen.

Convergent validity akan meloloskan instrumen dari saringannya jika instrument tersebut menghasilkan hubungan erat antara dua atau lebih konsep yang memang secara teori ditakdirkan harus berhubungan! Misalnya salah satu proposisi dalam teori perilaku konsumen menyatakan bahwa makin tinggi kepuasan pelanggan terhadap suatu produk atau jasa makin tinggi juga loyalitas pelanggan terhadap produk atau jasa tersebut. Kepuasan pelanggan dan loyalitas pelanggan adalah dua konsep yang berbeda, jika instrumen untuk mengukur kepuasan pelanggan dan loyalitas pelanggan dikorelasikan dan ternyata hasilnya berkorelasi secara signifikan, maka instrumen tersebut valid secara convergent.

Terakhir adalah discriminant validity, jika pada validitas convergent instrumen kudu musti menghasilkan hubungan yang erat, sebaliknya pada validitas discriminant justru konsep yang diukur tidak boleh berhubungan alias harus berbeda secara signifikan, tapi perbedaan ini tetap didasarkan pada teori. Misalnya konsep kepemimpinan demokratis dan kepemimpinan otoriter dalam organisasi, secara teori kedua gaya kepemimpinan ini berbeda satu sama lain. Jika seorang peneliti menyusun suatu instrumen untuk mengukur kedua konsep tersebut kemudian setelah diuji secara statistik (dengan t-test misalnya) ternyata nilai variabel-variabel dari masing-masing konsep tidak berbeda secara signifikan maka instrument tersebut tidak valid secara discriminant.

Perlu dicatat bahwa uji validitas yang dipaparkan di atas belum menjamin kualitas hasil dari suatu penelitian. Karena ada faktor lain yang juga dapat mengacau-balaukan hasil riset yaitu faktor non sampling error, “the silent killer”. Di lain waktu saya akan membahasnya…

No comments: