Published on June 4, 2022 by Bilson Simamora | Last Updated on November 1, 2022 by Bilson Simamora
Daftar Isi
Analisis validitas adalah sebuah pengujian untuk mengetahui apakah kita mengukur apa yang mau diukur. Yang mau diukur memiliki dua aspek. Pertama adalah criterion validity, yaitu apakah data yang dihasilkan menggambarkan karakteristik yang diukur? Dengan kata lain, apakah data-data yang dihasilkan benar? Aspek kedua adalah construct validity, yaitu sejauh mana tes atau instrumen mampu mengukur konsep, sifat, atau entitas teoretis lainnya. Reliabilitas adalah sebuah tingkat yang menyatakan apakah sebuah instrumen atau tes (uji) akan menghasilkan data yang sama apabila pengukuran dilakukan berulang-ulang.
- Latar Belakang
- Dasar Teori
- Criterion Validity
- Construct Validity
- Content Validity
- Face Validity
- Convergent Validity
- Confirmatory Factor Analysis
- Discriminant Validity
- Reliability Analysis
- Validity versus Reliability
Latar Belakang
Tulisan ini dibuat akibat keprihatinan akan rendahnya standar analisis valitas dalam penelitian-penelitian akademis (artikel jurnal, paper, skripsi, tesis, dan disertasi). Akibatnya, tulisan demikian, yang dimuat dalam jurnal ilmiah, juga menampilkan uji validitas rendah. Sebagian kekurangan ini disumbangkan oleh banyak buku terbitan nasional, termasuk buku sangat populer yang telah dikutip puluhan ribu mahasiswa. Jurnal terakreditasi Sinta juga masih belum lepas dari rendahnya uji validitas. Ada dua masalah uji valilitas yang saya temukan, yaitu penggunaan teknik yang tidak sesuai dan tidak dilakukannya uji validitas bertingkat.
Teknik yang Tidak Sesuai
Penggunaan teknik korelasi tidak sesuai untuk uji validitas, apalagi kalau r-tabel dipakai sebagai nilai kritis untuk memutuskan valid dan tidak valid-nya sebuah indikator atau variabel pengamatan. Di bawah ini saya tampilkan contoh buku dan jurnal terbitas nasional yang berperan dalam masalah ini. Identitas buku dan jurnal dimaksud tidak diberikan untuk alasan etika.

Gambar 1. Screenshot Buku Analisis Data Statistik Terbitan 2019

Gambar 2. Screenshot Buku Aplikasi SPSS Terbitan 2022.

Gambar 3. Kriteria Validitas berbasis Korelasi pada Artikel Jurnal Matematika Terakreditas Sinta 3 terbitan 2019
Kenapa penggunaan teknik korelasi product moment tidak tepat? Pertama, varian yang diperhitungkan dalam korelasi product moment adalah varian total. Padahal, varian sebuah, yaitu common variance (varian yang dimiliki bersama indikator lain), unique variance (varian yang dimiliki sendiri), dan error variance (varian karena eror). Idealnya, uji validitas hanya didasarkan pada common variance.
Kedua nilai total indikator yang dipakai sebagai nilai faktor diperoleh begitu saja dan melalui ekstraksi. Memang nilai total dapat digunakan sebagai nilai faktor, tetapi harus dipastikan dulu bahwa indikator-indikator yang dilibatkan valid.
Ketiga, keputusan signifikan atau tidak signifikan dalam uji koefisien r berbeda dari keputusan valid atau tidak valid. Keputusan tentang signifikansi berkaitan dengan korelasi dianggap ‘ada’ atau ‘tidak ada’. Sedangkan keputusan tentang validitas berkaitan dengan apakah sebuah indikator atau variabel pengamatan memiliki kemampuan tinggi menjelaskan konstruknya. Artinya, apakah sebuah indikator dan indikator-indikator lain dalam konstruknya memiliki common variance yang tinggi dan lebih tinggi dibanding unique variance dan error variance? Kalau unique variance dan error variance lebih tinggi dari common variance maka sebuah indikator tidak valid.
Ketiga, nilai kritis yang ditetapkan sebagai batas antara valid dan tidak valid, yang merujuk pada signifikan atau tidak signifikan, terlalu rendah. Contoh, untuk sampel sebanyak 150 orang, nilai kritis r adalah 0.134. Kemampuan minimal r yang dibutuhkan dapat digambarkan oleh r2=0.1342=0.018. Walaupun tidak r2 bukan koefisien determinasi, namun kita bisa membayangkan seberapa mampu indikator dengan nilai r=0.134 menjelaskan konstruknya, amat sangat rendah. Kalaupun terpaksa menggunakan korelasi product moment untuk analisis validitas, gunakanlah batas nilai yang tinggi, yaitu r>0.70. Tetapi ingat, pendekatan ini tidak ditemukan dalam publikasi internasional bereputasi tinggi.
Kelima, korelasi product moment tidak mampu menjelaskan convergent validity, yaitu keterpaduan atau kekompakan indikator-indikator menjelaskan konstruknya. Akibat lanjutannya, discriminant validity tidak mampu dijelaskan.
Tidak Dilakukannya Analisis Validitas Bertingkat Untuk Uji Validitas Konstruk
Uji validitas konstruk mengenal mengenal uji validitas tingkat satu (firt-order validity test), uji validitas tingkat dua (second order validity test) dan (biasanya sampai) uji validitas tingkat tiga (third-order validity test). Kebanyakan buku riset dan jurnal nasional melupakan topik ini. Pembahasan tentang topik ini biasanya dilakukan oleh buku-buku tentang structural equation modeling (SEM).

Gambar 4. Screenshot Analisis Validitas Kualitas Layanan berbasis SERVQUAL yang Mengabaikan Tingkatan pada Artikel Jurnal Sinta 4
Di dalam teori dikenal adanya konstruk, sub-konstruk atau dimensi, sub-dimensi dan variabel penelitian, yang sering disederhanakan sebagai indikator. Panjang struktur ini bisa berkurang atau bertambah sesuai konsepnya. Konsep klasik SERVQUAL (Parasuraman et al., 1988), misalnya, terdiri dari lima dimensi dan 22 variabel. Penelitian yang mengukur kualitas layanan menggunakan konsep ini harus menggunakan uji validitas tingkat dua (second order validity test). Namun, kebanyakan penulis dan peneliti nasional mengabaikan ketentuan ini. Contohnya, artikel jurnal Sinta 4 mengukur kualitas layanan berbasis adaptasi SERVQUAL, melakukan uji validitas tingkat satu untuk 24 variabel sekaligus (Gambar 4) dengan korelasi. Hasilnya, selain menyalahi metoda ilmiah, nilai korelasi menjadi rendah.
Ketentuannya adalah sebagai berikut:
- Struktur: konstruk–>variabel penelitian, kita menggunakan first-order validity test.
- Struktur: konstruk–>dimensi–>variabel penelitian, maka kita menggunakan second-order validity analysis.
- Struktur: konstruk–>dimensi–>sub-dimensi–>variabel penelitian, gunakanlah third-order validity test.
Secara teori uji tingkat empat dan lebih bisa dilakukan, namun jarang ditemukan. Topik ini selanjutnya dibahas di sini.
Hanya Menggunakan Responden Terbatas yang Didapat Dari Pilot Research
Sebagian peneliti melakukan pilot research (riset pendahuluan) untuk uji validitas dan reliabilitas, misalnya dengan menggunakan data dari 30 responden awal. Hasilnya memang dapat digunakan untuk memperbaiki kuesioner. Sayangnya, apabila peneliti menemukan hasil yang valid dan reliable, maka hasil tersebut dipakai sebagai hasil akhir. Artinya, analisis validitas dan reliabilitas dilakukan hanya pada yang terbatas, tidak pada semua data.
Dasar Teori
Analisis validitas dan reliabilitas dilakukan untuk memastikan kualitas data yang digunakan (goodness of data). Konsepnya adalah data yang valid diperoleh dari instrumen yang reliabel (Bajpai & Bajpai, 2014; Sekaran & Bougie, 2010).
Analisis validitas adalah dimaksudkan untuk mengetahui apakah kita mengukur apa yang mau diukur (Carmines & Zeller, 1979). Validitas memiliki dua aspek. Pertama adalah criterion validity, yaitu apakah data yang dihasilkan menggambarkan karakteristik yang mau diukur? Dengan kata lain, apakah data dapat dipercaya? Aspek kedua adalah construct validity, yaitu sejauh mana tes atau instrumen mampu mengukur konsep, sifat, atau entitas teoretis lainnya yang diukur. Selanjutnya, criterion validity dan construct validity terbagi ke dalam beberapa dimensi, seperti diperlihatkan pada Gambar 1.
Gambar 1. Struktur Validitas dan Reliabilitas
—
Criterion Validity
Criterion validity terdiri dari dua bagian. Bagian pertama adalah concurrent validity, yaitu apakah data yang kita hasilkan sama dengan keadaan sebenarnya? Misalnya, tinggi gunung Everest dari permukaan laut yang diakui secara resmi (disebut juga golden standar) adalah 8.849 meter. Seorang pendaki melakukan pengukuran dan hasilnya adalah 8.510 meter. Tentu data yang dimiliki pendaki tersebut berbeda dari versi resmi, sehingga dianggap tidak valid.
Masalahnya, versi resmi ini (atau golden standar) ini tidak selalu ada. Misalkan kita melakukan penelitian kepuasan konsumen pada restoran McDonald. Kita mewawancarai 1000 responden. Hasilnya adalah 67% puas dan 33% tidak puas. Pertanyaannya, apakah angka-angka ini memenuhi concurrent validity? Tidak bisa ditentukan karena ketiadaan golden standard untuk ke-1000 responden yang kita teliti.
Bagian kedua adalah predictive validity. Bagian ini menguji apakah dengan data yang kita miliki, variabel yang diukur dapat memprediksi variabel lain yang terkait, yang secara saintifik hubungannya diterima dengan sendirinya (given)? Misalnya, apakah dengan data intellect quotient (IQ) kita dapat memprediksi kinerja karyawan? Kalau bisa berarti data kita valid dan sebaliknya.
Construct Validity
Menurut Apa Dictionary Psychology (n.d.), validitas konstruk adalah sejauh mana tes atau instrumen mampu mengukur konsep, sifat, atau entitas teoretis lainnya. Misalnya, jika seorang peneliti mengembangkan kuesioner baru untuk mengevaluasi tingkat agresi responden, validitas konstruk instrumen akan sejauh mana ia benar-benar menilai agresi sebagai lawan dari ketegasan, dominasi sosial, dan sebagainya. Ada empat bagian validitas konstruk dalam ilmu-ilmu sosial: content validity, face validity, convergent validity, dan discriminant validity.
Content validity dan face validity disebut juga logical validity karena keduanya memeriksa apakah instrumen penelitian sudah valid secara logika atau teoritis.
Content Validity
Content validity adalah sebuah penilaian apakah sebuah instrument telah mencakup semua aspek-aspek sebuah konstruk. Langkah ini diperlukan pada saat peneliti ingin mengembangkan instrumen baru atau mengadaptasi instrumen yang sudah ada.
Misalkan kita ingin mengukur loyalitas konsumen dan membuat instrumen berdasarkan teori yang kita gunakan. Pertanyaannya pertama, apakah variabel pengamatan sudah mencakup semua aspek yang diperlukan? Pertanyaan kedua, apakah variabel-variabel pengamatan perlu?
Content validity tidak terpenuhi apabila, pertama, alat ukur tidak dikembangkan berdasarkan teori yang sesuai dengan konteks penelitian. Kedua, item-item pertanyaan tidak mencakup semua aspek yang dijelaskan dalam teori. Ketiga, sebagian atau semua item pertanyaan tidak relevan, tidak jelas, atau tidak penting (Rodriguez et al. 2017).
Tahap Pertama: Mengembangkan Instrumen Pengukuran
Content validity sangat diperlukan apabila peneliti ingin mengembangkan instrumen pengukuran baru. Teori memang diperlukan untuk tujuan itu. Namun, dalam pengembangan instrumen baru, seringkali peneliti mengembangkan sebuah konsep atau dimensinya ke dalam sejumlah besar item pertanyaan yang kemudian direduksi menjadi sejumlah lebih kecil item pertanyaan. Misalnya, untuk mengembangkan instrumen Patient-Centered Communicatio, Zamanzadeh et al. (2015) membuat 188 pertanyaan, yang setelah melalui analisis validitas konten, direduksi menjadi 39 pertanyaan.
Tahap Kedua: Meminta Penilaian Para Ahli
Content Validity Ratio
Berdasarkan Aaker (1991), seorang peneliti ingin mengembangkan instrumen pengukuran loyalitas terhadap wedding organizer X. Dia menghasilkan 10 variabel pengamatan, lalu meminta penilaian para ahli apakah variabel-variabel pengamatan tersebut diperlukan (essential) (Tabel 1). Pilihan yang disediakan adalah tidak diperlukan (not necessary), bermanfaat tetapi tidak dibutuhkan (useful but not essential) dan dibutuhkan (essential) (Lawshe, 1975; Rodrigues et al., 2017; Zamanzadeh et al., 2015), seperti ditampilkan pada Tabel 1.
Tabel 1. Instrumen Pengukuran Pendapat Panelis untuk Analisis CVR
Misalkan hasil penilaian para ahli adalah seperti pada Tabel 2. Jumlah ahli yang dimintai penilaian adalah 12 orang.
Tabel 2. Hasil Penilaian Panelis dan Perhitungan CVR
Dari Tabel 2 perhatian kita berikan pada skor Ne, yang menunjukkan jumlah ahli yang menilai suatu item dibutuhkan. Berdasarkan nilai Ne, kita dapat menghitung content validity ratio (CVR) sebagai berikut:
di mana, Ne adalah jumlah ahli yang menilai suatu item dibutuhkan dan N adalah jumlah semua ahli yang dimintai pendapat. Nilai CVR akan selalu berkisan antara -1 sampai 1. Nilai minimal CVR yang diterima tergantung pada jumlah panelis (Lawshe, 1975), seperti ditampilkan pada Tabel 3.
Perhitungan untuk item pertama adalah: CVR=(10-12/2)/(12/2)=(10-6)/6=4/6=0.67. CVR item-item lain dihitung dengan cara yang sama. Selanjutnya nilai CVR dibandingkan dengan standar yang diberikan oleh Lawshe (1975) di atas. Untuk jumlah panelis sebanyak 12 orang, maka nilai minimum CVR adalah 0.56. Karena itu, maka variabel pengamatan yang valid adalah nomor 1, 4, 6, 9, dan 10.
Tabel 3. Nilai Minimum CVR pada Pengujian Satu Sisi dengan α=0.05

Sumber: Lawshe, C.H. (1975). A quantitative approach to content validity. Personnel Psychology, 28, 563-575. Retrieved October 28, 2022, from https://parsmodir.com/wp-content/uploads/2015/03/lawshe.pdf
Berdasarkan data Tabel 2, perhitungan untuk item pertama adalah: CVR=(10-12/2)/(12/2)=(10-6)/6=4/6=0.67. CVR variabel pengamatan lain dihitung dengan cara yang sama. Selanjutnya nilai CVR dibandingkan dengan standar yang diberikan oleh Lawshe (1975) di atas. Untuk jumlah panelis sebanyak 12 orang, maka nilai minimum CVR adalah 0.56. Karena itu, maka variabel pengamatan yang valid adalah nomor 1, 4, 6, 9, dan 10.
Content Validity Index
Content validity index (CVI) dapat digunakan untuk memeriksa relevansi, kejelasan, dan kepentingan item-item pertanyaan menurut para ahli (Rodriquez et al. 2017), seperti pada Tabel 2. Kejelasan di sini maksudnya adalah kejelasan setiap item pertanyaan. Pada face validity dipertanyakan juga aspek kejelasan, namun sifatnya bukan per item, tetapi instrumen secara keseluruhan.
Tabel 4. Instrumen Pengukuran Loyalitas terhadap Wedding Organizer X
CVI dapat dipakai untuk memeriksa validitas dari sisi relevansi, kejelasan dan kepentingan suatu item. Informasi paling penting adalah indeks relevansi, yang berkaitan dengan apakah sebuah item mengukur konsep (konstruk) yang mau diukur. Aspek kejelasan memeriksa apakah sebuah item mampu mengukur variabel yang mau diukur ataukah berpotensi menimbulkan missing data (karena tidak dijawab) dan bias atau penyimpangan jawaban. CVI berbasis aspek kepentingan sebenarnya dapat menghasilkan kesimpulan sama dengan CVI berbasis relevansi. Item yang penting juga relevan dan aspek yang tidak penting berarti tidak relevan. Namun, aspek CVI dapat mendeteksi item pertanyaan yang tidak penting (tidak relevan) mengukur konstruk, tetapi mengandung informasi bermanfaat, yang memperkaya hasil penelitian.
CVI berbasis Relevansi
Untuk melakukan pengujian validitas konten berdasarkan relevansi, data asli harus dikelompokkan berifat dikotomi. Pada Pada Tabel 1 ada empat pilihan jawaban untuk setiap pertanyaan. Keempat pilihan tersebut harus dikelompokkan menjadi dua kelompok, yaitu ‘setuju’ dan ‘tidak setuju’ (Taherdoost, 2016). Pilihan tidak relevan dan agak relevan, kita kategorikan ‘tidak setuju’, sedangkan pilihan ‘cukup relevan’ dan ‘relevan’ dikaterikan menjadi ‘setuju’. Nilai content validity index item (I-CVI) diperoleh melalui persamaan:
I-CVI=ni/N
di mana, ni=jumlah panelis yang menjawab item ke-i relevan dan N=jumlah panelis. Nilai CVI berkisar antara 0 – 1. Bila I-CVI > 0.79, item adalah relevan. Bila nilainya antara 0.70 sampai 0.79, maka item perlu direvisi. Bila I-CVI di bawah 0.70 berarti item dikeluarkan.
Pada level instrumen, kita juga bisa memperoleh hasil scale-level content validity index (S-CVI). Ada dua sadar yang digunakan, yaitu persetujuan umum di antara para ahli [universal agreement among experts (S-CVI/UA)] dan rata-rata CVI (S-CVI/Ave).
S-CVI/UA=Sum of UA scores/number of items
S-CVI/Ave=Sum of proportion relevant rating/number of experts
Apabila S-CVI/UA ≥ 0.8 dan a S-CVI/Ave ≥ 0.9 maka instrumen memiliki validitas konten yang baik.
Rodrigues et al. (2017) menyatakan bahwa perhitungan nilai I-CVI belum memperhitungkan bias ke atas (inflasi). Untuk mengoreksinya, diperlukan nilai Kappa, yang dihitung dengan rumus:
K= (I-CVI- PC)/(1- PC)
di mana, K=nilai Kappa, CVIi=CVI item ke-i. Pc adalah nilai yang diperoleh dengan rumus: Pc = [N!/A!(N-A)!]*0.5N. Nilai Kappa di atas 0.74 tergolong sangat baik (excellent), antara 0.60 sampai 0.74 adalah baik (good ), pada kisaran 0.40 sampai 0.59 cukup baik, dan di bawah 0.40 buruk.
Dalam contoh berikut, instrumen yang digunakan adalah seperti pada Tabel 4. Peneliti mendatangi 12 ahli (expert) dan meminta mereka mengisi kuesioner. Hasil dan nilai-nilai I-CVI, Kappa, S-CVI/Ave dan S-SCVI/UA disajikan pada Tabel 5.
Tabel 5. Hasil Penilaian Panelis
Dari Tabel 5. Berdasakan nilai I-CVI dan Kappa terdapat lima item yang valid. Empat di antaranya dapat digunakan langsung (no. 1, 4, 9 dan 10), satu harus direvisi terlebih dahulu (no. 6). Lima item (no. 2, 3, 5, 7 dan 8) harus dikeluarkan dari instrumen karena tidak valid. Mungkin di antara kelima item ini ada tidak bermanfaat atau bermanfaat namun bukan bagian dari instrumen (bermanfaat tetapi tidak penting). Untuk itu, perlu dilakukan CVI berbasis tingkat kepentingan.
Revisi pada item yang valid tetapi perlu direvisi dilakukan untuk memperjelas apa sesungguhnya yang mau diukur, bukan kejelasan dari sisi kualitas bahasa, yang dinilai dalam CVI berbasis kejelasan. Pada item pertanyaan “Saya akan membela wedding organizer X apabila ada menjelek-jelekkannya” mengandung pertanyaan, yaitu: (1) apa yang dimaksud membela? (2) apa yang dimaksud menjelek-jelekkan? Apabila direvisi menjadi: “Apabila diperlukan dan memiliki kesempatan menyampaikannya, saya akan menyampaikan informasi yang benar tentang wedding organizer X kalau ada yang menyatakan informasi tidak benar tentangnya“, maksud pertanyaan menjadi jelas.
Interpretasi SCI/Ave dan SCI/UA
Nilai SCI/Ave dan SCI/UA memberikan kesimpulan tentang content validity seluruh item sekaligus. Seperti disampaikan sebelumnya, apabila S-CVI/UA ≥ 0.8 dan a S-CVI/Ave ≥ 0.9, maka instrumen memiliki validitas konten yang baik. Pada contoh di atas (Tabel 5) terlihat bahwa S-CVI/Ave=0.55 dan SCI/UA=0.36. Nilai SCI/Ave diperoleh dengan mencari nilai rata-rata I-CVI semua item pertanyaan, yaitu: (1.00 + 0.08 + … + 1.00)/11=0.55. S-CVI/UA diperoleh dengan menghitung proporsi item-item yang nilainya 1.00 (4 item) dengan yang nilainya kurang dari 1.00 (7 item) atau 4/10=0.40.
Nilai S-CVI/Ave dan S-CVI/UA menunjukkan bahwa validitas konten instrumen buruk dan perlu diperbaiki, yaitu dengan mengeluarkan item-item pertanyaan yang tidak valid. Hasilnya disajikan pada Tabel 6. Terlihat bahwa instrumen pengukuran konstruk loyalitas wedding organizer X berdasarkan nilai S-CVI/Ave dan S-CVI/UA telah memiliki validitas yang baik.
Tabel 6. S-CVI Instrumen Terevisi
CVI berbasis Kejelasan dan Kepentingan
Cara yang digunakan sama saja dengan teknik yang kita gunakan untuk CVI berbasis relevansi. CVI berbasis kejelasan (clarity) dan kepentingan (importance) tidak dimaksudkan untuk memutuskan digunakan atau tidak item-item pertanyaan yang diuji. Aspek kejelasan menyatakan apakah item pertanyaan dapat dimengerti, sedangkan aspek kepentingan menyatakan apakah suatu item penting atau tidak penting namun bermanfaat. Indeks ini diperlukan untuk mendeteksi item pertanyaan yang berisikan informasi bermanfaat bagi penelitian, yang mungkin dikeluarkan dalam CVI berbasis relevansi. Idealnya item yang ‘penting’ juga ‘relevan’. Kalau hasil CVI berbeda dari harapan ini ada yang salah dalam proses pengumpulan data.
Face Validity
Face validity adalah validitas berbasis pandangan subyektif tentang apakah pertanyaan-pertanyaannya dapat dipahami dengan jelas (Moores et al., 2012). Dengan kata lain, face validity berkaitan dengan kualitas bahasa alat ukur (Taherdoost, 2016).
Face validity dapat dinilai secara kualitatif berdasarkan pendapat peneliti sendiri atau para ahli (Moores et al., 2012; Taherdoost, 2016). Sebagian peneliti melakukan wawancara focus group, yakni bertanya kepada beberapa orang yang dianggap berkompeten (misalnya sarjana sastra) untuk menilai kualitas bahasa item-item pertanyaan yang digunakan.
Selain dengan cara itu, face validity dapat dianalisis secara kuantitatif. Moores et al. (2012) misalnya, melakukan survai terhadap 245 responden untuk menguji face validity instrumen survai di bidang kesehatan. Apabila kita lakukan survai untuk memeriksa face validity alat ukur pada Tabel 6 di atas, misalnya, kita buat kuesioner seperti pada Tabel 7. Kemudian, seperti disampaikan Johnson (2013), butir-butir pertanyaan yang mendapat skor persetujuan yang tinggi memiliki face validity yang tinggi.
Tabel 7. Kuesioner untuk Analisis Face Validity
Item | Skala | |
1. | Saya memahami pertanyaan-pertanyaan dalam kuesioner | 1: Sangat tidak setuju; 5: Sangat setuju |
2. | Pertanyaan-pertanyaan pada kuesioner relevan bagi saya | 1: Sangat tidak setuju; 5: Sangat setuju |
3. | Kuesioner mudah diisi | 1: Sangat tidak setuju; 5: Sangat setuju |
4. | Saya menikmati pengisian kuesioner | 1: Sangat tidak setuju; 5: Sangat setuju |
5. | Kuesioner tidak terlalu panjang | 1: Sangat tidak setuju; 5: Sangat setuju |
6. | Kuesioner tidak rumit | 1: Sangat tidak setuju; 5: Sangat setuju |
Agar hasil valid, survai perlu dilakukan pada berbagai segmen (Souza et al. 2017). Misalnya, survai kita lakukan pada segmen: konsumen dan bukan konsumen wedding organizer X, pria dan wanita, serta fans dan haters wedding organizer X. Apabila hasil pada segmen-segmen yang dibandingkan sama, maka hasil survai dianggap sah (valid).
Walaupun menggunakan pendekatan kuantitatif, pengambilan kesimpulan atas nilai face validity cenderung bersifat kualitatif (Taherdoost, 2016). Namun, diharapkan agar yang memberikan respon positif (setuju dan sangat setuju) lebih banyak dibanding yang memberikan respon negatif dan netral (sangat tidak setuju, tidak setuju, dan netral).
Content Validity dan Face Validity dalam Riset
Content validity harus dipenuhi sebuah penelitian. Artinya, item-item pengukuran harus dipastikan valid sebelum digunakan. Untuk itu, pengembangan instrumen perlu didasarkan pada literatur yang tepat dan cukup. Namun, analisis CVR dan CVI direkomendasikan, namun tidak diwajibkan (Taherdoost, 2016). Bila dilakukan, maka bagian ini dapat menjadi nilai tambah artikel untuk memasuki jurnal internasional bereputasi. Bahkan, terdapat artikel jurnal internasional bereputasi yang menjadikan content validity sebagai satu-satunya masalah penelitian (misalnya: Lawshe,1975; Rodrigues et al., 2017).
Face validity juga perlu dipenuhi oleh sebuah penelitian. Artinya, item-item yang digunakan harus jelas dan mengukur apa yang mau diukur (Tahedoost, 2016). Uji ini dapat dilakukan sendiri oleh peneliti, dengan bantuan para ahli atau melalui survai. Face validity dapat dijadikan sebagai topik penelitian tersendiri (misalnya: Moores et al., 2012; Jonson, 2013) atau bersama komponen lain (misalnya: Mousazadeh et al., 2017; Souza et al., 2017; Taherdoost, 2016).
Convergent Validity
Dalam riset pemasaran, konstruk adalah konsep yang level abstraksinya tinggi, tidak bisa diukur secara langsung dan harus diukur menggunakan variabel-variabel pengamatan yang merefleksikannya. Pada contoh di atas, loyalitas konsumen adalah konstruk dengan variabel-variabel pengamatan: kepuasan (consumer satisfaction), rasa suka (liking the brand), pembelaan (brand advocate), dan rekomendasi merek (brand recommendation), seperti telah dijelaskan. Adapun pernyataan-pernyataan pada Tabel 1 merupakan operasionalisasi variabel-variabel pengamatan tersebut menjadi instrumen penelitian atau item-item pertanyaan.
Validitas konvergen adalah kepaduan (cohesiveness) variabel-variabel pengamatan menggambarkan konstruknya. Kepaduan tersebut diindikasikan oleh korelasi, barlet test of Sphericity, anti-image matrices, exploratory factor analysis (EFA), dan confirmatory factor analysis (CFA) … read more
Referensi
Aaker, D.A. (1991). Managing Brand Equity. New York: The Free Press.
Bajpai, S., & Bajpai, R. (2014). Goodness of measurement: Validity and reliability. International Journal of Medical Science and Public Health, 3(2), 112-115. DOI: 10.5455/ijmsph.2013.191120133.
Bongers, P., Hove, P., Stassen, L., Dankelman, J., Schreuder, H.W.R. (2014). A new virtual reality training module for laparoscopic surgical skills and equipment handling: Can multitasking be trained? A randomized controlled trial [In Press]. Journal of Surgical Education, 72(2). DOI: 10.1016/j.jsurg.2014.09.004
Carmines, E. G., & Zeller, R. A. (1979). Reliability and Validity Assessment. Sage publications.
Johnson, E. (2013). Face Validity. In: Volkmar F.R. (eds). Encyclopedia of Autism Spectrum Disorders. Springer, New York, NY. https://doi.org/10.1007/978-1-4419-1698-3_308
Lawshe, C.H. (1975). A quantitative approach to content validity. Personnel Psychology, 28, 563-575. Retrieved October 28, 2022, from https://parsmodir.com/wp-content/uploads/2015/03/lawshe.pdf
Mousazadeh, S., Rakhshan, M., & Mohammadi, F. (2017). Investigation of content and face validity and reliability of Sociocultural Attitude towards Appearance Questionnaire-3 (SATAQ-3) among female adolescents. Iranian journal of psychiatry, 12(1), 15–20.
Parasuraman, A., Zeithaml, V.A. and Berry, L.L. (1988). SERVQUAL: A multiple-item scale for measuring consumer perceptions of service quality. Journal of Retailing, 64, 12-40.
Rodrigues, I.B., Adachi, J.D., Beattie, K.A. et al. (2017). Development and validation of a new tool to measure the facilitators, barriers and preferences to exercise in people with osteoporosis. BMC Musculoskelet Disord, 18, 540. https://doi.org/10.1186/s12891-017-1914-5
Moores, K.L., Jones, G.L., & Radley, S.C. (2012). Development of an instrument to measure face validity, feasibility and utility of patient questionnaire use during health care: the QQ-10. International Journal for Quality in Health Care: Journal of the International Society for Quality in Health Care, 24 (5), 517-524.
Sekaran, U., & Bougie, R. (2020). Research Methods for Business. 8th Edition. Wiley.
Souza, A. C., Alexandre, N., & Guirardello, E. B. (2017). Psychometric properties in instruments evaluation of reliability and validity. Propriedades psicométricas na avaliação de instrumentos: avaliação da confiabilidade e da validade. Epidemiologia e Servicos de Saude: Revista do Sistema Unico de Saude do Brasil, 26(3), 649–659. https://doi.org/10.5123/S1679-49742017000300022
Taherdoost, H. (2016). Validity and reliability of the research instrument: How to test the validation of a questionnaire/survey in a research. International Journal of Academic Research in Management, 5(3), 28-36.