Güvenilirlik ve Geçerlilik Testleri

yöntem istatistik
20 May 2021
5 dakikada okunur

Güncelleme tarihi: 28 Haz 2021

Güvenilirlik ve Geçerlilik Testleri

Bir ölçünün tutarlı, sağlam veya doğru olup olmadıklarını tespit eden testler güvenilirlik ve geçerlilik testleridir. Peki bu testlerin önemi nedir? Bu sorunun cevabını şöyle verebiliriz; eğer bu testler olmazsa yaptığımız araştırmaların analiz sonuçlarını doğru yorumlayamayız.

Güvenilirlik testini tanımlarsak bir ölçümde ölçüm işleminin tekrarlanabileceğini gösteren ayrıca tekrarlarda olan tutarlılıkları da bize gösteren testtir diyebiliriz.

Geçerlilik testinin tanımı ise; bir testin ölçmek istediği, ölçmeyi amaçladığı özelliği; başka bir özellik olmadan ölçen testtir. Bu testte ölçmek istenilen özellik doğru olmalı ve diğer özelliklerle karıştırılmadan ölçülmelidir. Eğer bunlar yapılabiliyorsa test geçerlidir.

Bir testin geçerli olması için gereken en önemli özellik o testin güvenilir olmasıdır.

Geçerli olmayan test güvenli olsa da işe yaramaz.

Güvenilirlik

Test veya anket gibi herhangi bir ölçüm aracında yer alan tüm soruların birbirleriyle tutarlılığını, ölçüm araçlarında olan tüm verilerin ölçmede türdeş olup olmadığını açıklayarak ortaya koyan bir kavramdır. Bir ölçümün güvenilirliği aynı zamanda onun tutarlılığını da göstermektedir.

Ölçme araçlarının ne kadar güvenli olduğunu veya ne kadar güvenli olmadığını göstermek için kullanılan yöntemlere güvenilirlik analizi denir. Güvenilirlik için kullanılan en basit model;

Ölçüm aracında yer alan sorular arasında ölçme hatası yoksa güvenilirlik katsayısı birdir.

Ölçüm aracında yer alan sorular arasında ölçme hatası varsa güvenilirlik katsayısı sıfırdır.

Güvenilirlik analiz yöntemleri için kullanılan daha ayrıntılı yöntemler dört tanedir. Bunlar;

1.Test yeniden test yöntemi

2. Paralel formlar yöntemi

3. Gözlemciler arası güvenilirlik yöntemi

4. İç tutarlılık güvenilirliği yöntemi

1.Test Yeniden Test Yöntemi

İki farklı zamanda aynı denekler üzerinde aynı şart ve durumlarda kullanılır. İki farklı zamanlar arasında bulunan korelasyon güvenilirliğin bir göstergesidir.

Bu yöntem sonuçların bir sonraki sonuçları etkileyebilir bu yüzden tekrar ölçümlerde sorunlar yaşanabilir. Bu yöntem belirli bir zaman aralığında aynı kişilere tekrar uygulanabilir. Test sorularının tutarlılığı Pearson Spearman korelasyon ile hesaplanır. Korelasyon değeri 0,3'ten küçük olan sorulara uyumsuz soru diyebiliriz. Testte uyumlu olmayan yani uyumsuz cevaplar anketten veya herhangi bir ölçüm aracından çıkartılır. Yapılan test sonucunda hesaplana korelasyon katsayısı pozitif ve bire yakınsa test güvenilirdir denir.

2.Paralel Formlar Yöntemi

Bu yöntemin uygulanabilmesi için paralel iki testin eşdeğer olması gerekmektedir. Yani iki testin de madde sayıları, niteliği vb. özellikleri birbirlerine denk olmalıdır. Bu test için aynı iki gruba ve iki ayrı formdan aldıkları korelasyon değerine bakılır. Yapılan iki test art arda ya da belli bir ara ile yapılabilir. Elde edilen güvenilirlik katsayısı diğer testlere oranla daha küçüktür.

3.Gözlemciler Arası Güvenilirlik Yöntemi

Bu yöntem için gözlemci sayısının birden fazla olması gerekmektedir. En az iki sayıda olan gözlemcilerin birbirinden bağımsız bir şekilde aynı şeyleri ölçmeye çalıştıkları durumlarda kullanılan bir testtir. Kendall'ın Uyum Katsayısı testi bu yöntemde bağımsız gözlemciler arasında olan uyumu göstermek için kullanılır. Gözlemler arasında uyumun olması için test sonucunun 0,70 olması gerekmektedir.

4.İç tutarlılık Yöntemi

Bu yöntemde likert tipi ölçek kullanılır. Likert tipi ölçek; çok sayıda madden oluşan ölçektir.

Bu yöntem, testte var olan her sorunun aynı niteliği ne kadar ölçtüğünü hesaplar ve gösterir.

İç tutarlılık yöntemleri dört tanedir. Bunlar ;

● Cronbach Alfa (Alfa Katsayısı)

●Split Half (İkiye BölünmüşYöntem)

● Guttman

●Paralel ve Kesin Paralel

Bu yöntemlerin sonuçları bire yakınlaştıkça iç tutarlılık değeri o kadar yükselir, birden uzaklaştıkça iç tutarlılık değeri o kadar düşer.

Sperman testi ve Guttman yöntemi güvenilirlik katsayılarının hesaplanmasında kullanılır. Hesaplanan değerlere iç tutarlılık katsayısı denir.

Güvenilirlik analizi için bu yöntemde soru sayısının (k) yirmiden büyük ve denek sayısının(n) elliden fazla olması gerekmektedir.

Bir testtin güvenilir olması için iç tutarlılık katsayısının 0,60’dan fazla olması gerekmektedir.

Bir testin mükemmel güvenilirlikte olması için iç tutarlılık katsayısının 0,90’dan fazla olması gerekmektedir.

İçsel tutarlılık yöntemleri;

1) Cronbach Alfa (Alfa Katsayısı)

k sayıda soru içeren bir ölçekte, ölçeğe verilen cevapların toplanması ile hesaplanabilen ve ölçekteki soruların birbirlerine yakınlıklarına hesaplayan bir katsayıdır.

α; 0'a eşit ve büyük 0,40'tan küçükse ölçek güvenilir değildir.

α;0,40'a eşit ve büyük 0,60'tan küçükse ölçek düşük güvenilirliktedir.

α; 0,60'a eşit ve büyük 0,80'den küçükse ölçek güvenilirdir.

α; 0,80'e eşit ve büyük 1'den küçükse ölçek yüksek derecede güvenilirdir.

Maddelerin varyans değerlerine göre hesaplama yöntemi;

Maddelerin kovaryans değerlerine göre hesaplama yöntemi;

Maddelerin korelasyon matrisi değerlerine göre hesaplama yöntemi;

Cronbach Alfa negatif çıkabilir. Ancak negatif çıkarsa güvenilirlik modeli bozulur.

Cronbach Alfa değerinin negatif çıkma nedenleri;

□Araştırmada yapılan ölçüm hataları,

□Maddeler arasında kovaryans değerlerinin negatif olması

□Örneklem hacmin küçük olması

□Ölçekteki madde sayısının az olması

□Testte en az iki faktör olması ve test faktörlerinin ters yönlü ilişkisinin olması.

Cronbach Alfa yöntemini Spss üzerinden bir örnekle gösterelim;

3 tane soruya 5 kişinin verdiği cevaplar Spss üzerine yazılmış ve Scale-Reliability Analysis'ten analiz sonuçları aşağıdadır.

Aşağıdaki tablolara göre yorum yaparsak,

Cronbach alfa katsayısı 0,682'dir. α; 0,60'a eşit ve büyük 0,80'den küçükse ölçek güvenilirdir. Yani çıkan sonuca göre örneğimiz güvenilirdir. Ayrıca örneğe alınan değişkenlerden hiçbirinin toplam korelasyon değeri ile negatif ilişkisi yoktur. Bu da iç tutarlılığın iyi olduğu sonucunu bize verir.

2) Split Half (İkiye Bölünmüş Yöntem)

Bu yöntemde isminden de anlaşılacağı üzere; ölçek üzerinde var olan sorular ikiye ayrılarak iki parça haline gelir. Bu iki parça arasındaki alfa katsayıları ve korelasyon katsayısı ayrı ayrı hesaplanır.

Eğer ölçekte a tane soru varsa ve bu soru sayısı çift ise her bir alt gruba düşen soru sayısı şeklinde hesaplanır.

Eğer ölçekteki a tane soru varsa ve bu soru sayısı tek ise birinci alt gruba eklenecek soru sayısı a1= şeklinde hesaplanır.

İkinci alt gruba eklenecek soru sayısı ise a2=a-a1 şeklinde hesaplanır.

Ölçek ikiye ayrıldıktan sonra güvenilirlik katsayısı Spearman Brown formülü ile hesaplanır. Bu formül sonucunda güvenilirlik elde etmek istiyorsak çıkan sonucun 0,70 olması gerekir.

Spearman Brown formülü;

3)Guttman

Bu yöntemde varyans, kovaryans değerleri kullanılır. Güvenirlik katsayıları bu değerlere göre hesaplanılır. Bu yöntemde 6 katsayı hesaplanır bu katsayılar ya güvenirlik değerine eşit ya da bu değerden daha küçük değerlerdir.

4) Paralel ve Kesin Paralel

Paralel Yöntemi; Bu yöntem soruların eşit varyanslı olduğunu kabul eder. Bu yöntemde Ki kare testi ile benzerlik tahminleri ve bu tahminlerin uygunluğu test edilir.

Kesin Paralel Yöntemi; Bu yöntem soruların eşit varyanslı ve soruların ortalamalarının eşit olduğunu kabul eder. Soruların ortalamalarının eşitliği Hotelling's T² testi ile test edilir.

Not: Testlerin güvenilirliği Kudor-Richardson(KR) KR-20 ve KR-21 formülleriyle tahmin edilebilir. Bunlarda iç tutarlılığın ölçüttür. Cevaplar 2 şıklı ise (evet-hayır vb.) bu formüller kullanılabilir.

KR-20;Bu formülde tek bir yapı ölçülür. Her sorunun güçlük derecesi farklıdır. Ölçülen yapıların içerikleri benzerdir. Cronbach Alfa yöntemi ile aynı sonucu verir.

KR-21;Bu formülde her sorunun güçlük derecesi aynıdır.Cevap şıkları kodlanır.(evet=1,hayır=0).

Her 2 formülde test genel güvenilirlik hakkında bilgi verir ayrıca her 2 formülde de elde edilen sonuç 0,70'in üzerindeyse güvenilirlik iyidir.

Geçerlilik

Geçerlilik; bir testin ölçmek istediği, ölçmeyi amaçladığı özelliği; başka bir özellik olmadan ölçen testtir. Ölçümlerden elde edilen verilerin, ölçüm özelliklerini doğru yansıttığını geçerlilik analiziyle buluruz.

Geçerlilik analiz yöntemleri dört tanedir. Bunlar;

1. Yüzey geçerliliği yöntemi

2. Kapsam(içerik) geçerliliği yöntemi

3. Kriter geçerliliği yöntemi

4. Yapı geçerliliği yöntemi

1. Yüzey Geçerliliği Yöntemi

Ölçme aracının neyi ölçtüğünü belirten bir yöntemdir. Bu yöntemde ölçek maddeleri düzgün ve anlamlı olmalıdır. Kullanılan test cevaplayıcıların özelliklerine uygun olmalıdır.

2. Kapsam Geçerliliği Yöntemi

Kapsam geçerliliği ölçme aracının ölçmek istediği kapsamı ne kadar yansıttığını belirten bir yöntemdir.

Kapsam geçerliliği iki yolla araştırılabilir. Bunlar 1.Mantıki, 2.İstatistiki;

Mantıki yol; Bu yolda ilk olarak ölçeğin geçerliliği tahmin edilir. Tahminde edilirken ölçek uygulanmamalıdır. Daha sonra ölçüm konusu tanımlanır. Bu tanım kavramsaldır

İstatistiki yol; Bu yolda iki ölçek kullanılır. İlk ölçek daha önce geliştirilmiş ve geçerliliği yapılmış bir ölçektir. İkincisi ise yeni geliştirilen ölçektir. Bu yolda bu iki ölçek aynı anda bireylere uygulanır. Bu iki ölçeğin ilişki katsayıları hesaplanır sonuç olarak bulunan değer ölçeğin geçerlilik katsayısıdır.

3.Kriter Geçerliliği Yöntemi

Bu yöntemde ölçek sonuçlarının benzer diğer ölçüm sonuçlarının tutarlı olması istenir. İki alt grubu vardır. Bunlar; Kestirim geçerliliği ve uyum geçerliliği.

Kestirim Geçerliliği;

Bir ölçekten elde edilen tahmini değeriyle aynı ölçekte ölçülmek istenen değerleri ölçen ölçütün arasındaki korelasyonun katsayısının hesaplanmasıyla elde edilir.

Uyum Geçerliliği;

Birbirinin aynı olan yapıları ölçmek için kullanılan geçerlilik yöntemidir. Bu yolda altın standart (referans test) tanımı karşımıza çıkar. Bu tanım; ölçmek istediği özellikleri kesin olarak ölçebilen ve sonuçlarının da yüksek geçerliliğe sahip olduğu testlerdir şeklinde yapılabilir. Bu yolda referans test ile geliştirilen test arasındaki korelasyon değeri ne kadar yüksekse uyum geçerliliği de o kadar yüksektir yorumu yapılabilir.

4. Yapı Geçerliliği Yöntemi

Dolaylı olarak ölçülebilen bir özelliği ölçebilen yönteme yapı geçerliliği yöntemi denir. Burada önemli nokta ölçülmek istenen özellikler doğrudan ölçülemez. Yine burada sorular birbiriyle ilgili ve sorular aynı yapıyı oluşturmalıdır. Bu yöntemde faktör analizi kullanılır. Ölçme aracında iki grup bulunur. Bu gruplardan birisinde sonuçlar bilinir diğerinde ise sonuçlar bilinmeyebilir.

Güvenilirlik ve Geçerlilik Testleri

Son Yazılar

Yorumlar