Non-parametrik testler ne zaman zorunlu?

Dört temel durumda: normallik sağlanmadığında, sıralı veriyle çalışıldığında (Likert maddesi, ağrı skoru), aşırı uç değerler mevcut olduğunda ve küçük örneklemlerde (grup başına n<15-20). Normallik kontrolünü Shapiro-Wilk + Q-Q grafiğiyle yapıp sonucuna göre karar vermek en güvenilir yol.

Mann-Whitney U gerçekten medyanları mı karşılaştırıyor?

Yalnızca iki grubun dağılım şekilleri benzer olduğunda. Genel olarak stokastik üstünlüğü test ediyor — A grubundan rastgele bir gözlemin B grubundan büyük olma olasılığının %50'den farklı olup olmadığına bakıyor. Dağılım şekilleri çok farklıysa medyan karşılaştırması yorumu yanıltıcı olabiliyor.

Kruskal-Wallis anlamlı çıktı, sonra ne yapmalıyım?

Post-hoc test zorunlu. Dunn testi (Bonferroni düzeltmeli) en yaygın tercih. SPSS'te 'All pairwise' seçeneği bunu otomatik veriyor. R'da dunn.test veya PMCMRplus paketi işe yarıyor. Çoklu karşılaştırma düzeltmesi atlanmaması gereken bir adım.

Non-parametrik testte ortalama raporlanabilir mi?

Non-parametrik test seçildiyse tanımlayıcı istatistik olarak medyan ve IQR (veya min-max) bekleniyor. Ortalama ve standart sapma parametrik testlerin tanımlayıcısı. Bu uyumsuzluk hakemler tarafından sık eleştirilen bir nokta.

Likert ölçeği verisi parametrik testle analiz edilebilir mi?

Tek bir Likert maddesi sıralı veri — non-parametrik test daha uygun. Ama birden fazla maddenin toplanmasıyla oluşturulan ölçek toplam puanları, yeterli madde sayısı (5-7+) ve normallik sağlandığında parametrik test savunulabiliyor. Tartışmalı bir konu — her iki yaklaşımın sonuçlarını karşılaştırmalı sunmak güçlü bir strateji.

Non-parametrik testlerde güven aralığı nasıl hesaplanır?

Mann-Whitney U için Hodges-Lehmann tahmincisi ve buna ilişkin güven aralığı kullanılıyor. R'da wilcox.test fonksiyonuna conf.int=TRUE parametresi eklenerek elde edilebiliyor. SPSS'te doğrudan hesaplanmıyor; bootstrap yöntemiyle tahmin mümkün.

Fisher exact testi sadece 2x2 tablolarda mı geçerli?

Hayır. Modern yazılımlar daha büyük tablolarda da exact hesaplama yapabiliyor. R'da fisher.test, SPSS'te exact modülü. 2x2 tablolarda herhangi bir beklenen frekans 5'in altında olduğunda veya toplam örneklem 20'nin altında olduğunda Fisher exact tercih edilmeli.

Non-Parametrik Test Seçimi: Mann-Whitney, Kruskal-Wallis

Q: Mann-Whitney U gerçekten medyanları mı karşılaştırıyor?

Yalnızca iki grubun dağılım şekilleri benzer olduğunda. Genel olarak stokastik üstünlüğü test ediyor — A grubundan rastgele bir gözlemin B grubundan büyük olma olasılığının %50'den farklı olup olmadığına bakıyor. Dağılım şekilleri çok farklıysa medyan karşılaştırması yorumu yanıltıcı olabiliyor.

Q: Kruskal-Wallis anlamlı çıktı, sonra ne yapmalıyım?

Post-hoc test zorunlu. Dunn testi (Bonferroni düzeltmeli) en yaygın tercih. SPSS'te 'All pairwise' seçeneği bunu otomatik veriyor. R'da dunn.test veya PMCMRplus paketi işe yarıyor. Çoklu karşılaştırma düzeltmesi atlanmaması gereken bir adım.

Q: Non-parametrik testte ortalama raporlanabilir mi?

Non-parametrik test seçildiyse tanımlayıcı istatistik olarak medyan ve IQR (veya min-max) bekleniyor. Ortalama ve standart sapma parametrik testlerin tanımlayıcısı. Bu uyumsuzluk hakemler tarafından sık eleştirilen bir nokta.

Q: Likert ölçeği verisi parametrik testle analiz edilebilir mi?

Tek bir Likert maddesi sıralı veri — non-parametrik test daha uygun. Ama birden fazla maddenin toplanmasıyla oluşturulan ölçek toplam puanları, yeterli madde sayısı (5-7+) ve normallik sağlandığında parametrik test savunulabiliyor. Tartışmalı bir konu — her iki yaklaşımın sonuçlarını karşılaştırmalı sunmak güçlü bir strateji.

Q: Non-parametrik testlerde güven aralığı nasıl hesaplanır?

Mann-Whitney U için Hodges-Lehmann tahmincisi ve buna ilişkin güven aralığı kullanılıyor. R'da wilcox.test fonksiyonuna conf.int=TRUE parametresi eklenerek elde edilebiliyor. SPSS'te doğrudan hesaplanmıyor; bootstrap yöntemiyle tahmin mümkün.

Q: Fisher exact testi sadece 2x2 tablolarda mı geçerli?

Hayır. Modern yazılımlar daha büyük tablolarda da exact hesaplama yapabiliyor. R'da fisher.test, SPSS'te exact modülü. 2x2 tablolarda herhangi bir beklenen frekans 5'in altında olduğunda veya toplam örneklem 20'nin altında olduğunda Fisher exact tercih edilmeli.

Normallik sağlanmadığında sık verilen refleks yanıt, "o zaman Mann-Whitney yaparız" oluyor. Ama Mann-Whitney gerçekten medyanları mı karşılaştırıyor, ve Kruskal-Wallis anlamlı çıktığında hangi post-hoc testi uygulamak gerekiyor? Bu soruların yanıtı sanıldığı kadar basit değil; non-parametrik testlerin doğru seçimi ve raporlanması birkaç inceliğe dayanıyor.

Verinizin non-parametrik bir teste mi yoksa varsayımlar sağlanıyorsa daha güçlü olan parametrik teste mi uygun olduğunu adım adım belirlemek için interaktif istatistik test seçici aracımızdan yararlanabilirsiniz.

Ne zaman non-parametrik?

Non-parametrik testlere geçiş kararı dört temel durumda gündeme geliyor:

Bu dört durumdan biri varsa non-parametrik test daha güvenli bir seçenek.

Normallik sağlanmadığında. Normallik testi yöntemleri ile değerlendirme yapıldığında Shapiro-Wilk anlamlı çıkıyor, Q-Q grafiğinde belirgin sapma var ve örneklem küçükse, non-parametrik test zorunlu hale geliyor.

Sıralı (ordinal) verilerde. Likert maddesi, ağrı skoru (hafif-orta-şiddetli), klinik evre — bunlar sıralı ölçek düzeyinde olduğundan aritmetik ortalama hesaplamaya uygun değil; non-parametrik test doğal tercih.

Uç değerler belirgin olduğunda. Aşırı uç değerler ortalama ve standart sapmayı çarpıtıyor. Non-parametrik testler sıra numaralarıyla çalıştığı için uç değerlere karşı dayanıklı.

Küçük örneklemlerde. Grup başına 10-15'in altında gözlem olduğunda parametrik varsayımları doğrulamak güçleşiyor; non-parametrik testler daha güvenli bir seçenek sunuyor.

Bir nüans var: normallik sağlanıyorken gereksiz yere non-parametrik test kullanmak istatistiksel gücü düşürüyor — yani gerçek bir farkı yakalama şansı azalıyor. Bu güç kaybı tipik olarak %5-10 civarında. Doğru strateji, varsayım kontrolü yapıp sonucuna göre bilinçli bir karar vermek.

Eşleştirme tablosu

Senaryo	Parametrik	Non-parametrik
İki bağımsız grup (sürekli)	t-testi	Mann-Whitney U
Aynı grup, iki ölçüm	Eşleşmiş t-testi	Wilcoxon işaretli sıralar
Üç+ bağımsız grup	Tek yönlü ANOVA	Kruskal-Wallis
Aynı grup, üç+ ölçüm	Tekrarlı ölçümler ANOVA	Friedman
İki sürekli değişken ilişkisi	Pearson korelasyon	Spearman korelasyon
İki kategorik değişken	Ki-kare	Fisher exact
Eşleşmiş kategorik veri	—	McNemar

Bu tablo bir yol haritası, ama önemli bir ayrıntı var: non-parametrik testler ortalamaları değil, dağılımların genel konumunu veya sıralamalarını karşılaştırıyor. Bu yüzden sonuçlar "A grubunun ortalaması yüksektir" yerine "A grubundaki değerler sistematik olarak daha yüksektir" biçiminde ifade ediliyor.

Mann-Whitney U: sanıldığından farklı

Mann-Whitney U en yaygın non-parametrik test, ama en çok yanlış anlaşılan da o. Yaygın inanış "medyanları karşılaştırır" biçiminde — oysa bu yalnızca iki grubun dağılım şekilleri benzer olduğunda doğru. Dağılım şekilleri farklıysa (biri çarpık, diğeri simetrik gibi) test aslında stokastik üstünlüğü ölçüyor: "A grubundan rastgele bir gözlemin, B grubundan rastgele bir gözlemden büyük olma olasılığı %50'den farklı mı?"

Raporlamada medyan ve IQR (çeyrekler arası aralık) tercih ediliyor, ortalama ve standart sapma değil. Örnek formülasyon: "Tedavi grubunun medyan CRP düzeyi (Mdn=12,4, IQR=8,2–18,6), kontrol grubundan (Mdn=22,1, IQR=15,3–31,7) anlamlı olarak düşüktü (U=187, z=−3,41, p<0,001, r=0,45)."

Wilcoxon: eşleşmiş verilerin non-parametrik yolu

Wilcoxon işaretli sıralar testi, eşleşmiş t-testinin non-parametrik karşılığı; aynı bireylerin iki koşuldaki ölçümlerini karşılaştırıyor. Mantığı sade: her bireyin iki ölçümü arasındaki fark hesaplanıyor, sıfır olan farklar çıkarılıyor, kalan farklar mutlak değerine göre sıralanıyor ve pozitif-negatif farkların sıra toplamları karşılaştırılıyor. Tedavi öncesi-sonrası ölçümler, sağ göz-sol göz karşılaştırmaları gibi durumlar için uygun; fark skorlarının simetrik dağılması bekleniyor (normallik şart değil ama simetri beklenir).

Kruskal-Wallis sonrası post-hoc

Kruskal-Wallis anlamlı çıktığında — tıpkı ANOVA sonrasında olduğu gibi — hangi gruplar arasında fark olduğunu post-hoc testlerle belirlemek gerekiyor. Bu adımı atlamak, "gruplar arasında fark var" deyip hangilerinde olduğunu göstermemek, hakemlerden neredeyse garantili bir revizyon getiriyor.

En yaygın yöntem Dunn testi (Bonferroni düzeltmeli); SPSS'te Kruskal-Wallis çıktısındaki "All pairwise" seçeneği bunu otomatik veriyor. Conover testi Dunn'dan biraz daha güçlü bir alternatif; R'da dunn.test veya PMCMRplus paketleri iş görüyor. Friedman testi anlamlı çıktığında ise Bonferroni düzeltmeli Wilcoxon testleri ya da Nemenyi testi kullanılıyor.

Çoklu karşılaştırma düzeltmesini atlamamak kritik — düzeltme yapılmadan her ikili karşılaştırmayı ayrı raporlamak Tip I hata riskini ciddi biçimde artırıyor. Çoklu karşılaştırma düzeltmeleri yazımız bu yöntemleri ayrıntılı ele alıyor.

Non-parametrik test raporlama

Sık yapılan hatalar

Doğru yaklaşım

Etki büyüklüğü: p yetmiyor

Non-parametrik testlerde de etki büyüklüğü raporlamak zorunlu hale geldi; yalnızca p değeri sunmak hem editörler hem hakemler tarafından yetersiz bulunuyor.

Test	Etki büyüklüğü	Küçük / orta / büyük
Mann-Whitney U, Wilcoxon	r = Z / √N	0,10 / 0,30 / 0,50
Kruskal-Wallis	η²_H = (H − k + 1) / (N − k)	0,01 / 0,06 / 0,14
Friedman	Kendall's W	0,10 / 0,30 / 0,50
Ki-kare	Cramér's V	0,10 / 0,30 / 0,50
Fisher exact	Odds ratio	1,68 / 3,47 / 6,71

Odds ratio için verilen 1,68 / 3,47 / 6,71 eşikleri, Chen ve arkadaşlarının (2010) Cohen'in d ölçütüyle eşleştirdiği küçük/orta/büyük değerlerdir; koruyucu yöndeki etkiler için bunların tersi (0,60 / 0,29 / 0,15) kullanılır.

Normal dağılımda kayıp küçük; varsayım ihlal edildiğinde non-parametrik test daha güçlü olabiliyor.

İpucu

Non-parametrik testlerin güç kaybı sık abartılıyor. Normal dağılım altında bile Mann-Whitney U'nun gücü t-testinin yaklaşık %95'ine ulaşıyor (asimptotik göreli verim 3/π ≈ 0,955). Normallik varsayımı ihlal edildiğinde ise non-parametrik testler parametrikten daha güçlü olabiliyor. "Non-parametrik kullandım, güç kaybettim" kaygısı — varsayım gerçekten ihlal edildiyse — temelsiz.

Güç analizi planlaması

Non-parametrik testler için güç analizi hesabında genellikle parametrik karşılığının örneklem büyüklüğüne %5-15 ekleme öneriliyor. Yani t-testi için 64 kişi yetiyorsa, Mann-Whitney U için 67-74 kişi hedeflemekte fayda var; bu ek yük çoğu klinik çalışmada karşılanabilir düzeyde. Ayrıntı için örneklem büyüklüğü hesaplama yazımıza bakabilirsiniz.

Non-parametrik testlerin doğru uygulanması ve raporlanmasında tereddüt yaşarsanız, Model İstatistik ekibi olarak analiz planınızı test seçiminden raporlamaya kadar birlikte gözden geçiriyoruz. Doğru test seçimi ve doğru raporlama, hakemlerden gelecek metodoloji eleştirilerini önceden karşılayan en güçlü araç; istatistik testi seçimi sürecindeki bilinçli gerekçelendirme de bunun temeli.

Not: Buradaki etki büyüklüğü eşikleri ve güç aralıkları yol gösterici değerlerdir; kesin karar çalışmanın verisi ve dağılım yapısı üzerinden verilir.

Kullanılan kaynaklar

Mishra P, Pandey CM, Singh U, Keshri A, Sabaretnam M. Selection of appropriate statistical methods for data analysis. Annals of Cardiac Anaesthesia. 2019;22(3):297-301. · DOI
Chen H, Cohen P, Chen S. How big is a big odds ratio? Interpreting the magnitudes of odds ratios in epidemiological studies. Communications in Statistics - Simulation and Computation. 2010;39(4):860-864. · DOI

Ne zaman non-parametrik?

Non-parametrik testlere geçiş kararı dört temel durumda gündeme geliyor:

Bu dört durumdan biri varsa non-parametrik test daha güvenli bir seçenek.

Küçük örneklemlerde. Grup başına 10-15'in altında gözlem olduğunda parametrik varsayımları doğrulamak güçleşiyor; non-parametrik testler daha güvenli bir seçenek sunuyor.

Eşleştirme tablosu

Senaryo	Parametrik	Non-parametrik
İki bağımsız grup (sürekli)	t-testi	Mann-Whitney U
Aynı grup, iki ölçüm	Eşleşmiş t-testi	Wilcoxon işaretli sıralar
Üç+ bağımsız grup	Tek yönlü ANOVA	Kruskal-Wallis
Aynı grup, üç+ ölçüm	Tekrarlı ölçümler ANOVA	Friedman
İki sürekli değişken ilişkisi	Pearson korelasyon	Spearman korelasyon
İki kategorik değişken	Ki-kare	Fisher exact
Eşleşmiş kategorik veri	—	McNemar

Non-parametrik test raporlama

Sık yapılan hatalar

Doğru yaklaşım

Etki büyüklüğü: p yetmiyor

Non-parametrik testlerde de etki büyüklüğü raporlamak zorunlu hale geldi; yalnızca p değeri sunmak hem editörler hem hakemler tarafından yetersiz bulunuyor.

Test	Etki büyüklüğü	Küçük / orta / büyük
Mann-Whitney U, Wilcoxon	r = Z / √N	0,10 / 0,30 / 0,50
Kruskal-Wallis	η²_H = (H − k + 1) / (N − k)	0,01 / 0,06 / 0,14
Friedman	Kendall's W	0,10 / 0,30 / 0,50
Ki-kare	Cramér's V	0,10 / 0,30 / 0,50
Fisher exact	Odds ratio	1,68 / 3,47 / 6,71

Normal dağılımda kayıp küçük; varsayım ihlal edildiğinde non-parametrik test daha güçlü olabiliyor.

İpucu

Güç analizi planlaması

Not: Buradaki etki büyüklüğü eşikleri ve güç aralıkları yol gösterici değerlerdir; kesin karar çalışmanın verisi ve dağılım yapısı üzerinden verilir.

Kullanılan kaynaklar

Mishra P, Pandey CM, Singh U, Keshri A, Sabaretnam M. Selection of appropriate statistical methods for data analysis. Annals of Cardiac Anaesthesia. 2019;22(3):297-301. · DOI
Chen H, Cohen P, Chen S. How big is a big odds ratio? Interpreting the magnitudes of odds ratios in epidemiological studies. Communications in Statistics - Simulation and Computation. 2010;39(4):860-864. · DOI

Non-Parametrik Test Seçimi: Hangisi Ne Zaman?

Ne zaman non-parametrik?

Eşleştirme tablosu

Mann-Whitney U: sanıldığından farklı

Wilcoxon: eşleşmiş verilerin non-parametrik yolu

Kruskal-Wallis sonrası post-hoc

Non-parametrik test raporlama

Etki büyüklüğü: p yetmiyor

Güç analizi planlaması

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Doğru İstatistik Testini Nasıl Seçersiniz?

Normallik Testi Yöntemleri: Hangisi, Ne Zaman?

Araştırmanız İçin Destek Alın

Non-Parametrik Test Seçimi: Hangisi Ne Zaman?

Ne zaman non-parametrik?

Eşleştirme tablosu

Mann-Whitney U: sanıldığından farklı

Wilcoxon: eşleşmiş verilerin non-parametrik yolu

Kruskal-Wallis sonrası post-hoc

Non-parametrik test raporlama

Etki büyüklüğü: p yetmiyor

Güç analizi planlaması

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Doğru İstatistik Testini Nasıl Seçersiniz?

Normallik Testi Yöntemleri: Hangisi, Ne Zaman?

Araştırmanız İçin Destek Alın