Veriler toplandı, SPSS açıldı, en kritik an geldi: "Analyze" menüsünde hangi seçeneğe tıklayacaksınız?
Yanlış test seçimi makalenin en sık eleştiri alan noktalarından biri. Parametrik test varsayımları karşılanmadan uygulandığında Tip I hata şişiyor, parametrik test kullanılabilecekken gereksiz non-parametrik teste geçildiğinde güç düşüyor. Her iki durumda da hakemlerden revizyon talebi geliyor — ve genellikle haklılar.
Üç temel soru ile başlamak
Test seçiminde ilk adım araştırma sorusunun türünü netleştirmek. Temelde üç kategoriden birine düşüyor:
Karşılaştırma: İki veya daha fazla grup arasında fark var mı? Tedavi grubu ile kontrol grubunun kan basıncı farkı, üç farklı ilacın etkinlik karşılaştırması gibi.
İlişki: İki değişken arasında ilişki var mı? BMI ile HbA1c arasındaki korelasyon, yaş ile ilaç dozu arasındaki ilişki gibi.
Tahmin: Bir veya birden fazla değişken sonucu ne ölçüde öngörüyor? Yaş, cinsiyet ve sigara kullanımının kanser riskine etkisi gibi.
Bu ayrım doğrudan farklı test ailelerine yönlendiriyor. Karşılaştırma sorusu t-testi/ANOVA ailesine, ilişki sorusu korelasyon testlerine, tahmin sorusu regresyon modellerine.
Değişken türü her şeyi belirliyor
Araştırma sorusundan sonra en belirleyici faktör bağımlı değişkenin ölçüm düzeyi.
Sürekli değişken (kan basıncı, boy, laboratuvar değerleri) → t-testi, ANOVA, Mann-Whitney, Kruskal-Wallis ailesine yönlendiriyor.
Kategorik değişken (cinsiyet, kan grubu, tanı kategorisi) → Ki-kare, Fisher exact testine yönlendiriyor.
Sıralı değişken (Likert maddesi, ağrı skoru, klinik evre) → Non-parametrik testlere yönlendiriyor; toplam puan kullanılıyorsa ve normallik sağlanıyorsa parametrik test de savunulabiliyor.
Sayım verisi (nöbet sayısı, hastaneye yatış sayısı) → Poisson veya negatif binom regresyonuna yönlendiriyor.
Grup yapısı: bağımsız mı, bağımlı mı?
Kaç grubu karşılaştırdığınız ve grupların birbirinden bağımsız olup olmadığı testi doğrudan belirliyor.
Aynı hastaların tedavi öncesi ve sonrası ölçümleri → bağımlı (eşleşmiş) grup. Eşleşmiş t-testi veya Wilcoxon.
Farklı hastaların tedavi ve kontrol grupları → bağımsız grup. Bağımsız t-testi veya Mann-Whitney.
Üç veya daha fazla bağımsız grup → ANOVA veya Kruskal-Wallis. Üç veya daha fazla tekrarlı ölçüm → Tekrarlı ölçümler ANOVA veya Friedman.
Bu ayrımı yanlış yapmak ciddi sonuçlar doğuruyor — eşleşmiş veriyi bağımsız gibi analiz etmek gücü düşürürken, bağımsız veriyi eşleşmiş gibi analiz etmek Tip I hata riskini artırıyor.
Normallik kontrolü: kısa ama şart
Parametrik testlerin temel koşulu normal dağılım. Normallik testi yöntemleri yazımızda detaylandırdığımız gibi Shapiro-Wilk testi ve Q-Q grafiği birlikte kullanılarak bu kontrol yapılıyor. Normallik sağlanmadığında non-parametrik test seçimi gündeme geliyor.
Bir ek kontrol daha var: varyans homojenliği. İki veya daha fazla grubu karşılaştırırken Levene testi ile grupların varyanslarının benzer olup olmadığına bakılıyor. Varyanslar homojen değilse Welch t-testi veya Welch ANOVA daha güvenilir sonuç veriyor.
Eşleştirme tablosu
| Senaryo | Parametrik | Non-Parametrik |
|---|---|---|
| İki bağımsız grup, sürekli | Bağımsız t-testi | Mann-Whitney U |
| Aynı grup, iki ölçüm | Eşleşmiş t-testi | Wilcoxon |
| 3+ bağımsız grup | Tek yönlü ANOVA | Kruskal-Wallis |
| 3+ tekrarlı ölçüm | Tekrarlı ölçümler ANOVA | Friedman |
| İki sürekli değişken ilişkisi | Pearson korelasyon | Spearman korelasyon |
| İki kategorik değişken | Ki-kare | Fisher exact |
| Birden fazla bağımsız değişken + sürekli sonuç | Çoklu doğrusal regresyon | — |
| İkili sonuç değişkeni | Lojistik regresyon | — |
Bu tablo genel bir rehber; karmaşık tasarımlarda (çok merkezli, hiyerarşik veri, tekrarlanan ölçümler + kovaryatlar) karma modeller veya genelleştirilmiş doğrusal modeller gerekebiliyor.
En sık yapılan hatalar
Üç grupta t-testi tekrarlamak. A-B, A-C, B-C şeklinde üç ayrı t-testi yapmak Tip I hata oranını %5'ten %14'e çıkarıyor. Doğru yaklaşım: ANOVA veya Kruskal-Wallis ile genel farkı test edip, anlamlıysa post-hoc (Tukey, Bonferroni, Dunn) ile ikili karşılaştırma yapmak.
Ki-kare'yi küçük örneklemde zorlamak. Beklenen frekansların %20'den fazlası 5'in altında olduğunda Ki-kare güvenilir sonuç vermiyor. Fisher exact testi bu durumda zorunlu.
Normallik kontrolünü atlamak. Özellikle küçük örneklemlerde normallik varsayımı test edilmeden parametrik test uygulamak, hakemlerden neredeyse garantili bir revizyon talebi getiriyor.
Etki büyüklüğünü raporlamamak. p<0.05 yetmiyor. Cohen's d, eta-kare, odds ratio gibi etki büyüklüğü ölçütleri olmadan sonuçların klinik anlamlılığı değerlendirilemez. p değeri anlamsız çıktığında ne yapılacağını anlatan yazımız bu konuda detaylı bir perspektif sunuyor.
İpucu
Makale yöntem bölümünde test seçiminin gerekçesini açıkça belirtmekte fayda var. "Sürekli değişkenlerin normal dağılıma uygunluğu Shapiro-Wilk testi ve Q-Q grafiği ile değerlendirildi. Normallik sağlanan değişkenler için parametrik, sağlanmayan değişkenler için non-parametrik testler uygulandı." Bu tek cümle, hakemlerin en sık sorduğu soruyu önceden yanıtlıyor.
Test seçiminde kararsız kaldığınız durumlarda veya karmaşık tasarımlarda Model İstatistik ekibi olarak analiz planınızı birlikte oluşturmaktan memnuniyet duyarız. Doğru test seçimi, güçlü bir makalenin ilk adımı — ve bu adımı sağlam attığınızda gerisinin gelmesi çok daha kolay.