SPSS'te "Analyze" menüsünü açtığınızda onlarca seçenek karşınıza çıkıyor. Independent Samples t-Test mi, Mann-Whitney U mu? One-Way ANOVA mı, Kruskal-Wallis mı? Danışmanlık sürecimizde araştırmacıların en çok takıldığı nokta tam burası — veriler hazır, ama hangi testi çalıştıracakları net değil.
Test seçimini karmaşık kılan şey testlerin kendisi değil, karar sürecinin birden fazla dallanma noktası içermesi. Araştırma sorusunun türü, değişkenlerin ölçüm düzeyi, grup yapısı ve normallik durumu — bu dört faktör doğru teste ulaştırıyor. Karar ağacını bu dört düğüm üzerinden kurmak işi ciddi ölçüde basitleştiriyor.
Birinci düğüm: araştırma sorusu
Tüm istatistik testleri üç ana sorudan birine yanıt veriyor:
"A grubunda B grubundan yüksek mi?" sorusu karşılaştırma testlerine, "yaş arttıkça kan basıncı da artıyor mu?" sorusu korelasyona, "sigara kullanımı kanser riskini artırıyor mu?" sorusu regresyona yönlendiriyor. İstatistik testi seçimi yazımızda bu üçlü ayrımı daha detaylı ele alıyoruz.
İkinci düğüm: değişken tipi
Araştırma sorusundan sonra bağımlı değişkenin ölçüm düzeyi dallanmayı belirliyor:
- Sürekli değişken (yaş, boy, HbA1c, tansiyon) → Parametrik veya non-parametrik karşılaştırma testleri
- Kategorik değişken (cinsiyet, hastalık var/yok, kan grubu) → Ki-kare, Fisher exact, lojistik regresyon
- Sıralı değişken (Likert maddesi, ağrı skoru, klinik evre) → Non-parametrik testler öncelikli
Bağımlı değişken kategorikken t-testi uygulamak en sık gördüğümüz hatalardan biri. Hastalık var/yok gibi ikili bir sonuç için lojistik regresyon gerekiyor.
Üçüncü düğüm: grup yapısı
Karşılaştırma sorusunda kaç grup olduğu ve grupların birbirinden bağımsız olup olmadığı testi doğrudan belirliyor.
İki grup:
- Farklı hastalar → bağımsız (Independent t / Mann-Whitney)
- Aynı hastaların iki ölçümü → eşleşmiş (Paired t / Wilcoxon)
Üç veya daha fazla grup:
- Farklı hastalar → bağımsız (ANOVA / Kruskal-Wallis)
- Aynı hastaların tekrarlı ölçümleri → tekrarlı (RM-ANOVA / Friedman)
Tedavi öncesi-sonrası ölçümler, sağ göz-sol göz karşılaştırması, ikiz kardeş verileri — bunlar eşleşmiş (paired) tasarım. Eşleşmiş veriyi bağımsız gibi analiz etmek istatistiksel gücü düşürürken, bağımsız veriyi eşleşmiş gibi analiz etmek Tip I hata riskini artırıyor.
Dördüncü düğüm: normallik kontrolü
Sürekli bir değişkenle karşılaştırma yapılacaksa son dallanma noktası normallik:
Normallik değerlendirmesinde sadece Shapiro-Wilk p değerine bakmak yeterli olmuyor. Normalite testi yorumlama yazımızda detaylandırdığımız gibi histogram, Q-Q plot ve çarpıklık-basıklık katsayıları birlikte değerlendirildiğinde karar daha güvenilir oluyor. Büyük örneklemlerde (n>50) Shapiro-Wilk aşırı hassaslaşıyor; bu durumda histogram ve çarpıklık katsayısı daha bilgilendirici.
Hızlı eşleştirme tablosu
| Senaryo | Parametrik | Non-Parametrik |
|---|---|---|
| İki bağımsız grup, sürekli | Bağımsız t-testi | Mann-Whitney U |
| Aynı grup, iki ölçüm | Eşleşmiş t-testi | Wilcoxon |
| 3+ bağımsız grup | Tek yönlü ANOVA | Kruskal-Wallis |
| 3+ tekrarlı ölçüm | Tekrarlı ölçümler ANOVA | Friedman |
| İki sürekli değişken ilişkisi | Pearson korelasyon | Spearman korelasyon |
| İki kategorik değişken | Ki-kare | Fisher exact |
| İkili sonuç + risk faktörleri | Lojistik regresyon | — |
Karar ağacının tuzak noktaları
Üç grupta ayrı ayrı t-testi yapmak. A-B, A-C, B-C şeklinde üç t-testi uygulandığında Tip I hata %5'ten %14-15'e çıkıyor. Doğru yol: ANOVA veya Kruskal-Wallis ile genel farkı test edip, anlamlıysa post-hoc (Tukey, Bonferroni, Dunn) ile ikili karşılaştırma.
Sürekli değişkeni kategorize edip Ki-kare yapmak. Yaşı "<40 / ≥40" diye ikiye bölüp Ki-kare uygulamak ciddi güç kaybına yol açıyor. Yaş zaten sürekli — t-testi veya regresyon çok daha güçlü sonuç veriyor.
Test sonucuna göre testi değiştirmek. t-testi anlamsız çıkınca Mann-Whitney'e geçmek p-hacking'in en bilinen biçimlerinden biri. Varsayım kontrolü yapılıp test seçimi sonuçtan önce belirlenmeli — sonuca bakıp test değiştirmek hakemler tarafından kolayca fark ediliyor.
Normallik kontrolünü atlamak. Özellikle küçük örneklemlerde normallik varsayımını test etmeden parametrik analiz uygulamak, hakemlerden neredeyse garantili bir revizyon talebi getiriyor.
İpucu
Yöntem bölümünde test seçiminin gerekçesini açıkça belirtmekte fayda var: "Normallik varsayımı Shapiro-Wilk testi ve Q-Q grafiği ile değerlendirildi. Normal dağılan değişkenler için parametrik, dağılmayan değişkenler için non-parametrik testler uygulandı." Bu birkaç cümle hakemlerin en sık sorduğu metodoloji sorusunu önceden yanıtlıyor.
Kararsız kalınan durumlarda her iki yaklaşımı (parametrik ve non-parametrik) uygulayıp sonuçların tutarlılığını göstermek güçlü bir strateji. p değeri anlamsız çıktığında ne yapılacağı da bu karar sürecinin doğal bir parçası. Model İstatistik ekibi olarak analiz planınızın her aşamasında — test seçiminden raporlamaya kadar — yanınızdayız.