Hakem raporunda şöyle bir cümle var: "Statistical methods are insufficiently described. Cannot reproduce the analysis." Major revision.
Üç ay uğraşılmış, 200 hasta toplanmış, SPSS'te onlarca analiz çalıştırılmış. Methods bölümüne "İstatistiksel analizler SPSS 25.0 ile yapıldı. Karşılaştırmalarda t-testi kullanıldı. p<0.05 anlamlı kabul edildi" yazılmış. Yeterli olduğu düşünülmüş — ama olmamış.
Methods bölümünün gerçek işlevi
Reproducibility (tekrarlanabilirlik) son on yılda bilimsel yayıncılığın en kritik meselesi haline geldi. Nature ve Science dahil üst düzey dergiler metodolojik şeffaflık standardını yükseltti. "Standart istatistiksel yöntemler uygulandı" yazmak artık kabul edilmiyor.
Hakemlerin sorduğu üç temel soru var: (1) Bunu tekrarlayabilir miyim? — aynı analize ulaşmak için gerekli tüm bilgi verilmiş mi? (2) Metodolojik seçimler gerekçeli mi? — neden bu test, neden başkası değil? (3) Raporlama standartlarına uyuyor mu? — STROBE, CONSORT gibi kılavuzlar karşılanmış mı?
Yetersiz vs yeterli detay
İstatistik Alt Bölümü Karşılaştırması
Yetersiz Detay
Reproducible Yazım
Sol taraftaki yazımda hakem "nasıl karar verdiniz?" diye soracak. Sağ taraftaki yazımda soru sormasına gerek kalmayacak.
Normallik kontrolü ve test seçim süreci
Sadece "normallik test edildi" demek yetmiyor. Hangi testle kontrol edildiği (Shapiro-Wilk, Kolmogorov-Smirnov, Q-Q plot), eşik değerin ne olduğu (p>0.05 mi, p>0.10 mu) ve karar algoritmasının ne olduğu (normal → parametrik, anormal → non-parametrik) açıkça belirtilmeli.
Örnek: "Sürekli değişkenlerin normal dağılıma uygunluğu Shapiro-Wilk testi (p>0.05 eşiği) ve histogram/Q-Q plot görsel kontrolü ile değerlendirildi."
Varsayım ihlalleri ve alternatif stratejiler
Gerçek dünyada varsayımlar her zaman tutmuyor. Bunun gizlenmesi yerine nasıl başa çıkıldığının yazılması bekleniyor.
Varyans homojenliği ihlali varsa Welch t-testi kullanılıp kullanılmadığı, normallik sağlanmadıysa non-parametrik mi yoksa transformasyon mu tercih edildiği (hangi transformasyon: log, sqrt, Box-Cox), küçük örneklemde merkezi limit teoremi gerekçesiyle parametrik teste devam edilip edilmediği — bu detaylar hakem sorusunu önceden yanıtlıyor.
Eksik veri yönetimi
Eksik veri neredeyse her çalışmada var. Nasıl ele alındığı metodolojik yetkinliğin göstergesi.
Temel yaklaşım: "Eksik veri oranı %8.3 idi (23/276 değer). Tamamen rastgele kayıp (MCAR) varsayımı Little's MCAR testi ile kontrol edildi (p=0.42). Listwise deletion uygulandı; final örneklem 253 hasta."
İleri düzey: "Multiple imputation by chained equations (MICE) yöntemiyle 20 impute veri seti oluşturuldu. Rubin's rules ile havuzlandı. Duyarlılık analizi için complete case ve imputed sonuçlar karşılaştırıldı."
İlk yaklaşım çoğu dergi için yeterli. İkincisi üst düzey epidemiyoloji dergilerinde tercih ediliyor.
Çoklu karşılaştırma düzeltmesi
Birden fazla karşılaştırma yapıldığında (5 farklı biyobelirteç gibi) Tip I hata oranı şişiyor. Bonferroni (en muhafazakar, α/n), Holm-Bonferroni (biraz daha liberal), FDR — Benjamini-Hochberg (genomik/proteomik çalışmalarda tercih) seçenekleri var.
Örnek: "Beş bağımsız karşılaştırma için Bonferroni düzeltmesi uygulandı (düzeltilmiş α=0.01)."
Uyarı
Çoklu karşılaştırma yapılıp düzeltme uygulanmadıysa bunun gerekçesi belirtilmeli. "Karşılaştırmalar birbirinden bağımsız hipotezler olup exploratory nitelikte olduğundan düzeltme uygulanmadı" şeklinde bir gerekçe kabul edilebiliyor. Sessizce atlanması durumunda hakem bunu fark ediyor.
Örneklem büyüklüğü hesaplama
A priori güç analizi her methods bölümünde olması beklenen bir bilgi. Beklenen etki büyüklüğünün nereden geldiği (pilot çalışma, literatür, klinik anlamlılık eşiği), alfa ve beta değerleri, test türü (tek/iki yönlü) ve kullanılan yazılım (G*Power, PASS, R pwr paketi) belirtilmeli.
Örnek: "İki bağımsız grup karşılaştırması için a priori güç analizi yapıldı (G*Power 3.1). Literatüre dayalı beklenen etki büyüklüğü d=0.50, %80 güç ve α=0.05 için grup başına minimum 64 hasta hesaplandı. %15 kayıp tahminiyle hedef örneklem 74 hasta/grup olarak belirlendi."
Ulaşılan sayı hedefin altında kaldıysa dürüst raporlama bekleniyor: "Süre kısıtı nedeniyle 58 hasta/grup ile tamamlandı (elde edilen güç %73)."
Raporlama kılavuzları
| Çalışma Tipi | Kılavuz | Kontrol Maddesi |
|---|---|---|
| Gözlemsel (kesitsel, kohort) | STROBE | 22 madde |
| Randomize kontrollü | CONSORT | 25 madde + akış şeması |
| Tanısal doğruluk | STARD | 30 madde |
| Sistematik derleme | PRISMA | 27 madde |
Methods bölümünde "Raporlama STROBE kılavuzuna uygun yapıldı" şeklinde belirtilmesi öneriliyor. Bazı dergiler submission sırasında kontrol listesi yüklenmesini istiyor.
Yazılım ve versiyon bilgisi
"SPSS kullanıldı" yeterli değil — versiyon bilgisi gerekiyor çünkü aynı fonksiyon farklı versiyonlarda farklı algoritma kullanabiliyor.
Minimum: "İstatistiksel analizler IBM SPSS Statistics 28.0 (IBM Corp., Armonk, NY, USA) ile gerçekleştirildi."
R kullanıcıları için: "Analizler R 4.3.1 ortamında gerçekleştirildi. Kullanılan paketler: tidyverse (v2.0.0), lme4 (v1.1-34), ggplot2 (v3.4.3)."
İpucu
Methods bölümü yazılmadan önce hedef derginin "Instructions for Authors" sayfasındaki "Statistical Methods" bölümünün okunması çok faydalı. Bazı dergiler çok spesifik isteklerde bulunuyor — örneğin JAMA, istatistikçi katkısını acknowledgment'ta görmek istiyor.
IMRAD yapısının genel çerçevesi ve bölümler arası tutarsızlık kontrolü yazılarımız Methods bölümünün makale bütünlüğü içindeki yerini daha geniş perspektiften ele alıyor.
Model İstatistik ekibi olarak makale yazım sürecinde — Methods bölümünün yapılandırılmasından istatistik raporlamaya, hakem yanıtlarından revizyon stratejisine kadar — her aşamada destek sunmaktan memnuniyet duyarız.