Etik kurul dosyasını açtınız, yöntem bölümüne geldiniz. "Örneklem büyüklüğü nasıl belirlendi?" satırı boş duruyor. "Kliniğimize başvuran ardışık hastalar alındı" yazmak aklınıza geliyor ama bir yandan da bu ifadenin artık yetmediğini biliyorsunuz. Tanıdık bir durum.
Aslında neyi hesaplıyoruz?
Örneklem büyüklüğü hesaplaması dört parametrenin dengesi: alfa düzeyi (genellikle 0.05), istatistiksel güç (genellikle 0.80), beklenen etki büyüklüğü ve kullanılacak test. Bu dördünün üçünü bildiğinizde dördüncüsü hesaplanabiliyor.
Yetersiz örneklem, gerçek bir farkı yakalama şansını düşürüyor. Gereğinden büyük örneklem ise kaynakları israf ediyor ve etik açıdan savunması zorlaşıyor. Hakemler özellikle anlamsız çıkan p değerlerinde "Yeterli güce sahip miydi bu çalışma?" sorusunu soruyor — haklı olarak. p değeri anlamsız çıktığında ne yapılacağını ayrıca ele almıştık.
| Durum | Neden Örneklem Hesaplaması Gerekli |
|---|---|
| Etik kurul başvurusu | Gereksiz fazla veya yetersiz katılımcı sorgulanıyor |
| TÜBİTAK / BAP projesi | Bütçe gerekçesi ve bilimsel geçerlilik için zorunlu |
| Prospektif klinik çalışma | Veri toplama öncesi planlama şart |
| Dergi başvurusu | Hakemler güç analizini yöntem bölümünde arıyor |
En kritik adım: etki büyüklüğü
Formülleri yazılım hallediyor, alfa ve güç standart. Asıl zorluk etki büyüklüğünü belirlemek.
Üç yol var. Birincisi ve en güveniliri literatür taraması — benzer çalışmaların etki büyüklüklerini referans almak. Meta-analizler bu konuda altın değerinde. İkincisi pilot çalışma verileri. Üçüncüsü ise Cohen'in geleneksel sınıflandırması — ama bu son çare olmalı:
| Ölçü | Küçük | Orta | Büyük | Kullanım |
|---|---|---|---|---|
| Cohen's d | 0.20 | 0.50 | 0.80 | İki grup karşılaştırma |
| Cohen's f | 0.10 | 0.25 | 0.40 | ANOVA |
| r (korelasyon) | 0.10 | 0.30 | 0.50 | Korelasyon |
| OR | 1.5 | 2.5 | 4.0 | Lojistik regresyon |
| HR | 1.3 | 1.7 | 2.5 | Sağkalım |
Akademik Not
Klinik açıdan anlamlı en küçük fark (MCID) kavramı, etki büyüklüğü belirlemede altın standart. Kan basıncında 2 mmHg'lik bir fark büyük örneklemde istatistiksel olarak anlamlı çıkabiliyor — ama tedavi kararını değiştirecek bir fark değil. MCID ve etki büyüklüğü ilişkisini etki büyüklüğü hesaplama yöntemleri yazımızda detaylı incelemiştik.
Sık gördüğümüz bir hata: "büyük etki büyüklüğü varsayarak örneklemi küçük tutmak." Bütçe veya zaman kısıtı nedeniyle etki büyüklüğü abartılıyor, çalışma yetersiz güçle yürütülüyor, sonuç anlamsız çıkıyor. Dürüst bir tahmin, ileride çok daha büyük sorunları önlüyor.
G*Power ile hesaplama
G*Power, Düsseldorf Üniversitesi'nin geliştirdiği ücretsiz yazılım. 100'den fazla test için güç analizi yapabiliyor. Üç yaygın senaryo üzerinden gidelim:
İki grup t-testi: HbA1c karşılaştırması, Cohen's d = 0.60, α = 0.05, güç = 0.80, çift yönlü → her grupta 45, toplam 90 katılımcı.
Korelasyon: BMI ile inflamasyon belirteci, r = 0.25, α = 0.05, güç = 0.80 → 123 katılımcı.
Ki-kare (2×2): Kontrol %30, tedavi %50 başarı, α = 0.05, güç = 0.80 → toplam 186 katılımcı.
Web sitemizdeki örneklem hesaplama aracı hızlı bir ön hesaplama için işe yarıyor; ancak makale ve etik kurul dosyasında G*Power veya R referansı vermek daha güçlü bir izlenim bırakıyor.
Kayıp oranı düzeltmesi
Hesaplanan örneklem "net" sayıdır — gerçek hayatta kayıp oranını eklememek sık yapılan hatalardan biri.
Formül: N_düzeltilmiş = N_hesaplanan / (1 − kayıp oranı)
Örneğin 90 kişilik hesaplamada %20 kayıp bekliyorsanız: 90 / 0.80 = 113 katılımcı.
| Çalışma Tipi | Beklenen Kayıp | Gerekçe |
|---|---|---|
| Kesitsel (tek vizit) | %5-10 | Eksik form, veri hatası |
| 3-6 ay takip | %10-20 | Takip kaybı, tedavi bırakma |
| 1 yıl kohort | %15-25 | Adres değişikliği, motivasyon |
| 2+ yıl RKÇ | %20-35 | Mortalite, uyumsuzluk |
| Online anket | %30-50 | Düşük yanıt oranı |
Kayıp oranı ve eksik veri yönetimi başlı başına bir konu — kayıp oranının örneklem üzerindeki etkisi yazımızda bu konuyu ayrıntılarıyla ele almıştık.
Raporlama: etik kurul ve makale
Tek cümlede özetlemek gerekirse: "Hangi yazılım, hangi test, hangi parametreler, neden bu etki büyüklüğü?" sorularına net yanıt vermek yeterli.
Örnek metin:
"Örneklem büyüklüğü G*Power 3.1.9.7 (Faul ve ark., 2007) ile hesaplanmıştır. Bağımsız örneklem t-testi için, 0.05 alfa düzeyinde %80 güçle 0.60 büyüklüğünde bir etki yakalamak üzere her grupta 45 olmak üzere toplam 90 katılımcı gerektiği belirlenmiştir. %20 kayıp oranı göz önüne alınarak hedef örneklem büyüklüğü 113 olarak planlanmıştır."
CONSORT kontrol listesinin 7a maddesi, RKÇ'lerde örneklem büyüklüğü raporlamasını zorunlu kılıyor. STROBE'da benzer beklenti mevcut.
Sık düşülen tuzaklar
Danışanlarımızda en sık karşılaştığımız hatalar: (1) Etki büyüklüğünü abartmak — az katılımcıyla kurtulmak için büyük etki varsaymak cazip gelse de çalışma yetersiz güçle bitiyor. (2) Tek yönlü hipotez seçimini gerekçelendirememek — hakemler sorgulayacaktır. (3) Yanlış test için hesaplama yapmak — t-testi hesabı yapıp Mann-Whitney U kullanmak tutarsızlık yaratıyor. (4) Post-hoc güç analizine aşırı güvenmek — bu konu başlı başına ayrı bir yazıyı hak ediyor. (5) Çoklu karşılaştırma düzeltmesini hesaba katmamak. (6) Küme randomizasyonunda bireysel hesaplama yapmak — ICC dikkate alınmadan yapılan hesaplama ciddi biçimde eksik kalıyor.
Türkiye'de ne bekleniyor?
Etik kurullar artık güç analizini zorunlu tutuyor. TÜBİTAK ARDEB başvurularında İstatistiksel Analiz Planı bölümündeki güç analizi puanlamayı doğrudan etkiliyor. BAP başvurularında da beklenti artmış durumda. Tez savunmalarında "Örneklem büyüklüğünüzü nasıl belirlediniz?" standart bir jüri sorusu haline geldi.
Klinik Araştırmalar Yönetmeliği (2014) uyarınca ilaç ve tıbbi cihaz çalışmalarında protokolde güç analizinin yer alması yasal zorunluluk.
Örneklem planlaması ve genel çalışma tasarımı konusunda erken aşamada destek almak, ileride karşılaşılabilecek birçok sorunu önlüyor. Model İstatistik CRO ekibi olarak hem güç analizi hem de klinik araştırma tasarımı süreçlerinde araştırmacıyla birlikte yürüyoruz.