Retrospektif çalışmada örneklem hesaplaması nasıl yapılır?

Mevcut veri setinin büyüklüğü sabit olduğundan, sensitivity analizi daha uygun bir yaklaşım. Mevcut örneklemle tespit edilebilecek minimum etki büyüklüğünü hesaplamak veya güven aralığı genişliğine dayalı raporlama yapmak, post-hoc güç analizinden çok daha bilgilendirici.

G*Power hangi testler için kullanılabiliyor?

t-testleri, ANOVA, MANOVA, ki-kare, korelasyon, regresyon, z-testleri ve exact testler dahil 100'den fazla test destekleniyor. Sağkalım analizi de mevcut. Küme randomizasyonu gibi özel tasarımlar için R veya PASS gerekebilir.

Alfa ve güç için standart değerler ne?

Geleneksel olarak alfa = 0.05 ve güç = 0.80 kullanılıyor. Tip II hatanın maliyetinin yüksek olduğu çalışmalarda güç 0.90'a çıkarılabiliyor. Çoklu karşılaştırma yapılacaksa Bonferroni düzeltmesi nedeniyle alfa düşürülüyor — bu da gereken örneklemi artırıyor.

Etki büyüklüğü için hiçbir referans bulamıyorsam?

Farklı anahtar kelimelerle sistematik tarama, ilişkili sonuç değişkenleriyle yapılmış çalışmalara bakma gibi adımlar işe yarıyor. Gerçekten referans yoksa pilot çalışma verileri veya son çare olarak Cohen sınıflandırması kullanılabiliyor. Bu durumda farklı etki büyüklükleri için duyarlılık analizi sunmak hakem ve etik kurul nezdinde güçlü bir izlenim bırakıyor.

Eşit olmayan grup büyüklükleri gücü nasıl etkiler?

1:1 oranı en yüksek gücü sağlıyor. 1:2 oranında eşit güce ulaşmak için toplam örneklem yaklaşık %12-15 artırılması gerekiyor. Nadir hastalıklarda kontrol grubunu büyütmek (1:2 veya 1:3) pratik bir çözüm olabiliyor. G*Power'da Allocation ratio parametresiyle bu durum modellenebiliyor.

Non-parametrik testler için hesaplama farklı mı?

Evet. Non-parametrik testlerin gücü parametrik muadillerinden %5-15 daha düşük. Parametrik hesaplamayı 1/ARE faktörüyle (Mann-Whitney U için ~1.05) çarpmak gerekiyor. G*Power bazı non-parametrik testler için doğrudan hesaplama yapabiliyor.

Makalede nereye yazılıyor?

Yöntem bölümünün İstatistiksel Analiz veya Örneklem Büyüklüğü alt başlığında. Yazılım, test, etki büyüklüğü kaynağı, alfa, güç ve kayıp düzeltmesi bilgileri birlikte sunuluyor. CONSORT veya STROBE kılavuzunun formatına uyum hakemler tarafından takdir ediliyor.

Örneklem Büyüklüğü Hesaplama: Pratik Rehber

Etik kurul dosyalarında ve makale yöntem bölümlerinde "Kliniğimize başvuran ardışık hastalar alındı" ifadesi artık yeterli görülmüyor; örneklem büyüklüğünün nasıl belirlendiği açık bir gerekçeyle gösterilmeli. Örneklem hesaplaması aslında dört parametrenin dengesinden ibaret ve doğru kurulduğunda hem yetersiz güçten hem de gereksiz katılımcıdan koruyor.

Aslında neyi hesaplıyoruz?

Örneklem büyüklüğü hesaplaması dört parametrenin dengesi: α düzeyi (genellikle 0,05), istatistiksel güç (genellikle 0,80), beklenen etki büyüklüğü ve kullanılacak test. Bu dördünün üçü bilindiğinde dördüncüsü hesaplanabiliyor.

Yetersiz örneklem, gerçek bir farkı yakalama şansını düşürüyor. Gereğinden büyük örneklem ise kaynakları israf ediyor ve etik açıdan savunması zorlaşıyor. Hakemler özellikle anlamsız çıkan p değerlerinde "Bu çalışma yeterli güce sahip miydi?" sorusunu soruyor — haklı olarak. p değeri anlamsız çıktığında ne yapılacağını ayrıca ele almıştık.

Durum	Neden örneklem hesaplaması gerekli
Etik kurul başvurusu	Gereksiz fazla veya yetersiz katılımcı sorgulanıyor
TÜBİTAK / BAP projesi	Bütçe gerekçesi ve bilimsel geçerlilik için zorunlu
Prospektif klinik çalışma	Veri toplama öncesi planlama şart
Dergi başvurusu	Hakemler güç analizini yöntem bölümünde arıyor

En kritik adım: etki büyüklüğü

Formülleri yazılım hallediyor, α ve güç standart. Asıl zorluk etki büyüklüğünü belirlemek.

Üç yol var. Birincisi ve en güveniliri literatür taraması — benzer çalışmaların etki büyüklüklerini referans almak; meta-analizler bu konuda altın değerinde. İkincisi pilot çalışma verileri. Üçüncüsü Cohen'in geleneksel sınıflandırması, ama bu son çare olmalı (Cohen, 1992):

Ölçü	Küçük	Orta	Büyük	Kullanım
Cohen's d	0,20	0,50	0,80	İki grup karşılaştırma
Cohen's f	0,10	0,25	0,40	ANOVA
r (korelasyon)	0,10	0,30	0,50	Korelasyon
OR	1,5	2,5	4,0	Lojistik regresyon
HR	1,3	1,7	2,5	Sağkalım

Akademik Not

Klinik açıdan anlamlı en küçük fark (MCID) kavramı, etki büyüklüğü belirlemede altın standart. Kan basıncında 2 mmHg'lik bir fark büyük örneklemde istatistiksel olarak anlamlı çıkabiliyor — ama tedavi kararını değiştirecek bir fark değil. MCID ve etki büyüklüğü ilişkisini etki büyüklüğü hesaplama yöntemleri yazımızda incelemiştik.

Sık gördüğümüz bir hata: büyük etki büyüklüğü varsayarak örneklemi küçük tutmak. Bütçe veya zaman kısıtı nedeniyle etki büyüklüğü abartılıyor, çalışma yetersiz güçle yürütülüyor, sonuç anlamsız çıkıyor. Dürüst bir tahmin, ileride çok daha büyük sorunları önlüyor.

G*Power ile hesaplama

G*Power, Düsseldorf Üniversitesi'nin geliştirdiği ücretsiz yazılım; 100'den fazla test için güç analizi yapabiliyor. Üç yaygın senaryo:

İki grup t-testi: HbA1c karşılaştırması, Cohen's d = 0,60, α = 0,05, güç = 0,80, çift yönlü → her grupta 45, toplam 90 katılımcı.

Korelasyon: BMI ile inflamasyon belirteci, r = 0,25, α = 0,05, güç = 0,80 → 123 katılımcı.

Ki-kare (2×2): Kontrol %30, tedavi %50 başarı, α = 0,05, güç = 0,80 → toplam 186 katılımcı.

Aynı α ve güç hedefinde, test türü ve etki büyüklüğü örneklemi belirgin biçimde değiştiriyor.

Web sitemizdeki örneklem hesaplama aracı hızlı bir ön hesaplama için işe yarıyor; ancak makale ve etik kurul dosyasında G*Power veya R referansı vermek daha güçlü bir izlenim bırakıyor.

Kayıp oranı düzeltmesi

Hesaplanan örneklem "net" sayıdır; gerçek hayatta kayıp oranını eklememek sık yapılan hatalardan biri.

Formül: n_düzeltilmiş = n_hesaplanan / (1 − kayıp oranı)

Örneğin 90 kişilik hesaplamada %20 kayıp bekleniyorsa: 90 / 0,80 ≈ 113 katılımcı.

Kayıp oranı büyüdükçe düzeltme çarpanı doğrusal değil, hızlanan biçimde artıyor.

Çalışma tipi	Beklenen kayıp	Gerekçe
Kesitsel (tek vizit)	%5-10	Eksik form, veri hatası
3-6 ay takip	%10-20	Takip kaybı, tedavi bırakma
1 yıl kohort	%15-25	Adres değişikliği, motivasyon
2+ yıl RKÇ	%20-35	Mortalite, uyumsuzluk
Çevrimiçi anket	%30-50	Düşük yanıt oranı

Kayıp oranı ve eksik veri yönetimi başlı başına bir konu — kayıp oranının örneklem üzerindeki etkisi yazımızda bunu ayrıntısıyla ele almıştık.

Raporlama: etik kurul ve makale

Raporlamanın özü şu dört soruya net yanıt vermek: "Hangi yazılım, hangi test, hangi parametreler, neden bu etki büyüklüğü?"

Örnek metin:

"Örneklem büyüklüğü G*Power 3.1.9.7 (Faul ve ark., 2007) ile hesaplanmıştır. Bağımsız örneklem t-testi için, 0,05 α düzeyinde %80 güçle 0,60 büyüklüğünde bir etki yakalamak üzere her grupta 45 olmak üzere toplam 90 katılımcı gerektiği belirlenmiştir. %20 kayıp oranı göz önüne alınarak hedef örneklem büyüklüğü 113 olarak planlanmıştır."

CONSORT kontrol listesinin 7a maddesi, RKÇ'lerde örneklem büyüklüğü raporlamasını zorunlu kılıyor; STROBE'da da benzer bir beklenti var.

Sık düşülen tuzaklar

En sık karşılaşılan hatalar: (1) Etki büyüklüğünü abartmak — az katılımcıyla kurtulmak için büyük etki varsaymak cazip gelse de çalışma yetersiz güçle bitiyor. (2) Tek yönlü hipotez seçimini gerekçelendirememek — hakemler bunu sorgular. (3) Yanlış test için hesaplama yapmak — t-testi hesabı yapıp Mann-Whitney U kullanmak tutarsızlık yaratıyor. (4) Post-hoc güç analizine aşırı güvenmek. (5) Çoklu karşılaştırma düzeltmesini hesaba katmamak. (6) Küme randomizasyonunda bireysel hesaplama yapmak — sınıf-içi korelasyon (ICC) dikkate alınmadan yapılan hesaplama ciddi biçimde eksik kalıyor.

Türkiye'de ne bekleniyor?

Etik kurullar artık güç analizini zorunlu tutuyor. TÜBİTAK ARDEB başvurularında İstatistiksel Analiz Planı bölümündeki güç analizi puanlamayı doğrudan etkiliyor; BAP başvurularında da beklenti artmış durumda. Tez savunmalarında "Örneklem büyüklüğünüzü nasıl belirlediniz?" standart bir jüri sorusu hâline geldi.

Klinik Araştırmalar Hakkında Yönetmelik uyarınca ilaç ve tıbbi cihaz çalışmalarında protokolde güç analizinin yer alması yasal zorunluluk.

Örneklem planlaması ve çalışma tasarımı konusunda erken aşamada destek almak, ileride karşılaşılabilecek birçok sorunu önlüyor; bu desteğin araştırmanın hangi aşamasında dahil olması gerektiği çalışmanın kalitesini büyük ölçüde belirliyor. Model İstatistik olarak güç analizi ve klinik araştırma tasarımı süreçlerinde araştırmacıya rehberlik ediyoruz.

Not: Buradaki örnekler ve kayıp aralıkları yol gösterici niteliktedir; kesin örneklem çalışmanın tasarımına, birincil sonuç ölçütüne ve alanın standartlarına göre G*Power veya R gibi araçlarla hesaplanır.

Kullanılan kaynaklar

Faul F, Erdfelder E, Lang AG, Buchner A. G*Power 3: a flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behav Res Methods. 2007;39(2):175-91. PMID 17695343 · DOI
Cohen J. A power primer. Psychol Bull. 1992;112(1):155-9. PMID 19565683 · DOI
CONSORT 2010 Statement — örneklem büyüklüğü raporlaması (madde 7a). equator-network.org
T.C. Sağlık Bakanlığı (TİTCK). Klinik Araştırmalar Hakkında Yönetmelik. titck.gov.tr

Aslında neyi hesaplıyoruz?

Durum	Neden örneklem hesaplaması gerekli
Etik kurul başvurusu	Gereksiz fazla veya yetersiz katılımcı sorgulanıyor
TÜBİTAK / BAP projesi	Bütçe gerekçesi ve bilimsel geçerlilik için zorunlu
Prospektif klinik çalışma	Veri toplama öncesi planlama şart
Dergi başvurusu	Hakemler güç analizini yöntem bölümünde arıyor

En kritik adım: etki büyüklüğü

Formülleri yazılım hallediyor, α ve güç standart. Asıl zorluk etki büyüklüğünü belirlemek.

Ölçü	Küçük	Orta	Büyük	Kullanım
Cohen's d	0,20	0,50	0,80	İki grup karşılaştırma
Cohen's f	0,10	0,25	0,40	ANOVA
r (korelasyon)	0,10	0,30	0,50	Korelasyon
OR	1,5	2,5	4,0	Lojistik regresyon
HR	1,3	1,7	2,5	Sağkalım

Akademik Not

G*Power ile hesaplama

G*Power, Düsseldorf Üniversitesi'nin geliştirdiği ücretsiz yazılım; 100'den fazla test için güç analizi yapabiliyor. Üç yaygın senaryo:

İki grup t-testi: HbA1c karşılaştırması, Cohen's d = 0,60, α = 0,05, güç = 0,80, çift yönlü → her grupta 45, toplam 90 katılımcı.

Korelasyon: BMI ile inflamasyon belirteci, r = 0,25, α = 0,05, güç = 0,80 → 123 katılımcı.

Ki-kare (2×2): Kontrol %30, tedavi %50 başarı, α = 0,05, güç = 0,80 → toplam 186 katılımcı.

Aynı α ve güç hedefinde, test türü ve etki büyüklüğü örneklemi belirgin biçimde değiştiriyor.

Kayıp oranı düzeltmesi

Hesaplanan örneklem "net" sayıdır; gerçek hayatta kayıp oranını eklememek sık yapılan hatalardan biri.

Formül: n_düzeltilmiş = n_hesaplanan / (1 − kayıp oranı)

Örneğin 90 kişilik hesaplamada %20 kayıp bekleniyorsa: 90 / 0,80 ≈ 113 katılımcı.

Kayıp oranı büyüdükçe düzeltme çarpanı doğrusal değil, hızlanan biçimde artıyor.

Çalışma tipi	Beklenen kayıp	Gerekçe
Kesitsel (tek vizit)	%5-10	Eksik form, veri hatası
3-6 ay takip	%10-20	Takip kaybı, tedavi bırakma
1 yıl kohort	%15-25	Adres değişikliği, motivasyon
2+ yıl RKÇ	%20-35	Mortalite, uyumsuzluk
Çevrimiçi anket	%30-50	Düşük yanıt oranı

Kayıp oranı ve eksik veri yönetimi başlı başına bir konu — kayıp oranının örneklem üzerindeki etkisi yazımızda bunu ayrıntısıyla ele almıştık.

Raporlama: etik kurul ve makale

Raporlamanın özü şu dört soruya net yanıt vermek: "Hangi yazılım, hangi test, hangi parametreler, neden bu etki büyüklüğü?"

Örnek metin:

"Örneklem büyüklüğü G*Power 3.1.9.7 (Faul ve ark., 2007) ile hesaplanmıştır. Bağımsız örneklem t-testi için, 0,05 α düzeyinde %80 güçle 0,60 büyüklüğünde bir etki yakalamak üzere her grupta 45 olmak üzere toplam 90 katılımcı gerektiği belirlenmiştir. %20 kayıp oranı göz önüne alınarak hedef örneklem büyüklüğü 113 olarak planlanmıştır."

CONSORT kontrol listesinin 7a maddesi, RKÇ'lerde örneklem büyüklüğü raporlamasını zorunlu kılıyor; STROBE'da da benzer bir beklenti var.

Sık düşülen tuzaklar

Türkiye'de ne bekleniyor?

Klinik Araştırmalar Hakkında Yönetmelik uyarınca ilaç ve tıbbi cihaz çalışmalarında protokolde güç analizinin yer alması yasal zorunluluk.

Not: Buradaki örnekler ve kayıp aralıkları yol gösterici niteliktedir; kesin örneklem çalışmanın tasarımına, birincil sonuç ölçütüne ve alanın standartlarına göre G*Power veya R gibi araçlarla hesaplanır.

Kullanılan kaynaklar

Faul F, Erdfelder E, Lang AG, Buchner A. G*Power 3: a flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behav Res Methods. 2007;39(2):175-91. PMID 17695343 · DOI
Cohen J. A power primer. Psychol Bull. 1992;112(1):155-9. PMID 19565683 · DOI
CONSORT 2010 Statement — örneklem büyüklüğü raporlaması (madde 7a). equator-network.org
T.C. Sağlık Bakanlığı (TİTCK). Klinik Araştırmalar Hakkında Yönetmelik. titck.gov.tr

Örneklem Büyüklüğü Nasıl Hesaplanır?

Aslında neyi hesaplıyoruz?

En kritik adım: etki büyüklüğü

G*Power ile hesaplama

Kayıp oranı düzeltmesi

Raporlama: etik kurul ve makale

Sık düşülen tuzaklar

Türkiye'de ne bekleniyor?

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Güç Analizi Nedir? Kavram, Parametreler ve Formül

Etki Büyüklüğü Hesaplama: d, OR, NNT ve Ötesi

Kayıp Oranı Örneklemi Nasıl Etkiler?

Araştırmanız İçin Destek Alın

Örneklem Büyüklüğü Nasıl Hesaplanır?

Aslında neyi hesaplıyoruz?

En kritik adım: etki büyüklüğü

G*Power ile hesaplama

Kayıp oranı düzeltmesi

Raporlama: etik kurul ve makale

Sık düşülen tuzaklar

Türkiye'de ne bekleniyor?

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Güç Analizi Nedir? Kavram, Parametreler ve Formül

Etki Büyüklüğü Hesaplama: d, OR, NNT ve Ötesi

Kayıp Oranı Örneklemi Nasıl Etkiler?

Araştırmanız İçin Destek Alın