G*Power'da 'a priori' ve 'post hoc' arasındaki fark nedir?

A priori, çalışma başlamadan 'kaç kişiye ihtiyacım var?' sorusuna cevap veriyor. Post hoc, çalışma bittikten sonra 'ne kadar gücüm vardı?' sorusuna cevap veriyor. Etik ve metodolojik olarak doğru olan a priori kullanmaktır. Post hoc güç analizi ise dolaylı bilgi sunduğu için tartışmalı bir uygulamadır.

Effect size'i nereden bulacağım?

Üç kaynak: 1) Benzer çalışmaların literatür taraması veya meta-analizleri. 2) Pilot çalışma verileri (muhafazakâr yorum şart). 3) Klinik olarak anlamlı minimum fark (MCID). Hiçbiri yoksa, orta etki büyüklüğü (d = 0.5 veya f = 0.25) ile başlamak bir seçenek ama bu tercih gerekçesiyle raporlanmalı.

G*Power 128 kişi dedi, ama 100 kişiyle çalışabiliyorum. Sorun olur mu?

Olur. 100 kişiyle güç %80'in altına düşer. İki seçenek var: ya etki büyüklüğü tahminini revize edin (daha büyük bir fark varsayın, ama dikkatli olun) ya da örneklemi artırmak için çalışma tasarımını gözden geçirin. Yetersiz güçle çalışma yapmak, anlamsız p değerine ve boşuna harcanan kaynaklara yol açabilir.

Allocation ratio ne işe yarıyor?

Eşit olmayan randomizasyon için kullanılıyor. Örneğin ilaç grubu:plasebo = 2:1 ise allocation ratio 2 oluyor. Eşit randomizasyon yapıyorsanız 1 yazın. Eşit olmayan gruplar toplam örneklemi artırıyor ama bazen etik veya pratik nedenlerle gerekli olabiliyor.

ANOVA için neden Cohen's f kullanılıyor, d değil?

Cohen's d iki grup karşılaştırması için tasarlanmış. ANOVA birden fazla grup karşılaştırdığı için varyans temelli bir ölçü olan Cohen's f kullanılıyor. Kabaca f = d/2 denilebilir ama tam bir dönüşüm değil. G*Power, test ailesini seçtiğinizde uygun etki büyüklüğü ölçüsünü otomatik gösteriyor.

Kayıp oranını G*Power'da nasıl hesaplarım?

G*Power'da doğrudan bir alan yok. Elle hesaplıyorsunuz: örneklem = G*Power sonucu / (1 - kayıp oranı). %20 kayıp bekliyorsanız: 128 / 0.80 = 160 kişi. Bu düzeltilmiş sayıyı protokolünüzde rapor edin.

Çalışma bitti, p anlamsız çıktı. Post hoc güç analizi yapayım mı?

Genelde önerilmiyor. Post hoc güç analizi p değerinden bağımsız bilgi vermiyor, dolaylı bir ilişkiye dayanıyor. Bunun yerine güven aralıklarını ve etki büyüklüğünü raporlamak daha bilgilendirici. Hakemin özellikle talep ettiğinde yapıp sınırlılığını tartışma bölümünde belirtmek uygun bir yaklaşım.

G*Power ile Güç Analizi ve Örneklem Hesaplama

G*Power, güç analizi için dünyada en yaygın kullanılan ücretsiz yazılım. Ne var ki arayüzü pek sade değil: programı açtığınızda üç açılır menü, bir dizi radyo düğmesi ve "Calculate" butonuyla karşılaşıyorsunuz. Hangi seçeneğin hangi analize karşılık geldiğini bilmeden doğru sonuca ulaşmak zor; yanlış bir seçim, hatalı bir örneklem büyüklüğüne kolayca yol açıyor.

Bu rehber, G*Power'da bir güç analizini adım adım ele alıyor — yalnızca hangi düğmeye basılacağını değil, neden basıldığını da göstererek. Kavramsal çerçeveyi güç analizi nedir yazımızda ayrıntılandırmıştık; burada doğrudan uygulamaya odaklanıyoruz. Yalnızca hızlı bir ön hesaplama isteyenler için web sitemizdeki örneklem hesaplama aracı da t-testlerinde G*Power ile aynı noncentral-t yöntemini kullanarak tarayıcıda anında sonuç veriyor.

G*Power ne işe yarar?

G*Power temelde üç soruya yanıt veriyor:

A priori: "Çalışma öncesinde kaç kişiye ihtiyacım var?" (en sık kullanılan)
Post hoc: "Mevcut örneklemimle ne kadar gücüm var?"
Sensitivity: "Bu örneklemle hangi etki büyüklüğünü yakalayabilirim?"

Kısaca güç analizi, çalışmanın gerçek bir farkı yakalama olasılığını ölçüyor. Yetersiz örneklemle çalışıldığında p değeri anlamsız çıkabiliyor — çünkü farkı gösterecek güç yok. G*Power bu hesaplamayı otomatikleştiriyor; ama doğru seçenekler işaretlenmezse sonuç da yanlış oluyor.

Arayüzü tanımak: üç açılır menü

G*Power açıldığında üç ana seçim alanı karşınıza geliyor.

1. Test family (test ailesi). Yapılacak analizin genel kategorisi: t tests iki grup karşılaştırması (bağımsız veya bağımlı) için, F tests ANOVA/regresyon/ANCOVA için, chi-square tests kategorik veri için, Correlation and regression korelasyon ve regresyon için, Exact ise küçük örneklem ve tam testler için. Çoğu tıbbi araştırmada t tests veya F tests kullanılıyor.

2. Statistical test (istatistik testi). Test ailesine göre değişiyor; örneğin "t tests" seçildiğinde "Means: Difference between two independent means" gibi spesifik testler listeleniyor. Hangi testin uygun olduğundan emin değilseniz istatistik testi seçimi yazımıza bakabilirsiniz.

3. Type of power analysis (güç analizi türü). A priori, post hoc veya sensitivity. Örneklem hesabı için çoğu durumda A priori doğru seçim.

Üç açılır menüde seçim yapılır, parametreler girilir, tek tıkla örneklem hesaplanır.

Örnek 1: bağımsız iki grup karşılaştırması (t-testi)

En sık karşılaşılan senaryo, iki grubu (örneğin ilaç ile plasebo) sürekli bir değişken üzerinden karşılaştırmak. Seçimler şöyle: Test family → t tests, Statistical test → Means: Difference between two independent means (two groups), Type of power analysis → A priori.

Parametrelere gelince:

Tail(s). Çift kuyruklu (two) ya da tek kuyruklu (one). Çoğu durumda çift kuyruklu kullanılıyor; çünkü hipotez "fark var" biçiminde, "ilaç daha iyi" değil. Tek kuyruklu test daha az örneklem ister, ama hipoteziniz gerçekten yönlü değilse tek kuyruklu seçmek hatalı olur.
Effect size d. Cohen's d olarak giriliyor. Genel rehber d = 0,2 küçük, d = 0,5 orta, d = 0,8 büyük etkidir; ancak bu rehber değerleri doğrudan kullanmak yerine literatürden gerçekçi bir tahmin çıkarmak çok daha sağlam. Ayrıntıyı etki büyüklüğü hesaplama yöntemleri yazımızda ele aldık.
alpha err prob. Alfa değeri, genellikle 0,05.
Power (1-beta err prob). Güç değeri, genellikle 0,80; yüksek riskli çalışmalarda 0,90 tercih edilebiliyor.
Allocation ratio N2/N1. Gruplara eşit hasta düşüyorsa 1; 2:1 randomizasyon varsa (tedavi grubu plasebonun iki katı) 2 girilir.

Calculate sonucunda G*Power şunu veriyor:

Effect size d = 0.5
alpha = 0.05
Power = 0.80
Total sample size = 128 (her grupta 64)

Uyarı

Etki büyüklüğünü tahmin ederken aşırı iyimser davranmamak önemli. "Büyük bir fark bekliyorum" demek "az örneklemle idare ederim" anlamına geliyor; ama gerçek etki 0,3 iken siz 0,8 varsaydıysanız çalışma yetersiz güçte kalıyor. Literatürde benzer çalışmalar ne bulduysa o civarda bir değer kullanmak daha güvenli.

Örnek 2: korelasyon analizi

İki sürekli değişken arasındaki ilişkiyi test edeceksiniz — örneğin yaş ile kemik mineral yoğunluğu arasında korelasyon var mı? Seçimler: Test family → Exact, Statistical test → Correlation: Bivariate normal model, Type of power analysis → A priori. Parametreler: Tail(s) → Two, Correlation rho H1 → beklenen katsayı (r = 0,1 zayıf, r = 0,3 orta, r = 0,5 güçlü), alpha → 0,05, Power → 0,80.

Correlation rho H1 = 0.3
alpha = 0.05
Power = 0.80
Total sample size = 84

Yani 84 kişiyle r = 0,3 büyüklüğünde bir korelasyonu %80 güçle saptamak mümkün.

Örnek 3: tek yönlü ANOVA (üç grup)

Üç tedavi grubunu (İlaç A, İlaç B, Plasebo) sürekli bir sonuç değişkeni üzerinden karşılaştırıyorsunuz. Seçimler: Test family → F tests, Statistical test → ANOVA: Fixed effects, omnibus, one-way, Type of power analysis → A priori. Parametrelerde etki büyüklüğü ANOVA için Cohen's f olarak giriliyor (f = 0,1 küçük, f = 0,25 orta, f = 0,4 büyük; Cohen's d'den farklı, kabaca f ≈ d/2 ama birebir dönüşüm değil), alpha 0,05, Power 0,80 ve Number of groups 3.

Effect size f = 0.25
alpha = 0.05
Power = 0.80
Number of groups = 3
Total sample size = 159 (her grupta 53)

Üç örneği bir arada görmek, testin türüne göre örneklemin nasıl değiştiğini netleştiriyor:

Aynı α ve güç düzeyinde, testin türü ve etki ölçütü örneklem büyüklüğünü belirliyor.

Örnek	Test	Etki büyüklüğü	Toplam örneklem
İki grup ortalama	Bağımsız t-testi	d = 0,5	128 (64/grup)
İki değişken ilişkisi	Korelasyon	r = 0,3	84
Üç grup ortalama	Tek yönlü ANOVA	f = 0,25	159 (53/grup)

Sonucu nasıl yorumlamalı?

G*Power'ın verdiği toplam örneklem büyüklüğü bir minimum değer; gerçek hayatta birkaç etken daha hesaba katılmalı. Kayıp oranı bunların başında geliyor: hastaların bir kısmı çalışmayı tamamlamıyor ve G*Power'da bunun için ayrı bir alan yok, düzeltmeyi kendiniz yapıyorsunuz. Formül basit — düzeltilmiş örneklem = G*Power sonucu / (1 − kayıp oranı); örneğin %20 kayıp beklentisiyle 128 / 0,80 = 160 kişi. Birden fazla hipotez test edilecekse alfa düzeyinde düzeltme (Bonferroni gibi) gerekebiliyor ve bu durumda G*Power'a düzeltilmiş alfa girilmeli. Eksik veri, uç değerler ve ölçüm hatası da gücü düşürdüğü için bir miktar marj bırakmak yerinde oluyor.

İpucu

G*Power'dan çıkan sayıyı minimum olarak görün. Örneklemi %10-20 artırarak planlamak, gerçek hayattaki kayıplara karşı güvenli bir tampon sağlıyor. Örneklem büyüklüğü hesaplama yazımızda bu düzeltmeleri ayrıntılı ele aldık.

Sık yapılan hatalar

Etki büyüklüğünü fazla iyimser seçmek. "Büyük bir fark bekliyorum, d = 0,8 yazayım" yaklaşımı riskli; gerçek etki 0,4 çıkarsa çalışma yetersiz güçte kalıyor. Muhafazakâr tahmin her zaman daha güvenli.

Örneklem düşürmek için tek kuyruklu test seçmek. Tek kuyruklu test daha az örneklem istediği için cazip görünüyor; ama hipoteziniz gerçekten yönlü değilse bu seçim hatalı ve savunulamaz — hakemler bunu fark ediyor.

Post hoc analiz yapıp "güç yeterliydi" demek. Çalışma bittikten, p değeri anlamsız çıktıktan sonra yapılan post hoc güç analizi p değerinden bağımsız bir bilgi vermiyor. Bu konuyu p değeri anlamsız çıktığında yazımızda ele aldık.

Pilot veriyi doğrudan kullanmak. Küçük pilot çalışmalarda etki büyüklüğü tahmini geniş bir güven aralığına sahip; pilottan gelen d = 0,9, gerçekte 0,4 olabilir. Pilot veriden etki alıyorsanız muhafazakâr bir düzeltme gerekiyor.

Yanlış test için güç analizi yapmak. Çalışmada lojistik regresyon kullanılacakken t-testi için güç analizi yapmak metodolojik bir tutarsızlık; güç analizi birincil istatistiksel testle uyumlu olmalı.

G*Power yetmediğinde ne yapılır?

G*Power temel testleri kapsamlı biçimde destekliyor; ancak bazı senaryolarda yetersiz kalıyor: karma modeller, adaptif tasarımlar, küme randomize çalışmalar ve non-inferiority tasarımları gibi. Bu durumlarda R (pwr, simr, WebPower paketleriyle ücretsiz ve simülasyon tabanlı esneklik), PASS (ticari, geniş prosedür yelpazesi ve regülatör uyumlu rapor) veya nQuery (adaptif ve Bayesçi tasarımlarda güçlü) öne çıkıyor. Seçenekleri güç analizi yazılım karşılaştırması yazımızda değerlendirdik. Yine de karmaşık bir tasarımınız yoksa çoğu tıbbi araştırma için G*Power fazlasıyla yeterli.

Protokole ve makaleye nasıl yazılır?

G*Power sonucunu etik kurul protokolüne veya makale yöntem bölümüne yazmanın standart bir kalıbı var:

"Örneklem büyüklüğü, bağımsız iki örneklem t-testi için a priori güç analizi ile belirlenmiştir. Referans çalışmada bildirilen d = 0,55 etki büyüklüğü, α = 0,05 anlamlılık düzeyi ve %80 istatistiksel güç hedeflenerek her grupta 53 (toplam 106) katılımcı gerektiği hesaplanmıştır. %15 kayıp oranı göz önüne alınarak toplam örneklem büyüklüğü 125 olarak planlanmıştır (G*Power 3.1.9.7)."

G*Power'da "Protocol of Power Analysis" seçeneğiyle tüm parametreleri metin biçiminde dışa aktarıp doğrudan dosyanıza ekleyebilirsiniz. Etki büyüklüğünün kaynağını (hangi çalışma, hangi değer) belirtmek, hakemlerin en sık sorduğu noktayı baştan karşılıyor.

Model İstatistik olarak güç analizi sürecinde doğru testin seçilmesinden etki büyüklüğü tahminine, G*Power parametrelerinden raporlamaya kadar her aşamada araştırmacıya rehberlik ediyoruz. G*Power ilk bakışta karmaşık görünse de mantığı sade: hangi testi yapacağınızı belirleyin, etki büyüklüğünü gerçekçi biçimde tahmin edin, standart parametreleri girin ve sonucu kayıp payıyla düzeltin.

Not: Buradaki örneklem değerleri iki yönlü test için tipik G*Power çıktılarıdır ve testin tam yapılandırmasına göre bir-iki katılımcı değişebilir. Kesin planlama, çalışmanın kendi tasarımı üzerinden yapılır.

Kullanılan kaynaklar

Faul F, Erdfelder E, Lang AG, Buchner A. G*Power 3: a flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods. 2007;39(2):175-191. · DOI
Faul F, Erdfelder E, Buchner A, Lang AG. Statistical power analyses using G*Power 3.1: tests for correlation and regression analyses. Behavior Research Methods. 2009;41(4):1149-1160. · DOI
Cohen J. Statistical Power Analysis for the Behavioral Sciences. 2. baskı. Hillsdale, NJ: Lawrence Erlbaum; 1988.

G*Power ne işe yarar?

G*Power temelde üç soruya yanıt veriyor:

A priori: "Çalışma öncesinde kaç kişiye ihtiyacım var?" (en sık kullanılan)
Post hoc: "Mevcut örneklemimle ne kadar gücüm var?"
Sensitivity: "Bu örneklemle hangi etki büyüklüğünü yakalayabilirim?"

Arayüzü tanımak: üç açılır menü

G*Power açıldığında üç ana seçim alanı karşınıza geliyor.

3. Type of power analysis (güç analizi türü). A priori, post hoc veya sensitivity. Örneklem hesabı için çoğu durumda A priori doğru seçim.

Üç açılır menüde seçim yapılır, parametreler girilir, tek tıkla örneklem hesaplanır.

Örnek 1: bağımsız iki grup karşılaştırması (t-testi)

Parametrelere gelince:

Tail(s). Çift kuyruklu (two) ya da tek kuyruklu (one). Çoğu durumda çift kuyruklu kullanılıyor; çünkü hipotez "fark var" biçiminde, "ilaç daha iyi" değil. Tek kuyruklu test daha az örneklem ister, ama hipoteziniz gerçekten yönlü değilse tek kuyruklu seçmek hatalı olur.
Effect size d. Cohen's d olarak giriliyor. Genel rehber d = 0,2 küçük, d = 0,5 orta, d = 0,8 büyük etkidir; ancak bu rehber değerleri doğrudan kullanmak yerine literatürden gerçekçi bir tahmin çıkarmak çok daha sağlam. Ayrıntıyı etki büyüklüğü hesaplama yöntemleri yazımızda ele aldık.
alpha err prob. Alfa değeri, genellikle 0,05.
Power (1-beta err prob). Güç değeri, genellikle 0,80; yüksek riskli çalışmalarda 0,90 tercih edilebiliyor.
Allocation ratio N2/N1. Gruplara eşit hasta düşüyorsa 1; 2:1 randomizasyon varsa (tedavi grubu plasebonun iki katı) 2 girilir.

Calculate sonucunda G*Power şunu veriyor:

Effect size d = 0.5
alpha = 0.05
Power = 0.80
Total sample size = 128 (her grupta 64)

Uyarı

Örnek 2: korelasyon analizi

Correlation rho H1 = 0.3
alpha = 0.05
Power = 0.80
Total sample size = 84

Yani 84 kişiyle r = 0,3 büyüklüğünde bir korelasyonu %80 güçle saptamak mümkün.

Örnek 3: tek yönlü ANOVA (üç grup)

Effect size f = 0.25
alpha = 0.05
Power = 0.80
Number of groups = 3
Total sample size = 159 (her grupta 53)

Üç örneği bir arada görmek, testin türüne göre örneklemin nasıl değiştiğini netleştiriyor:

Aynı α ve güç düzeyinde, testin türü ve etki ölçütü örneklem büyüklüğünü belirliyor.

Örnek	Test	Etki büyüklüğü	Toplam örneklem
İki grup ortalama	Bağımsız t-testi	d = 0,5	128 (64/grup)
İki değişken ilişkisi	Korelasyon	r = 0,3	84
Üç grup ortalama	Tek yönlü ANOVA	f = 0,25	159 (53/grup)

Not: Buradaki örneklem değerleri iki yönlü test için tipik G*Power çıktılarıdır ve testin tam yapılandırmasına göre bir-iki katılımcı değişebilir. Kesin planlama, çalışmanın kendi tasarımı üzerinden yapılır.

Kullanılan kaynaklar

Faul F, Erdfelder E, Lang AG, Buchner A. G*Power 3: a flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods. 2007;39(2):175-191. · DOI
Faul F, Erdfelder E, Buchner A, Lang AG. Statistical power analyses using G*Power 3.1: tests for correlation and regression analyses. Behavior Research Methods. 2009;41(4):1149-1160. · DOI
Cohen J. Statistical Power Analysis for the Behavioral Sciences. 2. baskı. Hillsdale, NJ: Lawrence Erlbaum; 1988.

G*Power ile Güç Analizi: Adım Adım Pratik Rehber

G*Power ne işe yarar?

Arayüzü tanımak: üç açılır menü

Örnek 1: bağımsız iki grup karşılaştırması (t-testi)

Örnek 2: korelasyon analizi

Örnek 3: tek yönlü ANOVA (üç grup)

Sonucu nasıl yorumlamalı?

Sık yapılan hatalar

G*Power yetmediğinde ne yapılır?

Protokole ve makaleye nasıl yazılır?

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Güç Analizi Nedir? Kavram, Parametreler ve Formül

Örneklem Büyüklüğü Nasıl Hesaplanır?

Güç Analizi Yazılımları: G*Power, PASS, R Karşılaştırması

Araştırmanız İçin Destek Alın

G*Power ile Güç Analizi: Adım Adım Pratik Rehber

G*Power ne işe yarar?

Arayüzü tanımak: üç açılır menü

Örnek 1: bağımsız iki grup karşılaştırması (t-testi)

Örnek 2: korelasyon analizi

Örnek 3: tek yönlü ANOVA (üç grup)

Sonucu nasıl yorumlamalı?

Sık yapılan hatalar

G*Power yetmediğinde ne yapılır?

Protokole ve makaleye nasıl yazılır?

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Güç Analizi Nedir? Kavram, Parametreler ve Formül

Örneklem Büyüklüğü Nasıl Hesaplanır?

Güç Analizi Yazılımları: G*Power, PASS, R Karşılaştırması

Araştırmanız İçin Destek Alın