G*Power'ı indirdiniz. Açtınız. Karşınızda üç tane dropdown menü, bir sürü radyo butonu ve "Calculate" yazan yeşil bir buton var. Hangisine basacaksınız?
Test family'den "t tests" mi seçeceksiniz, "F tests" mi? A priori mi, post hoc mu? Effect size'a ne yazacaksınız? Bir tıklayınca bir şey çıkıyor, tekrar tıklayınca başka bir şey. Ekranda bir sayı beliriyor ama o sayının ne anlama geldiğinden emin değilsiniz.
G*Power dünyanın en yaygın kullanılan ücretsiz güç analizi yazılımı. Ama arayüzü 2005'ten kalma ve kullanıcı dostu değil. Ne yaptığınızı bilmiyorsanız, yanlış hesaplama yapmanız bir saniye.
Bu rehberde G*Power'da güç analizi yaparken her adımı göstereceğiz. Sadece butonlara nereden basılacağını değil, neden basılacağını da.
G*Power Ne İşe Yarar?
G*Power, üç temel soruya cevap veriyor:
- A priori: "Çalışma öncesi kaç kişiye ihtiyacım var?" (en sık kullanılan)
- Post hoc: "Mevcut örneklemimle ne kadar gücüm var?"
- Sensitivity: "Bu örneklemle hangi etki büyüklüğünü yakalayabilirim?"
Güç analizi nedir yazımızda kavramsal çerçeveyi ayrıntılı ele almıştık. Kısaca: güç analizi, çalışmanızın gerçek bir farkı yakalama olasılığını ölçer. Yetersiz örneklemle çalışırsanız, p değeriniz anlamsız çıkar — çünkü farkı gösterecek gücünüz yoktur.
G*Power bu hesaplamayı otomatikleştiriyor. Ama doğru seçenekleri seçmezseniz, yanlış sonuç alırsınız.
Arayüzü Tanımak: Üç Dropdown
G*Power'ı açtığınızda üç ana seçim alanı karşılıyor:
1. Test family (Test ailesi). Yapacağınız analizin genel kategorisi:
- t tests: İki grup karşılaştırma (bağımsız veya bağımlı)
- F tests: ANOVA, regresyon, ANCOVA
- chi-kare tests: Kategorik veri, ki-kare testleri
- Exact: Küçük örneklem, tam testler
- Correlation and regression: Korelasyon, regresyon
Çoğu tıbbi araştırmada t tests veya F tests kullanılıyor.
2. Statistical test (İstatistik testi). Test ailesine göre değişiyor. Örneğin "t tests" seçtiyseniz "Means: Difference between two independent means" gibi spesifik testler listeleniyor.
Hangi testi kullanacağınızı bilmiyorsanız, istatistik testi seçimi yazımıza bakabilirsiniz.
3. Type of power analysis (Güç analizi türü). A priori, post hoc veya sensitivity.
Örnek 1: Bağımsız İki Grup Karşılaştırması (t-testi)
En sık karşılaşılan senaryo: iki grubu (örneğin ilaç vs. plasebo) sürekli bir değişken üzerinden karşılaştırmak. Kaç hastaya ihtiyacınız var?
Test family: t tests
Statistical test: Means: Difference between two independent means (two groups)
Type of power analysis: A priori: Compute required sample size
Şimdi parametrelere geçelim:
Tail(s). Çift kuyruklu (two) veya tek kuyruklu (one). Çoğu durumda two-tailed kullanılıyor çünkü hipotez "fark var" şeklinde, "ilaç daha iyi" değil. Tek kuyruklu test daha az örneklem ister ama hipoteziniz gerçekten yönlü değilse, tek kuyruklu seçmek hatalıdır.
Effect size d. Cohen's d olarak ifade ediliyor. Genel rehber: d = 0.2 küçük, d = 0.5 orta, d = 0.8 büyük etki. Ama bu rehber değerlerini doğrudan kullanmak yerine literatürden gerçekçi bir tahmin çıkarmak çok daha sağlam bir yaklaşım. Etki büyüklüğü hesaplama yöntemleri yazımızda bu konuyu ayrıntılı ele aldık.
alpha err prob. Alfa değeri, genelde 0.05.
Power (1-beta err prob). Güç değeri, genelde 0.80. Yüksek riskli çalışmalarda 0.90 tercih edilebilir.
Allocation ratio N2/N1. Gruplara eşit hasta dağılıyorsa 1. Eğer 2:1 randomizasyon varsa (örneğin tedavi grubu plasebonun iki katı) 2 yazın.
Calculate'e basın. Sonuç:
Effect size d = 0.5
alpha = 0.05
Power = 0.80
Total sample size = 128 (her grupta 64)
Uyarı
Effect size'i tahmin ederken iyimser olmamak kritik. "Büyük bir fark bekliyorum" demek "az örneklemle idare ederim" anlamına geliyor. Ama gerçek etki 0.3 ise ve siz 0.8 varsaymışsanız, çalışmanız yetersiz güçte kalır. Literatürde benzer çalışmalar ne bulduysa, o civarda bir değer kullanmak daha güvenli.
Örnek 2: Korelasyon Analizi
İki sürekli değişken arasındaki ilişkiyi test edeceksiniz. Örnek: yaş ile kemik mineral yoğunluğu arasında korelasyon var mı?
Test family: Exact
Statistical test: Correlation: Bivariate normal model
Type of power analysis: A priori
Parametreler:
- Tail(s): Two
- Correlation rho H1: Beklediğiniz korelasyon katsayısı. r = 0.1 zayıf, r = 0.3 orta, r = 0.5 güçlü.
- alpha err prob: 0.05
- Power: 0.80
Sonuç:
Correlation rho H1 = 0.3
alpha = 0.05
Power = 0.80
Total sample size = 84
84 kişiyle r = 0.3 büyüklüğünde bir korelasyonu %80 güçle tespit etmek mümkün.
Örnek 3: Tek Yönlü ANOVA (3+ Grup)
Üç tedavi grubunu karşılaştırıyorsunuz: İlaç A, İlaç B, Plasebo. Sonuç değişkeni sürekli.
Test family: F tests
Statistical test: ANOVA: Fixed effects, omnibus, one-way
Type of power analysis: A priori
Parametreler:
- Effect size f: ANOVA için Cohen's f kullanılıyor. f = 0.1 küçük, f = 0.25 orta, f = 0.4 büyük. Cohen's d'den farklı; kabaca f ~ d/2 ama tam dönüşüm değil.
- alpha err prob: 0.05
- Power: 0.80
- Number of groups: 3
Sonuç:
Effect size f = 0.25
alpha = 0.05
Power = 0.80
Number of groups = 3
Total sample size = 159 (her grupta 53)
Sonucu Nasıl Yorumlamalı?
G*Power bir sayı veriyor: toplam örneklem büyüklüğü. Ama bu sayı "minimum" sayı. Gerçek hayatta birkaç şey daha hesaba katılmalı:
Kayıp oranı (dropout). Hastaların bir kısmı çalışmayı tamamlamıyor. G*Power'da bunun için ayrı bir alan yok, kendiniz hesaplıyorsunuz. Formül basit: düzeltilmiş örneklem = G*Power sonucu / (1 - kayıp oranı). Örneğin %20 kayıp bekliyorsanız: 128 / 0.80 = 160 kişi.
Çoklu karşılaştırma. Birden fazla hipotez test edecekseniz, alfa düzeyinde düzeltme gerekebilir (Bonferroni gibi). Bu durumda G*Power'a düzeltilmiş alfa değerini girmeniz gerekiyor.
Veri kalitesi. Eksik veri, uç değerler, ölçüm hatası — bunların hepsi gücü düşürür. G*Power bunu hesaba katmıyor, siz kendiniz marj bırakıyorsunuz.
İpucu
G*Power'dan çıkan sayıyı minimum kabul edin. Örnekleminizi %10-20 artırarak planlamak, gerçek hayattaki kayıplara karşı güvenli bir tampon oluşturuyor. Örneklem büyüklüğü hesaplama yazımızda bu düzeltmeleri detaylı ele aldık.
Sık Yapılan Hatalar
Effect size'i çok iyimser seçmek. "Büyük bir fark bekliyorum, d = 0.8 yazayım." Gerçek etki 0.4 çıkarsa, çalışmanız yetersiz güçte kalır. Muhafazakâr tahmin etmek her zaman daha güvenli.
Tek kuyruklu test seçmek (örneklem düşürme amacıyla). Tek kuyruklu test daha az örneklem istiyor, bu cazibeli. Ama hipoteziniz gerçekten yönlü değilse, tek kuyruklu test kullanmak hatalı ve etik dışıdır. Hakemler bu numarayı fark eder.
Post hoc analiz yapıp "güç yeterli" demek. Çalışma bitti, p değeri anlamsız çıktı, sonra post hoc güç analizi yaptınız ve "güç düşüktü, ondan anlamsız çıktı" dediniz. Bu yanlış. Post hoc güç analizi p değerinden bağımsız bilgi vermiyor. Bu konuyu p değeri anlamsız çıktığında yazımızda detaylı ele aldık.
Pilot çalışma verisini doğrudan kullanmak. Pilot çalışmalar küçük örneklemli, dolayısıyla etki büyüklüğü tahmini geniş güven aralığına sahip. Pilottan elde ettiğiniz d = 0.9 değeri, gerçekte 0.4 olabilir. Pilot veriden etki büyüklüğü alıyorsanız, muhafazakâr bir düzeltme yapmak gerekiyor.
Yanlış test için güç analizi yapmak. Çalışmada lojistik regresyon kullanılacakken t-testi için güç analizi yapmak ciddi bir metodolojik tutarsızlık. Güç analizi, birincil istatistiksel testle uyumlu olmalı.
G*Power Yetmediğinde Ne Yapılır?
G*Power temel testleri kapsamlı biçimde destekliyor. Ama bazı senaryolarda yetersiz kalıyor: karma modeller, adaptif tasarımlar, cluster randomize çalışmalar, non-inferiority tasarımları.
Bu durumlarda alternatifler:
- R (pwr, simr, WebPower paketleri): Ücretsiz, simülasyon tabanlı güç analizi yapabilme esnekliği var.
- PASS: Ticari, 1100+ prosedür destekliyor, FDA/EMA uyumlu rapor üretiyor.
- nQuery: Özellikle adaptif tasarımlar ve Bayesian güç analizi için güçlü.
Güç analizi yazılım karşılaştırma yazımızda bu seçenekleri detaylı değerlendirdik.
Ama çoğu tıbbi araştırma için G*Power fazlasıyla yeterli. Karmaşık bir tasarımınız yoksa, ekstra yazılıma ihtiyacınız yok.
Protokole ve Makaleye Nasıl Yazılır?
G*Power sonucunu etik kurul protokolüne veya makale yöntem bölümüne yazmak için standart bir format var:
"Örneklem büyüklüğü, bağımsız iki örneklem t-testi için a priori güç analizi ile hesaplanmıştır. Smith ve ark. (2022) tarafından bildirilen d = 0.55 etki büyüklüğü, alfa = 0.05 anlamlılık düzeyi ve %80 istatistiksel güç hedeflenerek her grupta minimum 53 katılımcı gerektiği belirlenmiştir. %15 kayıp oranı göz önüne alınarak toplam örneklem büyüklüğü 124 olarak planlanmıştır (G*Power 3.1.9.7)."
G*Power'da "Protocol of Power Analysis" butonuna tıklayarak tüm parametreleri metin formatında dışa aktarabilirsiniz. Bu çıktıyı doğrudan dosyanıza eklemek mümkün.
Model İstatistik olarak güç analizi sürecinde araştırmacılara rehberlik sağlıyoruz. Doğru testin seçilmesinden etki büyüklüğü tahminine, G*Power parametrelerinden raporlamaya kadar tüm aşamaları birlikte yürütüyoruz.
G*Power karmaşık görünüyor ama mantığı basit: ne testi yapacağınızı belirleyin, etki büyüklüğünü tahmin edin, standart parametreleri girin, Calculate'e basın. Bir kez alıştığınızda her hesaplama 30 saniye sürüyor.