Bir klinik çalışmada yeni bir antihipertansif ilacı test ediyorsunuz. 30 hastaya verdiniz, 30 hastaya plasebo. Sonuç: p = 0.08. Anlamsız. Danışmanınız soruyor: "Bu ilaç gerçekten işe yaramadı mı, yoksa yeterli hasta mı almadın?"
Bu soru, istatistikte en temel sorulardan biri. Ve güç analizi, tam da bu soruya cevap veren kavramsal çerçeve.
Bu yazı güç analizinin ne olduğunu, nasıl çalıştığını ve hangi parametrelere dayandığını açıklıyor. Güç analizinin neden zorunlu olduğunu ve etik kurul bağlamını merak ediyorsanız, güç analizi neden gerekli yazımız o konuya odaklanıyor.
Güç Analizi: Temel Tanım
Güç analizi, bir araştırmanın gerçek bir etkiyi veya farkı istatistiksel olarak tespit edebilme olasılığını belirleyen matematiksel bir hesaplamadır.
Daha somut bir ifadeyle: eğer gerçekten bir fark varsa, araştırmanızın bu farkı yakalama şansı nedir?
Bu şans yüzde 50 ise, yazı-tura atmakla aynı işi yapıyorsunuz. Yüzde 80 ise, makul bir güvenle sonuç elde edebilirsiniz. Yüzde 95 ise, çok güçlü bir çalışma tasarlamış olursunuz ama bunun için çok daha büyük örneklem gerekir.
Güç analizi dört parametre arasındaki matematiksel ilişkiye dayanıyor. Bu dört parametreden üçünü bildiğinizde, dördüncüyü hesaplayabiliyorsunuz. En yaygın kullanım: ilk üçü belirleyip örneklem büyüklüğünü hesaplamak.
Dört Temel Parametre
| Parametre | Sembol | Tanım | Yaygın Değer |
|---|---|---|---|
| Anlamlılık düzeyi | alpha | Tip I hata olasılığı | 0.05 |
| İstatistiksel güç | 1 - beta | Gerçek bir etkiyi doğru tespit etme olasılığı | 0.80 veya 0.90 |
| Etki büyüklüğü | d, r, f, OR | Gruplar arasındaki farkın büyüklüğü | Çalışmaya özgü |
| Örneklem büyüklüğü | n | Katılımcı sayısı | Hesaplanan değer |
Bu dört parametre birbirine bağlı. Birini değiştirdiğinizde diğer üçünden en az biri etkileniyor. Bu bağlantı güç analizinin temelidir.
Anlamlılık Düzeyi (alpha)
Alfa, yanlış pozitif sonuç elde etme olasılığını temsil ediyor. Başka bir deyişle, gerçekte fark yokken fark bulduğunu sanma riski.
Tıbbi araştırmalarda gelenek olarak alpha = 0.05 kullanılıyor. Bu, %5 yanlış pozitif riskini kabul ettiğimiz anlamına geliyor. Neden 0.05? Tarihsel bir uzlaşma. Bazen 0.01 kullanılıyor (daha tutucu), bazen 0.10 (daha keşfedici). Ama standart 0.05.
Önemli bir detay: çoklu karşılaştırma yapıldığında (örneğin 10 test birden), alfa düzeyinde düzeltme gerekiyor. Bonferroni düzeltmesi en bilinen yöntem: 10 test için alfa = 0.05/10 = 0.005. Aksi halde şans eseri anlamlı sonuç bulma olasılığınız artıyor.
İstatistiksel Güç (1 - beta)
Güç, araştırmanızın gerçek bir etkiyi yakalama olasılığı. Formül olarak:
Güç = 1 - beta
Beta, Tip II hata oranını temsil ediyor. Yani gerçekte var olan bir farkı kaçırma olasılığı.
Standart eşik %80, yani beta = 0.20. Bu ne demek? "Gerçekte bir fark varsa, 100 çalışmadan 80'inde bunu yakalayacağım, 20'sinde kaçırma riskim var."
Klinik önemi yüksek çalışmalarda %90 güç hedefleniyor. Örneğin faz III ilaç çalışmaları veya cerrahi girişim araştırmaları. Ama %90 güç, önemli ölçüde daha büyük örneklem gerektiriyor.
Etki Büyüklüğü (Effect Size)
Etki büyüklüğü, gruplar arasındaki farkın veya değişkenler arasındaki ilişkinin pratikte ne kadar anlamlı olduğunu gösteren standartlaştırılmış bir ölçü. Güç analizinin en kritik ve en zor belirlenen parametresi.
Neden zor? Çünkü çalışma henüz yapılmadan önce "ne kadar bir fark bekliyorsunuz?" sorusuna cevap vermeniz gerekiyor.
Etki büyüklüğü değerleri kullanılan teste göre değişiyor:
| Test Türü | Etki Büyüklüğü Ölçüsü | Küçük | Orta | Büyük |
|---|---|---|---|---|
| t-testi | Cohen's d | 0.20 | 0.50 | 0.80 |
| ANOVA | Cohen's f | 0.10 | 0.25 | 0.40 |
| Korelasyon | Pearson r | 0.10 | 0.30 | 0.50 |
| Ki-kare | Cohen's w | 0.10 | 0.30 | 0.50 |
| Lojistik regresyon | Odds Ratio | 1.5 | 2.5 | 4.0 |
Cohen'in küçük-orta-büyük sınıflandırması bir rehber ama son çare olarak kullanılmalı. Doğru yaklaşım: önce literatürden (meta-analiz veya benzer çalışmalar), sonra pilot çalışma verilerinden, en son klinik olarak anlamlı minimum farktan (MCID) yola çıkmak.
Etki büyüklüğü hesaplama yöntemleri yazımızda Cohen's d, Hedges' g, odds ratio, NNT ve diğer ölçüleri detaylı ele aldık.
Örneklem Büyüklüğü (n)
Örneklem büyüklüğü, güç analizinin çoğu zaman asıl çıktısı. Diğer üç parametre belirlendikten sonra gereken minimum katılımcı sayısı hesaplanıyor.
Ama bu "minimum" sayının üzerine kayıp oranı eklenmesi şart. Prospektif çalışmalarda takip kaybı, eksik veri, protokol ihlali gibi nedenlerle katılımcı kaybı yaşanıyor.
Düzeltme formülü basit: N_düzeltilmiş = N_hesaplanan / (1 - kayıp oranı). %15 kayıp bekliyorsanız ve güç analizi 64 katılımcı öneriyorsa: 64 / 0.85 = 76 katılımcı.
Örneklem büyüklüğü hesaplama yazımızda bu hesaplamaların pratiğini adım adım anlattık.
Tip I ve Tip II Hata: Kavramsal Temel
Güç analizini tam kavramak için Tip I ve Tip II hataların ne anlama geldiğini net biçimde anlamak gerekiyor. Bu iki hata türü, istatistiksel karar verme sürecinin kaçınılmaz riskleri.
| H0 Gerçekte Doğru (Fark Yok) | H0 Gerçekte Yanlış (Fark Var) | |
|---|---|---|
| H0 Reddedildi (Fark bulundu) | Tip I Hata (alpha) | Doğru karar (Güç = 1 - beta) |
| H0 Reddedilemedi (Fark bulunamadı) | Doğru karar | Tip II Hata (beta) |
Tip I hata: Gerçekte fark yokken fark varmış gibi sonuç elde etme. Bir ilacın etkisiz olduğu halde etkili göründüğü durum. Alpha = 0.05 demek, bu riski %5'e sınırlandırıyoruz demek.
Tip II hata: Gerçekte fark varken bunu tespit edememe. Etkili bir ilacın etkisiz göründüğü durum. Beta = 0.20 (güç = 0.80) demek, %20 kaçırma riskimiz var demek.
Tıbbi araştırmalarda her iki hatanın da ciddi sonuçları var. Tip I hata, etkisiz bir tedavinin etkili sanılmasına yol açabiliyor. Tip II hata ise etkili bir tedavinin gözden kaçırılmasına neden olabiliyor.
Akademik Not
Bir araştırmanın "istatistiksel olarak anlamsız" sonuç vermesi, gerçekte fark olmadığı anlamına gelmiyor. Yetersiz örneklemle yürütülen çalışmalarda Tip II hata riski yüksektir: fark aslında olabilir ama çalışmanız onu tespit edecek güçte değildir. Bu nedenle "anlamsız" sonuçları yorumlarken güven aralıklarına ve etki büyüklüğüne bakmak kritik öneme sahip. p değeri anlamsız çıktığında yazımızda bu durumu detaylı ele aldık.
Güç Analizi Türleri
Güç analizi dört farklı modda çalışabiliyor. Hangisini ne zaman kullanacağınız, araştırma sürecinin hangi aşamasında olduğunuza bağlıyor.
A priori: Veri toplama öncesinde örneklem büyüklüğü hesaplamak için. Altın standart. Etik kurul ve hakemler bunu görüyor.
Post hoc: Çalışma tamamlandıktan sonra gerçekleşen gücü hesaplamak için. Ama önemli bir uyarı: post hoc güç analizi p değeriyle doğrudan ilişkili olduğu için bazı istatistikçiler tarafından totolojik (döngüsel) bir hesaplama olarak eleştiriliyor.
Sensitivity: Örneklem büyüklüğünüz sabit olduğunda (örneğin retrospektif çalışma) tespit edilebilir minimum etki büyüklüğünü hesaplamak için. Retrospektif çalışmalarda a priori güç analizi mümkün olmadığından, sensitivity analizi en uygun yaklaşım.
Criterion: Güç ve örneklem büyüklüğü bilindikten sonra optimal alfa düzeyini hesaplamak için. Keşfedici araştırmalarda kullanılıyor.
Somut Örnekler
Örnek 1: Bağımsız iki grup t-testi. Yeni bir ilacın kan basıncına etkisini test edeceksiniz. Literatürde benzer çalışmalar Cohen's d = 0.5 civarında etki büyüklüğü raporlamış. Alpha = 0.05, güç = 0.80 ile hesapladığınızda: her grupta 64, toplam 128 katılımcı gerekiyor. %15 kayıp ekleniyor: 128 / 0.85 = 151 katılımcı.
Örnek 2: Korelasyon analizi. Yaş ile kemik mineral yoğunluğu arasındaki ilişkiyi araştırıyorsunuz. Beklenen korelasyon r = 0.3. Alpha = 0.05, güç = 0.80 ile: toplam 84 kişi gerekiyor.
Örnek 3: Üç grubun karşılaştırılması (ANOVA). İlaç A, İlaç B ve plasebo. Cohen's f = 0.25 (orta etki). Alpha = 0.05, güç = 0.80, 3 grup: toplam 159 kişi (her grupta 53).
Bu örnekler G*Power ile hesaplanıyor. G*Power adım adım rehberimizde her örneği ekran ekran gösterdik.
Etik Kurul ve Dergi Raporlaması
Güç analizi hem etik kurul protokolünde hem de makale yöntem bölümünde raporlanıyor. Raporlarken şu bilgiler mutlaka yer almalı:
- Kullanılan istatistiksel test
- Etki büyüklüğü değeri ve kaynağı (referans veya pilot çalışma)
- Anlamlılık düzeyi (alfa)
- Hedeflenen güç
- Hesaplanan örneklem büyüklüğü
- Kayıp oranı ve düzeltilmiş örneklem
- Kullanılan yazılım ve versiyonu
Örnek raporlama cümlesi: "Birincil sonuç ölçütümüz olan HbA1c düzeyindeki farkı değerlendirmek üzere bağımsız örneklem t-testi için a priori güç analizi yapılmıştır. Smith ve ark. (2022) tarafından bildirilen 0.65 standart sapma birimlik etki büyüklüğü (Cohen's d), iki yönlü alpha = 0.05 anlamlılık düzeyi ve %80 güç hedefi esas alındığında, her grup için minimum 38 katılımcı gerektiği hesaplanmıştır (G*Power 3.1.9.7). %15 kayıp oranı göz önüne alınarak toplam 90 katılımcı hedeflenmiştir."
Bu format, hem etik kurul üyelerinin hem de hakemlerin örneklem büyüklüğünün bilimsel temelini kolayca değerlendirmesini sağlıyor.
Pratik Öneriler
Etki büyüklüğü tahmini için sistematik olun. Önce meta-analizlere bakın. Yoksa benzer çalışmaların etki büyüklüklerini derleyin. Pilot çalışma yapma imkânınız varsa onu kullanın. Cohen sınıflandırmasını ancak hiçbir kaynak yoksa, gerekçelendirerek kullanın.
Birincil sonuç ölçütüne odaklanın. Güç analizi birincil sonuç ölçütü üzerinden yapılıyor. İkincil sonuçlar için ayrı güç analizi zorunlu değil ama çalışmanın bu sonuçlar için yeterli güçte olmayabileceği belirtilmeli.
Sensitivity analizi ekleyin. Etki büyüklüğü tahmininizin belirsiz olduğu durumlarda, farklı etki büyüklükleri için gereken örneklem büyüklüklerini bir tablo olarak sunmak hakemlerin güvenini artırıyor.
Biyoistatistikçi ile erken aşamada çalışın. Güç analizi sadece bir yazılıma parametre girmekten ibaret değil. Doğru testin seçilmesi, etki büyüklüğünün anlamlı biçimde tahmin edilmesi ve sonuçların yorumlanması uzmanlık gerektiriyor.
Model İstatistik olarak güç analizi sürecinde araştırmacılara rehberlik sağlıyoruz. Etki büyüklüğü tahmininden yazılım seçimine, hesaplamadan raporlamaya kadar tüm aşamaları birlikte yürütüyoruz.