Güç analizi için hangi yazılımı kullanmalıyım?

Temel testler (t-testi, ANOVA, korelasyon, ki-kare) için G*Power ücretsiz ve yeterli. Klinik araştırma protokollerinde PASS tercih ediliyor. Karmaşık tasarımlar (karma modeller, adaptif tasarımlar) için R simülasyonu en esnek seçenek. Yazılım seçiminde araştırma tasarımınızın karmaşıklığı belirleyici olmalı.

Retrospektif çalışmada güç analizi nasıl yapılır?

Retrospektif çalışmalarda örneklem büyüklüğü zaten belli olduğu için a priori güç analizi mümkün değil. Bunun yerine sensitivity analizi yapılıyor: mevcut örneklemle tespit edilebilecek minimum etki büyüklüğü hesaplanıyor. Etik kurul dosyasında 'mevcut hasta kayıtlarının sensitivity analizi ile değerlendirildiğini' belirtmek uygun.

Güç analizi ile örneklem büyüklüğü hesaplaması aynı şey mi?

Tam olarak değil. Güç analizi dört parametre arasındaki ilişkiyi inceleyen genel bir çerçeve. Örneklem büyüklüğü hesaplaması ise güç analizinin en yaygın uygulaması: diğer üç parametreyi bilip örneklem büyüklüğünü hesaplamak (a priori). Ama güç analizi, sensitivity veya post hoc hesaplama da içerebiliyor.

Post hoc güç analizi yapılmalı mı?

Tartışmalı bir konu. Gözlenen etki büyüklüğü ve p değeri arasındaki matematiksel ilişki nedeniyle, anlamsız p değeri olan bir çalışmanın post hoc gücü zaten düşük çıkıyor. Birçok istatistikçi bunun döngüsel bir argüman olduğunu savunuyor. Güven aralıkları ve etki büyüklüğü raporlaması daha bilgilendirici alternatifler. Hakemin özellikle talep ettiği durumlarda yapılıp sınırlıklar belirtilmeli.

Küçük örneklemle çalışmak zorunda kalırsam ne yapabilirim?

Nadir hastalıklar veya özel popülasyonlarda büyük örnekleme ulaşmak her zaman mümkün değil. Bu durumda sensitivity analizi ile çalışmanızın tespit edebileceği minimum etki büyüklüğünü raporlayın. Tekrarlanan ölçümler tasarımı kullanarak gücü artırabilir, homojen örneklem seçerek varyansı azaltabilir veya alfa düzeyini gevşeterek keşfedici bir çerçeve benimseyebilirsiniz.

Etik kurul güç analizi eksik diye dosyamı iade ederse ne yapmalıyım?

Birincil sonuç ölçütünüzü ve kullanılacak testi netleştirin. Literatürden uygun bir etki büyüklüğü belirleyin. G*Power veya benzeri bir yazılımla a priori güç analizi yapın. Hesaplama detaylarını (yazılım, versiyon, tüm parametreler, kaynak) protokolünüze ekleyin. Bu süreçte destek almak isterseniz, güç analizi hizmetimizden yararlanabilirsiniz.

Çoklu sonuç ölçütü olan çalışmalarda güç analizi nasıl yapılır?

Üç yaklaşım var: 1) Her sonuç ölçütü için ayrı güç analizi yapıp en büyük örneklemi kabul etmek. 2) Bonferroni düzeltmesi ile alfa düzeyini ayarlayıp (örneğin 3 ölçüt için alfa = 0.017) güç analizi yapmak. 3) Birincil sonuç ölçütünü tek bir ölçütle sınırlamak, diğerlerini ikincil olarak değerlendirmek. Üçüncü yaklaşım en temiz ve en çok tercih edilen yöntem.

Güç Analizi Nedir? Dört Parametre ve Hata Türleri

Bir çalışma "anlamlı bir fark bulunamadı" dediğinde iki olasılık var: ya gerçekten fark yoktur, ya da fark vardır ama çalışma onu görecek kadar güçlü değildir. Bu ikisini ayırmanın yolu güç analizinden geçiyor — bir araştırmanın, var olan gerçek bir etkiyi istatistiksel olarak yakalayabilme olasılığını önceden hesaplayan çerçeve.

Bu yazı güç analizinin ne olduğunu, hangi dört parametreye dayandığını ve bunların birbirini nasıl belirlediğini açıklıyor. Güç analizinin neden zorunlu olduğunu ve etik kurul bağlamını ise güç analizi neden gerekli yazımız ele alıyor.

Güç analizi tam olarak neyi ölçüyor?

Güç analizi, bir araştırmanın gerçek bir etkiyi veya farkı istatistiksel olarak tespit edebilme olasılığını belirleyen matematiksel bir hesaplama. Daha somut bir ifadeyle: eğer gerçekten bir fark varsa, araştırmanın bu farkı yakalama şansı nedir?

Bu şans %50 ise, yazı-tura atmakla aynı işi yapıyorsunuz demektir. %80 ise makul bir güvenle sonuç elde ediliyor. %95 ise çok güçlü bir çalışma tasarlanmış olur ama bunun için çok daha büyük örneklem gerekiyor.

Güç analizi dört parametre arasındaki matematiksel ilişkiye dayanıyor. Bu dört parametreden üçü bilindiğinde dördüncüsü hesaplanabiliyor. En yaygın kullanım: ilk üçünü belirleyip örneklem büyüklüğünü hesaplamak.

Dört parametre birbirini nasıl belirliyor?

Parametre	Sembol	Tanım	Yaygın değer
Anlamlılık düzeyi	α	Tip I hata olasılığı	0,05
İstatistiksel güç	1 − β	Gerçek bir etkiyi doğru tespit etme olasılığı	0,80 veya 0,90
Etki büyüklüğü	d, r, f, OR	Gruplar arasındaki farkın büyüklüğü	Çalışmaya özgü
Örneklem büyüklüğü	n	Katılımcı sayısı	Hesaplanan değer

Üç parametre sabitlendiğinde dördüncüsü belirleniyor; hedefleri sıkılaştırmak gereken n'yi büyütüyor.

Bu dört parametre birbirine bağlı; birini değiştirdiğinizde diğer üçünden en az biri etkileniyor. Bu bağlantı güç analizinin temeli.

Anlamlılık düzeyi (α)

α, yanlış pozitif sonuç elde etme olasılığını temsil ediyor — yani gerçekte fark yokken fark bulunduğunu sanma riski. Tıbbi araştırmalarda gelenek olarak α = 0,05 kullanılıyor; bu, %5 yanlış pozitif riskinin kabul edildiği anlamına geliyor. Neden 0,05? Tarihsel bir uzlaşma. Bazen 0,01 (daha tutucu), bazen 0,10 (daha keşfedici) kullanılıyor ama standart 0,05.

Önemli bir ayrıntı: çoklu karşılaştırma yapıldığında (örneğin 10 test birden) α düzeyinde düzeltme gerekiyor. Bonferroni düzeltmesi en bilinen yöntem: 10 test için α = 0,05/10 = 0,005. Aksi hâlde şans eseri anlamlı sonuç bulma olasılığı artıyor.

İstatistiksel güç (1 − β)

Güç, araştırmanın gerçek bir etkiyi yakalama olasılığı ve Güç = 1 − β ile ifade ediliyor. β, Tip II hata oranını, yani gerçekte var olan bir farkı kaçırma olasılığını temsil ediyor.

Standart eşik %80, yani β = 0,20. Bu şu demek: "Gerçekte bir fark varsa, 100 çalışmadan 80'inde bunu yakalarım, 20'sinde kaçırma riskim var." Klinik önemi yüksek çalışmalarda (faz III ilaç çalışmaları, cerrahi girişim araştırmaları) %90 güç hedefleniyor; ancak %90 güç önemli ölçüde daha büyük örneklem gerektiriyor.

Etki büyüklüğü

Etki büyüklüğü, gruplar arasındaki farkın veya değişkenler arasındaki ilişkinin pratikte ne kadar anlamlı olduğunu gösteren standartlaştırılmış bir ölçü — güç analizinin en kritik ve en zor belirlenen parametresi. Zorluğun nedeni: çalışma yapılmadan önce "ne kadar bir fark bekliyorsunuz?" sorusuna cevap vermek gerekiyor.

Test türü	Etki büyüklüğü ölçüsü	Küçük	Orta	Büyük
t-testi	Cohen's d	0,20	0,50	0,80
ANOVA	Cohen's f	0,10	0,25	0,40
Korelasyon	Pearson r	0,10	0,30	0,50
Ki-kare	Cohen's w	0,10	0,30	0,50
Lojistik regresyon	Odds oranı (OR)	1,5	2,5	4,0

Cohen'in küçük-orta-büyük sınıflandırması bir rehber ama son çare olarak kullanılmalı (Cohen, 1992). Doğru sıra: önce literatürden (meta-analiz veya benzer çalışmalar), sonra pilot çalışma verilerinden, en son klinik olarak anlamlı minimum farktan (MCID) yola çıkmak. Etki büyüklüğü hesaplama yöntemleri yazımızda Cohen's d, Hedges' g, odds oranı, NNT ve diğer ölçüleri ele aldık.

Örneklem büyüklüğü (n)

Örneklem büyüklüğü, güç analizinin çoğu zaman asıl çıktısı; diğer üç parametre belirlendikten sonra gereken minimum katılımcı sayısı hesaplanıyor. Ama bu "minimum" sayının üzerine kayıp oranı eklenmesi şart: prospektif çalışmalarda takip kaybı, eksik veri ve protokol ihlali nedeniyle katılımcı kaybı yaşanıyor.

Düzeltme formülü basit: n_düzeltilmiş = n_hesaplanan / (1 − kayıp oranı). %15 kayıp bekleniyorsa ve güç analizi 64 katılımcı öneriyorsa: 64 / 0,85 ≈ 76 katılımcı. Örneklem büyüklüğü hesaplama yazımızda bu hesaplamaların pratiğini adım adım anlattık.

Tip I ve Tip II hata ne anlama geliyor?

Güç analizini tam kavramak için Tip I ve Tip II hataları net anlamak gerekiyor; bu iki hata türü, istatistiksel karar vermenin kaçınılmaz riskleri.

Güç (1−β), gerçek bir fark varken onu doğru yakalama olasılığı — sağ üst hücre.

Tip I hata: Gerçekte fark yokken fark varmış gibi sonuç elde etme; etkisiz bir ilacın etkili göründüğü durum. α = 0,05 demek, bu riski %5 ile sınırlamak demek.

Tip II hata: Gerçekte fark varken bunu tespit edememe; etkili bir ilacın etkisiz göründüğü durum. β = 0,20 (güç = 0,80) demek, %20 kaçırma riski demek.

Tıbbi araştırmalarda her iki hatanın da ciddi sonuçları var: Tip I hata etkisiz bir tedavinin etkili sanılmasına, Tip II hata etkili bir tedavinin gözden kaçırılmasına yol açabiliyor.

Akademik Not

Bir araştırmanın "istatistiksel olarak anlamsız" sonuç vermesi, gerçekte fark olmadığı anlamına gelmiyor. Yetersiz güçle yürütülen çalışmalarda Tip II hata riski yüksektir ve düşük güç, anlamlı çıkan sonuçların bile güvenilirliğini azaltır (Button ve ark., 2013). Bu nedenle "anlamsız" sonuçları yorumlarken güven aralıklarına ve etki büyüklüğüne bakmak kritik. p değeri anlamsız çıktığında yazımızda bu durumu ele aldık.

Hangi güç analizi türü ne zaman kullanılıyor?

Güç analizi dört farklı modda çalışabiliyor; hangisinin uygun olduğu araştırmanın hangi aşamasında olduğunuza bağlı.

A priori: Veri toplama öncesinde örneklem büyüklüğü hesaplamak için; altın standart. Etik kurul ve hakemler bunu görüyor. Bu hesabı doğru zamanda yapabilmek, biyoistatistikçiyi tasarım aşamasında dahil etmeye bağlı.

Post-hoc: Çalışma tamamlandıktan sonra gerçekleşen gücü hesaplamak için. Önemli bir uyarı: post-hoc güç, gözlenen p değerinin doğrudan bir fonksiyonu olduğu için yeni bilgi taşımaz ve döngüsel bir hesaplama olarak eleştiriliyor. Post-hoc güç analizi yazımız bu tuzağı ayrıntılı ele alıyor.

Sensitivity: Örneklem sabit olduğunda (örneğin retrospektif çalışma) tespit edilebilir minimum etki büyüklüğünü hesaplamak için. A priori analizin mümkün olmadığı durumlarda en uygun yaklaşım.

Criterion: Güç ve örneklem bilindikten sonra en uygun α düzeyini hesaplamak için; keşfedici araştırmalarda kullanılıyor.

Örnekler üzerinde nasıl görünüyor?

Örnek 1 — Bağımsız iki grup t-testi. Yeni bir ilacın kan basıncına etkisi test edilecek. Literatürde benzer çalışmalar Cohen's d = 0,5 civarında etki bildirmiş. α = 0,05, güç = 0,80 ile her grupta 64, toplam 128 katılımcı gerekiyor. %15 kayıp eklenince: 128 / 0,85 ≈ 151 katılımcı.

Örnek 2 — Korelasyon analizi. Yaş ile kemik mineral yoğunluğu arasındaki ilişki araştırılıyor. Beklenen korelasyon r = 0,3. α = 0,05, güç = 0,80 ile toplam 84 kişi gerekiyor.

Örnek 3 — Üç grubun karşılaştırılması (ANOVA). İlaç A, İlaç B ve plasebo; Cohen's f = 0,25 (orta etki). α = 0,05, güç = 0,80, 3 grup ile toplam 159 kişi (her grupta 53).

Bu örnekler G*Power ile hesaplanıyor; G*Power adım adım rehberimizde her örneği ekran ekran gösterdik. Hızlı bir tahmin için örneklem hesaplama aracını da kullanabilirsiniz.

Sonuç nasıl raporlanıyor?

Güç analizi hem etik kurul protokolünde hem de makale yöntem bölümünde raporlanıyor. Raporda şu bilgiler yer almalı:

Kullanılan istatistiksel test
Etki büyüklüğü değeri ve kaynağı (referans veya pilot çalışma)
Anlamlılık düzeyi (α)
Hedeflenen güç
Hesaplanan örneklem büyüklüğü
Kayıp oranı ve düzeltilmiş örneklem
Kullanılan yazılım ve sürümü

Örnek raporlama cümlesi: "Birincil sonuç ölçütümüz olan HbA1c düzeyindeki farkı değerlendirmek üzere bağımsız örneklem t-testi için a priori güç analizi yapılmıştır. Smith ve ark. (2022) tarafından bildirilen 0,65 standart sapma birimlik etki büyüklüğü (Cohen's d), iki yönlü α = 0,05 anlamlılık düzeyi ve %80 güç hedefi esas alındığında her grup için minimum 38 katılımcı gerektiği hesaplanmıştır (G*Power 3.1.9.7). %15 kayıp oranı göz önüne alınarak toplam 90 katılımcı hedeflenmiştir."

Bu format, hem etik kurul üyelerinin hem de hakemlerin örneklem büyüklüğünün bilimsel temelini kolayca değerlendirmesini sağlıyor.

Pratikte nelere dikkat ediliyor?

Etki büyüklüğü tahmini sistematik bir sıra izliyor: önce meta-analizler, yoksa benzer çalışmaların etki büyüklükleri, mümkünse pilot çalışma verisi. Cohen sınıflandırması ancak hiçbir kaynak yoksa ve gerekçelendirilerek kullanılıyor.

Birincil sonuç ölçütü esas alınıyor. Güç analizi birincil sonuç üzerinden yapılıyor; ikincil sonuçlar için ayrı analiz zorunlu değil ama çalışmanın bu sonuçlar için yeterli güçte olmayabileceği belirtiliyor.

Belirsizlik varsa sensitivity tablosu ekleniyor. Etki büyüklüğü tahmini belirsizse, farklı etki büyüklükleri için gereken örneklemi bir tablo olarak sunmak hakemlerin güvenini artırıyor.

Biyoistatistikçi erken aşamada dahil oluyor. Güç analizi yalnızca yazılıma parametre girmek değil; doğru testin seçimi, etki büyüklüğünün anlamlı tahmini ve sonuçların yorumu uzmanlık gerektiriyor.

Model İstatistik olarak güç analizi sürecinde — etki büyüklüğü tahmininden yazılım seçimine, hesaplamadan raporlamaya — araştırmacıya rehberlik ediyoruz.

Not: Buradaki eşik değerler (α = 0,05, güç 0,80) ve Cohen sınıflandırması yaygın uzlaşılardır, mutlak kural değildir. Örneklem kararı çalışmanın klinik bağlamına, birincil sonuç ölçütüne ve alanın standartlarına göre veriliyor.

Kullanılan kaynaklar

Cohen J. A power primer. Psychol Bull. 1992;112(1):155-9. PMID 19565683 · DOI
Cohen J. Statistical Power Analysis for the Behavioral Sciences. 2nd ed. Hillsdale, NJ: Lawrence Erlbaum; 1988.
Faul F, Erdfelder E, Lang AG, Buchner A. G*Power 3: a flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behav Res Methods. 2007;39(2):175-91. PMID 17695343 · DOI
Button KS, Ioannidis JPA, Mokrysz C, ve ark. Power failure: why small sample size undermines the reliability of neuroscience. Nat Rev Neurosci. 2013;14(5):365-76. PMID 23571845 · DOI

Güç analizi tam olarak neyi ölçüyor?

Dört parametre birbirini nasıl belirliyor?

Parametre	Sembol	Tanım	Yaygın değer
Anlamlılık düzeyi	α	Tip I hata olasılığı	0,05
İstatistiksel güç	1 − β	Gerçek bir etkiyi doğru tespit etme olasılığı	0,80 veya 0,90
Etki büyüklüğü	d, r, f, OR	Gruplar arasındaki farkın büyüklüğü	Çalışmaya özgü
Örneklem büyüklüğü	n	Katılımcı sayısı	Hesaplanan değer

Üç parametre sabitlendiğinde dördüncüsü belirleniyor; hedefleri sıkılaştırmak gereken n'yi büyütüyor.

Bu dört parametre birbirine bağlı; birini değiştirdiğinizde diğer üçünden en az biri etkileniyor. Bu bağlantı güç analizinin temeli.

Anlamlılık düzeyi (α)

İstatistiksel güç (1 − β)

Etki büyüklüğü

Test türü	Etki büyüklüğü ölçüsü	Küçük	Orta	Büyük
t-testi	Cohen's d	0,20	0,50	0,80
ANOVA	Cohen's f	0,10	0,25	0,40
Korelasyon	Pearson r	0,10	0,30	0,50
Ki-kare	Cohen's w	0,10	0,30	0,50
Lojistik regresyon	Odds oranı (OR)	1,5	2,5	4,0

Örneklem büyüklüğü (n)

Tip I ve Tip II hata ne anlama geliyor?

Güç analizini tam kavramak için Tip I ve Tip II hataları net anlamak gerekiyor; bu iki hata türü, istatistiksel karar vermenin kaçınılmaz riskleri.

Güç (1−β), gerçek bir fark varken onu doğru yakalama olasılığı — sağ üst hücre.

Tip I hata: Gerçekte fark yokken fark varmış gibi sonuç elde etme; etkisiz bir ilacın etkili göründüğü durum. α = 0,05 demek, bu riski %5 ile sınırlamak demek.

Tip II hata: Gerçekte fark varken bunu tespit edememe; etkili bir ilacın etkisiz göründüğü durum. β = 0,20 (güç = 0,80) demek, %20 kaçırma riski demek.

Tıbbi araştırmalarda her iki hatanın da ciddi sonuçları var: Tip I hata etkisiz bir tedavinin etkili sanılmasına, Tip II hata etkili bir tedavinin gözden kaçırılmasına yol açabiliyor.

Akademik Not

Hangi güç analizi türü ne zaman kullanılıyor?

Güç analizi dört farklı modda çalışabiliyor; hangisinin uygun olduğu araştırmanın hangi aşamasında olduğunuza bağlı.

Criterion: Güç ve örneklem bilindikten sonra en uygun α düzeyini hesaplamak için; keşfedici araştırmalarda kullanılıyor.

Örnekler üzerinde nasıl görünüyor?

Örnek 2 — Korelasyon analizi. Yaş ile kemik mineral yoğunluğu arasındaki ilişki araştırılıyor. Beklenen korelasyon r = 0,3. α = 0,05, güç = 0,80 ile toplam 84 kişi gerekiyor.

Örnek 3 — Üç grubun karşılaştırılması (ANOVA). İlaç A, İlaç B ve plasebo; Cohen's f = 0,25 (orta etki). α = 0,05, güç = 0,80, 3 grup ile toplam 159 kişi (her grupta 53).

Bu örnekler G*Power ile hesaplanıyor; G*Power adım adım rehberimizde her örneği ekran ekran gösterdik. Hızlı bir tahmin için örneklem hesaplama aracını da kullanabilirsiniz.

Sonuç nasıl raporlanıyor?

Güç analizi hem etik kurul protokolünde hem de makale yöntem bölümünde raporlanıyor. Raporda şu bilgiler yer almalı:

Kullanılan istatistiksel test
Etki büyüklüğü değeri ve kaynağı (referans veya pilot çalışma)
Anlamlılık düzeyi (α)
Hedeflenen güç
Hesaplanan örneklem büyüklüğü
Kayıp oranı ve düzeltilmiş örneklem
Kullanılan yazılım ve sürümü

Bu format, hem etik kurul üyelerinin hem de hakemlerin örneklem büyüklüğünün bilimsel temelini kolayca değerlendirmesini sağlıyor.

Pratikte nelere dikkat ediliyor?

Model İstatistik olarak güç analizi sürecinde — etki büyüklüğü tahmininden yazılım seçimine, hesaplamadan raporlamaya — araştırmacıya rehberlik ediyoruz.

Not: Buradaki eşik değerler (α = 0,05, güç 0,80) ve Cohen sınıflandırması yaygın uzlaşılardır, mutlak kural değildir. Örneklem kararı çalışmanın klinik bağlamına, birincil sonuç ölçütüne ve alanın standartlarına göre veriliyor.

Kullanılan kaynaklar

Cohen J. A power primer. Psychol Bull. 1992;112(1):155-9. PMID 19565683 · DOI
Cohen J. Statistical Power Analysis for the Behavioral Sciences. 2nd ed. Hillsdale, NJ: Lawrence Erlbaum; 1988.
Faul F, Erdfelder E, Lang AG, Buchner A. G*Power 3: a flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behav Res Methods. 2007;39(2):175-91. PMID 17695343 · DOI
Button KS, Ioannidis JPA, Mokrysz C, ve ark. Power failure: why small sample size undermines the reliability of neuroscience. Nat Rev Neurosci. 2013;14(5):365-76. PMID 23571845 · DOI

Güç Analizi Nedir? Kavram, Parametreler ve Formül

Güç analizi tam olarak neyi ölçüyor?

Dört parametre birbirini nasıl belirliyor?

Anlamlılık düzeyi (α)

İstatistiksel güç (1 − β)

Etki büyüklüğü

Örneklem büyüklüğü (n)

Tip I ve Tip II hata ne anlama geliyor?

Hangi güç analizi türü ne zaman kullanılıyor?

Örnekler üzerinde nasıl görünüyor?

Sonuç nasıl raporlanıyor?

Pratikte nelere dikkat ediliyor?

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Örneklem Büyüklüğü Nasıl Hesaplanır?

Etki Büyüklüğü Hesaplama: d, OR, NNT ve Ötesi

Güç Analizi Yazılımları: G*Power, PASS, R Karşılaştırması

Araştırmanız İçin Destek Alın

Güç Analizi Nedir? Kavram, Parametreler ve Formül

Güç analizi tam olarak neyi ölçüyor?

Dört parametre birbirini nasıl belirliyor?

Anlamlılık düzeyi (α)

İstatistiksel güç (1 − β)

Etki büyüklüğü

Örneklem büyüklüğü (n)

Tip I ve Tip II hata ne anlama geliyor?

Hangi güç analizi türü ne zaman kullanılıyor?

Örnekler üzerinde nasıl görünüyor?

Sonuç nasıl raporlanıyor?

Pratikte nelere dikkat ediliyor?

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Örneklem Büyüklüğü Nasıl Hesaplanır?

Etki Büyüklüğü Hesaplama: d, OR, NNT ve Ötesi

Güç Analizi Yazılımları: G*Power, PASS, R Karşılaştırması

Araştırmanız İçin Destek Alın