Cohen's d yerine neden Cohen's f kullanılıyor?

Cohen's d iki grup ortalaması arasındaki farkı standartlaştırıyor. Üç ve üzeri grupta tek bir ikili fark yerine tüm grup ortalamalarının genel ortalamadan sapma örüntüsü söz konusu. Cohen's f bu çok boyutlu farkı tek ölçüyle ifade ediyor. İki grup durumunda f = d/2 ilişkisi var.

G*Power'da Number of groups alanına ne girmeliyim?

Tek yönlü ANOVA'da doğrudan grup sayısı girilir (3, 4, 5 gibi). Faktöriyel ANOVA'da toplam hücre sayısı girilmeli: 2x3 tasarımda 6, 3x3 tasarımda 9. Pay serbestlik derecesi incelenen etkiye göre belirlenir.

Dengesiz gruplarla güç analizi nasıl yapılır?

G*Power'ın standart ANOVA hesaplaması dengeli tasarım varsayıyor. Dengesiz tasarımlar için R'deki pwr veya WebPower paketleri kullanılabilir. Alternatif olarak dengeli hesaplamaya dengesizlik kaybı (%10-40) eklenebilir. En güvenilir yaklaşım Monte Carlo simülasyonu.

Kruskal-Wallis için örneklem nasıl hesaplanır?

G*Power Kruskal-Wallis için doğrudan güç analizi sunmuyor. Pratikte ANOVA hesaplamasına %5-15 ekleme yapılıyor. Daha kesin hesaplama için R'deki simr paketiyle Monte Carlo simülasyonu yapılabilir. Normal dağılıma yakın verilerde ANOVA ve Kruskal-Wallis'in güç gereksinimleri çok benzer.

Post-hoc güç analizi neden sorunlu?

Gözlenen etki büyüklüğü p değerinin doğrudan fonksiyonu. Anlamsız p -> küçük etki -> düşük güç döngüsü kaçınılmaz. Post-hoc güç, p değerinin yeniden ifade edilmiş hali. Yerine güven aralığı raporlamak veya duyarlılık analizi yapmak daha anlamlı.

Etkileşim etkisi için neden daha fazla örneklem gerekiyor?

Etkileşim etkisi genellikle ana etkilerden daha küçük etki büyüklüğüne sahip. Küçük etki büyüklüğü daha büyük örneklem gerektiriyor. Ayrıca hücre sayısı arttıkça her hücrede yeterli katılımcı sağlamak toplam örneklemi artırıyor. Genel kural: etkileşim tespiti ana etkiden 4-8 kat daha fazla örneklem gerektirebilir.

Grup başına minimum kaç katılımcı olmalı?

Parametrik testler (ANOVA) için grup başına en az 15-20 genel kural. Non-parametrik testlerde (Kruskal-Wallis) teknik olarak 5 yeterli ama 10-15 önerilir. Faktöriyel tasarımlarda hücre başına 20-30 hedeflenmeli. Varyans homojenliği ihlali varsa grup başına 20-25 Welch ANOVA sağlamlığı için gerekli.

Çok Gruplu Örneklem: ANOVA Güç Analizi ve Cohen's f

İki grup karşılaştırması için örneklem hesaplamayı çoğu araştırmacı biliyor: Cohen's d, G*Power, t-testi ve sonuç. Ama çalışmada üç tedavi kolu olduğunda akla yatkın görünen bir kestirme yol beliriyor — "iki grup için bulduğum sayıyı üçle çarpsam yeter." Bu yaklaşım yanlış ve sık yapılan bir hata.

Çok gruplu çalışmalarda test edilen hipotez, etki büyüklüğü ölçüsü ve güç hesabının mantığı farklı. ANOVA "grupların en az ikisi arasında fark var mı?" sorusunu soruyor; bu omnibus hipotez, iki grup karşılaştırmasından temelden ayrılıyor. Bu yazıda üç ve üzeri gruplu tasarımlarda örneklem büyüklüğü hesabını, Cohen's f'ten G*Power ayarlarına kadar ele alıyoruz.

Neden farklı?

Üç temel neden var. Birincisi hipotezin kendisi: iki grupta "A ile B arasında fark var mı?" sorulurken, ANOVA'da "grupların en az ikisi farklı mı?" soruluyor. Bu omnibus hipotez grup ortalamaları arasındaki genel varyasyondan besleniyor ve etki büyüklüğü ölçüsünü de değiştiriyor — Cohen's d yerine Cohen's f devrede.

İkincisi serbestlik dereceleri: üç gruplu ANOVA'da pay serbestlik derecesi 2, beş grupta 4. Serbestlik derecesi arttıkça aynı etkiyi saptamak için daha fazla katılımcı gerekiyor.

Üçüncüsü, ANOVA'nın anlamlı çıkması bir bitiş noktası değil. Hangi grupların farklı olduğunu bulmak için post-hoc karşılaştırmalar yapılıyor ve çoklu karşılaştırma düzeltmeleri alfa düzeyini düşürüyor; bu düşüş de örneklem gereksinimine yansıyor.

Cohen's f: çok gruplu etki büyüklüğü

İki grup karşılaştırmasında Cohen's d — iki ortalama arasındaki farkın standart sapmaya oranı — kullanılıyor. Üç ve üzeri grupta "iki ortalama arasındaki fark" kavramı yetersiz kalıyor; birden çok grup ortalaması ve bunların genel ortalamadan sapmaları söz konusu. Cohen's f tam olarak bunu, yani grup ortalamalarının genel ortalamadan standartlaştırılmış sapmasını ölçüyor. İki grup özel durumunda f = d / 2 ilişkisi geçerli.

Cohen'in (1988) geleneksel sınıflandırmasına göre f = 0,10 küçük etki (gruplar arası fark gözle zor seçilir), f = 0,25 orta etki (klinik olarak fark edilebilir), f = 0,40 büyük etki (belirgin ve güçlü fark).

Etki büyüklüğünü belirlemenin en güvenilir yolu benzer çalışmaların sonuçlarından yola çıkmak. En pratik dönüşüm, yayınlanmış bir çalışmada raporlanan η² (eta-kare) değerinden yapılıyor:

f = √(η² / (1 − η²))

Yalnızca F istatistiği ve serbestlik dereceleri verilmişse, önce η² = (F × df_pay) / (F × df_pay + df_hata) ile eta-kare elde ediliyor; burada df_hata = N − k (k, grup sayısı) — toplam N değil. Bu ayrım küçük örneklemlerde önemli fark yaratıyor. Dönüşümlerin ayrıntısını etki büyüklüğü hesaplama yöntemleri yazımızda ele aldık.

Uyarı

Cohen's f hesaplarken sık yapılan hata, grup ortalamalarının varyansını örneklem büyüklüğüyle ağırlıklandırmamak. Eşit grup büyüklüklerinde sorun olmuyor ama dengesiz gruplarda ağırlıklı hesap zorunlu. Ayrıca Cohen's f, ANOVA'nın omnibus testinin etki büyüklüğünü ölçüyor; spesifik ikili karşılaştırmalar için yine Cohen's d kullanılmalı.

G*Power ile hesaplama: temel senaryolar

G*Power çok gruplu tasarımlar için kapsamlı seçenekler sunuyor; doğru menü ve parametre seçimi güvenilir sonucun ön koşulu.

Tek yönlü ANOVA (üç ve üzeri bağımsız grup). En temel senaryo. G*Power'da Test family → F tests, Statistical test → ANOVA: Fixed effects, omnibus, one-way, Effect size f → örneğin 0,25, alfa → 0,05, Power → 0,80, Number of groups → grup sayısı.

Orta etki (f = 0,25) ve standart parametrelerle üç grupta grup başına 53 ile toplam 159, dört grupta grup başına 45 ile toplam 180, beş grupta grup başına 40 ile toplam 200 katılımcı çıkıyor. Dikkat çekici olan şu: grup sayısı arttıkça grup başına gereken sayı azalırken toplam örneklem büyüyor.

Grup başına sayı azalsa da toplam örneklem, grup sayısıyla birlikte artıyor.

Tekrarlı ölçümler ANOVA (karma tasarım). Gruplar arası ve grup içi faktörlerin bir arada olduğu tasarım. G*Power ek parametreler istiyor: ölçüm sayısı, tekrarlı ölçümler arası korelasyon (bilinmiyorsa 0,50 makul bir varsayım) ve nonsphericity düzeltme faktörü (sphericity varsayımı ihlal ediliyorsa 0,70-0,80). Tekrarlı ölçümlerin avantajı, kişi içi korelasyonun gücü artırıp gereken toplam örneklemi azaltması; dezavantajı, sphericity ihlalinin güç kaybına yol açması.

Faktöriyel tasarım. İki veya daha fazla faktörün birlikte incelendiği tasarımlarda her etki için ayrı güç hesabı gerekiyor. 2×3 tasarımda A ana etkisi (df = 1), B ana etkisi (df = 2) ve A×B etkileşimi (df = 2) ayrı ayrı değerlendiriliyor; G*Power'da Number of groups alanına toplam hücre sayısı (2×3 için 6) giriliyor.

Dengeli ve dengesiz tasarım

Her gruba eşit sayıda katılımcı atamak (dengeli tasarım) istatistiksel açıdan en verimli yaklaşım; aynı toplam örneklemde dengeli tasarım, dengesizden daha yüksek güç sağlıyor ve varyans homojenliği varsayımı ihlal edildiğinde sağlamlığı da artırıyor. Ama pratikte eşit gruplar her zaman mümkün olmuyor: nadir hastalık grupları doğal olarak küçük, bazı tedavi kolları pahalı, retrospektif verilerde dağılım kendiliğinden dengesiz.

Dengesizliğin güce etkisi göz ardı edilemez. Üç gruplu bir çalışmada 1:1:1 yerine 1:1:2 oranı toplam örneklem ihtiyacını yaklaşık %8, 1:1:3 oranı yaklaşık %19, 1:1:5 oranı ise yaklaşık %42 artırıyor.

Gruplar arası oran bozuldukça aynı güç için gereken toplam örneklem artıyor.

Yine de dengesizlik her zaman dezavantaj değil. Nadir hastalık araştırmalarında hasta grubunu büyütmek mümkün olmadığında kontrol grubunu büyütmek (1:2 veya 1:3 oranı) toplam gücü yükseltiyor; 20 hasta bulunabiliyorsa 40 veya 60 kontrol almak mantıklı bir strateji. G*Power'ın standart tek yönlü ANOVA hesabı dengeli tasarım varsaydığı için, dengesiz gruplarda R'deki pwr veya WebPower paketleri kullanılabiliyor; alternatif olarak dengeli tasarım için hesaplayıp dengesizlik kaybını (%10-40) eklemek pratik bir yol.

Faktöriyel tasarımlarda etkileşim etkisi

Faktöriyel tasarımlarda güç analizinin en sık gözden kaçan yönü, etkileşim etkisinin genellikle ana etkilerden daha fazla örneklem gerektirmesi — çünkü etkileşim etkileri tipik olarak daha küçük etki büyüklüğüne sahip. 2×3 tasarımda 6, 3×3 tasarımda 9, 2×2×3 tasarımda 12 hücre oluşuyor ve her hücrede yeterli katılımcı bulunması gerekiyor. Genel kural hücre başına en az 20 katılımcı; etkileşim etkisi birincil hipotezse bunun 30'a çıkarılması öneriliyor.

Araştırmanın birincil hipotezi hangi etkiyle ilgiliyse örneklemi o etkinin gereksinimine göre belirlemek gerekiyor. Her etki için ayrı güç hesaplayıp en büyük örneklemi gerektireni hedeflemek, tüm etkilerin yeterli güçle test edilmesini sağlıyor. Temel prensipleri örneklem büyüklüğü hesaplama yazımızda ayrıntılı ele aldık.

İpucu

Faktöriyel tasarımlarda etkileşim etkisini saptamak, ana etkilere kıyasla belirgin biçimde daha fazla örneklem gerektirebiliyor. Etkileşim etkisi birincil hipotezinizse ve planlamayı ana etkiye göre yaptıysanız, çalışma büyük olasılıkla yetersiz güçte kalıyor. Güç analizini doğrudan etkileşim için yapıp gereken en büyük örneklemi hedeflemek gerekiyor.

Post-hoc güç analizi tuzağı

Çok gruplu çalışmalarda sık karşılaşılan bir uygulama, "ANOVA anlamsız çıktı, acaba yeterli güçte miydik?" sorusuyla yapılan post-hoc güç analizi. Bu yaklaşım yanıltıcı; çünkü gözlenen etki büyüklüğü p değerinin doğrudan fonksiyonu. p büyükse (anlamsız sonuç) gözlenen etki küçük ve hesaplanan güç düşük çıkıyor, p küçükse güç yüksek. Yani post-hoc güç, p değerinin dönüştürülmüş bir tekrarı — yeni bilgi vermiyor.

Yerine ne yapılmalı? Etki büyüklüğünün güven aralığını raporlamak (bulgunun kesinlik derecesini gösteriyor), duyarlılık analizi yapmak (mevcut örneklemin saptayabileceği en küçük etkiyi hesaplamak) ve a priori güç analizini makalede sunmak. Konuyu post-hoc güç analizi yazımızda ayrıntılı ele aldık.

Raporlamada şeffaflık

Makalenin yöntem bölümünde güç analizini raporlarken şu bilgiler bekleniyor: kullanılan yazılım ve sürümü, test türü, Cohen's f değeri ve kaynağı, alfa düzeyi, hedeflenen güç, grup sayısı, tahsis oranı ve gerekçesi, toplam örneklem büyüklüğü ve kayıp düzeltmesi. Tek bir etki büyüklüğüne bağlı kalmak yerine farklı f değerleri (küçük, orta, büyük) için gereken örneklemleri bir tabloda sunmak, hem etik kurul hem de hakemler tarafından olumlu karşılanıyor.

Model İstatistik olarak çok gruplu çalışmaların güç analizi aşamasında araştırmacılara destek verirken en sık karşılaştığımız durum, iki grup için hesaplanan sayının grup sayısıyla çarpılması oluyor. Bu yol yanlış; çünkü ANOVA'nın güç yapısı t-testinden farklı ve gruplar arası varyans örüntüsü basit çarpmayla yakalanamıyor. Doğru bir Cohen's f değeriyle yapılan G*Power hesabı ise çalışmanın temelini sağlam kuruyor.

Not: Buradaki örneklem değerleri iki yönlü test ve tipik varsayımlar için G*Power çıktılarıdır; tasarımın tam yapılandırmasına göre az miktarda değişebilir. Dengesizlik cezası oranları yaklaşık değerlerdir. Kesin planlama, çalışmanın kendi tasarımı üzerinden yapılır.

Kullanılan kaynaklar

Cohen J. Statistical Power Analysis for the Behavioral Sciences. 2. baskı. Hillsdale, NJ: Lawrence Erlbaum; 1988.
Faul F, Erdfelder E, Lang AG, Buchner A. G*Power 3: a flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods. 2007;39(2):175-191. · DOI

Not: Buradaki örneklem değerleri iki yönlü test ve tipik varsayımlar için G*Power çıktılarıdır; tasarımın tam yapılandırmasına göre az miktarda değişebilir. Dengesizlik cezası oranları yaklaşık değerlerdir. Kesin planlama, çalışmanın kendi tasarımı üzerinden yapılır.

Kullanılan kaynaklar

Cohen J. Statistical Power Analysis for the Behavioral Sciences. 2. baskı. Hillsdale, NJ: Lawrence Erlbaum; 1988.
Faul F, Erdfelder E, Lang AG, Buchner A. G*Power 3: a flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods. 2007;39(2):175-191. · DOI

Çok Gruplu Çalışmalarda Örneklem Hesaplama

Neden farklı?

Cohen's f: çok gruplu etki büyüklüğü

G*Power ile hesaplama: temel senaryolar

Dengeli ve dengesiz tasarım

Faktöriyel tasarımlarda etkileşim etkisi

Post-hoc güç analizi tuzağı

Raporlamada şeffaflık

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Örneklem Büyüklüğü Nasıl Hesaplanır?

Güç Analizi Nedir? Kavram, Parametreler ve Formül

Çoklu Karşılaştırma Düzeltmeleri: Hangi Yöntem, Hangi Durumda?

Araştırmanız İçin Destek Alın

Çok Gruplu Çalışmalarda Örneklem Hesaplama

Neden farklı?

Cohen's f: çok gruplu etki büyüklüğü

G*Power ile hesaplama: temel senaryolar

Dengeli ve dengesiz tasarım

Faktöriyel tasarımlarda etkileşim etkisi

Post-hoc güç analizi tuzağı

Raporlamada şeffaflık

Kullanılan kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Örneklem Büyüklüğü Nasıl Hesaplanır?

Güç Analizi Nedir? Kavram, Parametreler ve Formül

Çoklu Karşılaştırma Düzeltmeleri: Hangi Yöntem, Hangi Durumda?

Araştırmanız İçin Destek Alın