İki grup karşılaştırması için örneklem hesapladınız: Cohen's d, G*Power, t-testi, sonuç. Ama çalışmanızda üç tedavi kolu var. "İki grup için hesapladığım sayıyı üçle çarpsam yeter mi?" diye düşünüyorsunuz.
Yetmez. Ve bu hata sık yapılıyor.
Çok gruplu çalışmalarda test edilen hipotez farklı, etki büyüklüğü ölçüsü farklı, güç hesaplamasının mantığı farklı. ANOVA'da "grupların en az ikisi arasında fark var mı?" sorusunu soruyorsunuz. Bu omnibus hipotez, iki grup karşılaştırmasından temelden ayrılıyor. Bu yazıda üç ve üzeri gruplu çalışmalarda örneklem büyüklüğü hesaplamasını, Cohen's f'ten G*Power ayarlarına kadar ele alıyoruz.
Neden farklı?
Üç temel nedeni var.
Birincisi: hipotez farklı. İki grupta "A ile B arasında fark var mı?" soruyorsunuz. ANOVA'da "grupların en az ikisi arasında fark var mı?" soruyorsunuz. Bu omnibus hipotez, grup ortalamaları arasındaki genel varyasyondan besleniyor. Dolayısıyla etki büyüklüğü ölçüsü de farklı: Cohen's d yerine Cohen's f.
İkincisi: serbestlik dereceleri değişiyor. Üç gruplu ANOVA'da pay serbestlik derecesi 2, beş grupta 4. Serbestlik derecesi arttıkça aynı etkiyi tespit etmek için daha fazla katılımcı gerekiyor.
Üçüncüsü: ANOVA anlamlı çıkması bitiş noktası değil. Hangi grupların farklı olduğunu bulmak için post-hoc karşılaştırmalar yapılıyor ve çoklu karşılaştırma düzeltmeleri alfa düzeyini düşürüyor. Bu düşüş örneklem gereksinimine yansıyor.
Cohen's f: çok gruplu etki büyüklüğü
İki grup karşılaştırmasında Cohen's d kullanılıyor: iki ortalama arasındaki farkın standart sapmaya oranı. Üç ve üzeri grupta "iki ortalama arasındaki fark" kavramı yetersiz kalıyor -- birden fazla grup ortalaması ve bunların genel ortalamadan sapmaları söz konusu. Cohen's f tam olarak bunu ölçüyor.
Cohen's f, grup ortalamalarının genel ortalamadan sapmalarının standartlaştırılmış hali. İki grup durumunda f = d / 2 ilişkisi geçerli.
Cohen'in geleneksel sınıflandırmasına göre: f = 0.10 küçük etki (gruplar arası fark gözle zor fark edilir), f = 0.25 orta etki (klinik olarak fark edilebilir), f = 0.40 büyük etki (belirgin ve güçlü fark).
Etki büyüklüğünü belirlerken en güvenilir yol, benzer çalışmaların sonuçlarından yola çıkmak. Yayınlanan bir çalışmadaki F istatistiği ve örneklem büyüklüğünden f değeri geri hesaplanabiliyor: f = karekök(F x df_pay / N). Eta-kare (eta-kare) raporlanmışsa: f = karekök(eta-kare / (1 - eta-kare)). Etki büyüklüğü hesaplama yöntemlerini ayrı yazımızda detaylı ele aldık.
Uyarı
Cohen's f hesaplarken sık yapılan hata, grup ortalamalarının varyansını örneklem büyüklüğüyle ağırlıklandırmamak. Eşit grup büyüklüklerinde sorun olmaz ama dengesiz gruplarda ağırlıklı hesaplama zorunlu. Ayrıca Cohen's f ANOVA'nın omnibus testinin etki büyüklüğünü ölçüyor -- spesifik ikili karşılaştırmalar için yine Cohen's d kullanılmalı.
G*Power ile hesaplama: temel senaryolar
G*Power, çok gruplu tasarımlar için kapsamlı seçenekler sunuyor. Doğru menü ve parametre seçimi güvenilir sonuç için kritik.
Tek yönlü ANOVA (3+ grup, bağımsız). En temel senaryo. G*Power'da: Test family: F tests, Statistical test: ANOVA -- Fixed effects, omnibus, one-way, Effect size f: (örneğin 0.25), alfa: 0.05, Power: 0.80, Number of groups: grup sayısı.
Orta etki büyüklüğü (f = 0.25) ve standart parametrelerle sonuçlar: 3 grupta grup başına 52, toplam 159. 4 grupta grup başına 45, toplam 180. 5 grupta grup başına 39, toplam 200. Dikkat çekici nokta: grup sayısı arttıkça grup başına gereken sayı azalıyor ama toplam örneklem büyüklüğü artıyor.
Tekrarlı ölçümler ANOVA (karma tasarım). Gruplar arası ve grup içi faktörlerin bir arada olduğu tasarım. G*Power'da ek parametreler gerekiyor: ölçüm sayısı, tekrarlı ölçümler arası korelasyon (bilinmiyorsa 0.50 makul varsayım), nonsphericity düzeltme faktörü (sphericity varsayımı ihlal ediliyorsa 0.70-0.80).
Tekrarlı ölçümlerin avantajı: kişi içi korelasyon gücü artırıyor, gereken toplam örneklem azalıyor. Ama sphericity ihlali güç kaybına yol açıyor.
Faktöriyel tasarım. İki veya daha fazla faktörün birlikte incelendiği tasarımlarda her etki için ayrı güç hesaplaması gerekiyor. 2x3 tasarımda: A ana etkisi (df=1), B ana etkisi (df=2), AxB etkileşimi (df=2). G*Power'da Number of groups alanına toplam hücre sayısı girilmeli (2x3 tasarımda 6).
Dengeli ve dengesiz tasarım
Her gruba eşit sayıda katılımcı atamak (dengeli tasarım) istatistiksel açıdan en verimli yaklaşım. Aynı toplam örneklem büyüklüğünde dengeli tasarım, dengesiz tasarımdan daha yüksek güç sağlıyor. ANOVA'nın varyans homojenliği varsayımı ihlal edildiğinde de dengeli tasarım sağlamlığı artırıyor.
Ama pratikte eşit gruplar her zaman mümkün değil. Nadir hastalık grupları doğal olarak küçük, bazı tedavi kolları pahalı, retrospektif verilerde doğal dağılım dengesiz.
Dengesizliğin güce etkisi önemli: 3 gruplu bir çalışmada 1:1:1 yerine 1:1:2 oranı toplam örneklem ihtiyacını yaklaşık %8, 1:1:3 oranı yaklaşık %19, 1:1:5 oranı ise %42 artırıyor.
Nadir hastalık araştırmalarında dengesiz tasarım kaçınılmaz olabiliyor. Hasta grubunu büyütmek mümkün değilse kontrol grubunu büyütmek (1:2 veya 1:3 oranı) toplam gücü artırıyor. 20 hasta bulunabiliyorsa 40 veya 60 kontrol almak mantıklı bir strateji.
G*Power'ın standart tek yönlü ANOVA hesaplaması dengeli tasarım varsayıyor. Dengesiz gruplar için R'deki pwr veya WebPower paketleri kullanılabilir. Alternatif olarak dengeli tasarım için hesaplama yapıp dengesizlik kaybını (%10-40) eklemek pratik bir yaklaşım.
Faktöriyel tasarımlarda etkileşim etkisi
Faktöriyel tasarımlarda güç analizinin en sık gözden kaçan yönü: etkileşim etkisi genellikle ana etkilerden daha fazla örneklem gerektiriyor. Bunun nedeni etkileşim etkilerinin tipik olarak daha küçük etki büyüklüğüne sahip olması.
2x3 tasarımda 6, 3x3 tasarımda 9, 2x2x3 tasarımda 12 hücre oluşuyor. Her hücrede yeterli katılımcı bulunması zorunlu. Genel kural hücre başına en az 20 katılımcı; etkileşim etkisi birincil hipotezse 30'a çıkarılması öneriliyor.
Araştırmanızın birincil hipotezi hangi etkiyle ilgiliyse örneklem büyüklüğünü o etkinin gereksinimine göre belirlemek gerekiyor. Her etki için ayrı güç hesaplaması yapıp en büyük örneklemi gerektireni hedeflemek, tüm etkilerin yeterli güçle test edilmesini garanti ediyor. Örneklem büyüklüğü hesaplama yazımızda temel prensipleri detaylı ele aldık.
İpucu
Faktöriyel tasarımlarda etkileşim etkisinin tespiti ana etkilerden 4-8 kat daha fazla örneklem gerektirebiliyor. Etkileşim etkisi birincil hipotezinizse ve örneklem planlamasını ana etkiye göre yaptıysanız, çalışmanız büyük olasılıkla yetersiz güçte kalacak. Güç analizini etkileşim için yapmanız ve gereken en büyük örneklemi hedeflemeniz gerekiyor.
Post-hoc güç analizi tuzağı
Çok gruplu çalışmalarda sıkça karşılaşılan bir uygulama: "ANOVA anlamsız çıktı, acaba yeterli güçte miydik?" sorusuyla yapılan post-hoc güç analizi.
Bu uygulama sorunlu. Gözlenen etki büyüklüğü p değerinin doğrudan fonksiyonu. p büyükse (anlamsız sonuç) gözlenen etki küçük, hesaplanan güç düşük çıkıyor. p küçükse güç yüksek çıkıyor. Post-hoc güç, p değerinin dönüştürülmüş tekrarı -- yeni bilgi sunmuyor.
Yerine ne yapılmalı? Etki büyüklüğünün güven aralığını raporlamak (bulgunuzun kesinlik derecesini gösteriyor), duyarlılık analizi yapmak (mevcut örneklemin tespit edebileceği minimum etki büyüklüğünü hesaplamak) ve a priori güç analizini makalede sunmak.
Raporlamada şeffaflık
Makalenizin yöntem bölümünde güç analizini raporlarken şu bilgiler bekleniyor: kullanılan yazılım ve versiyonu, test türü, Cohen's f değeri ve kaynağı, alfa düzeyi, hedeflenen güç, grup sayısı, tahsis oranı ve gerekçesi, toplam örneklem büyüklüğü ve kayıp düzeltmesi.
Tek bir etki büyüklüğü değerine bağlı kalmak yerine farklı f değerleri (küçük, orta, büyük) için gereken örneklem büyüklüklerini tablo olarak sunmak, hem etik kurul hem de hakemler tarafından olumlu karşılanıyor.
Model Istatistik olarak çok gruplu çalışmaların güç analizi aşamasında araştırmacılara destek verirken, en sık karşılaştığımız sorunun iki grup için hesaplama yapıp sonucu grup sayısıyla çarpma yaklaşımı olduğunu görüyoruz. Bu yöntem yanlış çünkü ANOVA'nın güç yapısı t-testinden farklı ve gruplar arası varyans örüntüsü basit çarpmayla yakalanamıyor. Doğru Cohen's f değeriyle yapılan bir G*Power hesaplaması, çalışmanın temelini sağlam atıyor.