Güç analiziniz 80 hasta dedi. Kriterleri titizlikle yazdınız: 18-45 yaş, BMI 20-25, komorbidite yok, ilaç kullanımı yok, sigara içmeyen. İki yıl sonra elinizde 28 hasta var.
Çalışma yarıda kaldı.
Homojenlik takıntısı çalışmayı öldürür
Kriterleri daraltmanın mantığı sezgisel olarak doğru. Homojen grup, daha az confounding, daha yüksek iç geçerlilik. Bunu kimse tartışmaz.
Ama bir eşik var. O eşiği geçtiğinizde "temiz" popülasyon yaratma arzusu, gerçek dünyada neredeyse var olmayan bir hasta profili tanımlar. Tip 2 diyabet çalışması yapıyorsunuz, hipertansiyonu olanları dışlıyorsunuz. Türkiye'de diyabetli hastaların %60-70'inde hipertansiyon var. Geriye kalan havuz o kadar küçük ki, iki yılda hedef örnekleme ulaşamıyorsunuz.
Bir de dış geçerlilik sorunu var. Kriterleri çok daraltınca bulguların kimlere uygulanabilir olduğu muğlaklaşır. Hakem sorar: "Bu sonuçlar kime genellenebilir?" Cevap: "18-45 yaş, BMI 20-25, komorbiditesiz, ilaç kullanmayan, sigara içmeyen diyabetli hastalara." Bu profil Türkiye nüfusunun yüzde kaçına denk geliyor?
Muhtemelen yüzde birinin altına.
Geniş kriterin sinsi tuzağı
Tam tersine, kriterleri çok geniş tutarsanız heterojenite artar. Gruplar arasındaki gerçek farkı gürültünün içinden çıkarmak zorlaşır. Etki büyüklüğü küçülür, güç düşer, 80 hasta yerine 200 gerekir.
Daha sinsi bir risk var: alt gruplar arasında etkinin yönü değişebilir. Genç hastalarda ilaç faydalı, yaşlılarda zararlı — genel ortalamaya baktığınızda "fark yok" görürsünüz. Simpson paradoksu. Geniş kriterlerin en tehlikeli sonucu budur çünkü gerçek bir etkiyi maskeleyebilir.
Kriter belirleme süreci
Kriter yazmak rastgele değil, sistematik bir iş. Her adımda farklı bir soruyu cevaplamanız gerekiyor.
Bu beş adımı atlayıp "homojen olsun" diye rastgele kriter yazmak, araştırmanızın en pahalı hatası olabilir.
Explanatory ve pragmatic: iki farklı felsefe
Kriter genişliğini belirleyen temel karar çalışmanızın felsefesidir.
Explanatory trial sorar: "İdeal koşullarda bu müdahale işe yarar mı?" Kriterler dardır. Popülasyon homojen. Mekanizmayı anlamak öncelikli. Faz II ilaç çalışmaları buna örnektir.
Pragmatic trial sorar: "Gerçek klinik pratikte bu müdahale işe yarar mı?" Kriterler geniş. Popülasyon heterojen. Genellenebilirlik öncelikli. PRECIS-2 çerçevesi bu iki uç arasında nerede durduğunuzu belirlemeye yardımcı olur.
Tez çalışmalarında genellikle explanatory yaklaşım beklenir — confounding kontrolü daha kolaydır, mekanizma anlaşılır. Ama bunu bilinçli bir tercih olarak yapmak önemli. "Homojen grup lazım" deyip fizibiliteyi hesaplamadan kriter yazmak sık karşılaşılan bir tuzak.
Beş sık hata
Yaş aralığını gereksiz daraltmak. 18-65 yerine 25-45 yazıyorsunuz. Neden? "Homojenlik için." Yaş zaten bir kovaryat olarak modelde kontrol edilebilir. Hasta havuzunuzu yarıya düşürmüş oldunuz — karşılığında kazancınız minimal.
Komorbiditeyi toptan dışlamak. "Ek hastalığı olan herkes dışlandı." Hangi komorbidite sonucu etkiliyor, hangisi etkilemiyor? Bunu düşünmeden toptan dışlama yapmak hem hasta kaybettirir hem genellenebilirliği öldürür. Hipertansiyonu olanı dışlamak yerine hipertansiyonu kovaryat olarak modele eklemek çoğu zaman daha akıllıca.
Subjektif kriterler koymak. "İşbirliği yapamayacak hastalar dışlandı." Kim değerlendirdi? Hangi ölçütle? Ölçülebilir olmayan kriterler tekrarlanabilirliği bozar ve hakemin eleştiri noktası olur.
Kriterleri hasta alımı düşükken gevşetmek. Cazip gelir — ama protokol amendmanı olmadan yapmak ciddi etik ihlal. Etik kurula bildirmeden kriter değişikliği yaparsanız, çalışmanın tamamı sorgulanır.
Örneklem hesabını kriterlerden önce yapmak. Önce "100 hasta yeter" deyip sonra öyle kriterler koyuyorsunuz ki 100 hastaya ulaşmak imkansız. Sıra tam tersi olmalı: önce kriterler, sonra o kriterlere uyan hasta havuzu tahmini, sonra güç analizi.
Uyarı
Kriterleri çalışma bittikten sonra geriye dönük değiştirmek — mesela sonucu bozan hastaları post-hoc dışlamak — bilimsel sahtekarlık sınırındadır. Tüm kriterler prospektif olarak belirlenmeli ve protokolde yazılmalıdır. Post-hoc dışlama yapıldıysa gerekçeyi, sayıyı ve sonuçlara etkisini şeffaf raporlamak zorunlu.
Kriter tablosunu nasıl yazarsınız?
Methods bölümünde kriterleri açık ve net listelemek gerekiyor. "Şunları dahil ettik, şunları dışladık" yetmez — her exclusion kriteri için kısa bir gerekçe vermek hakemlerin "neden?" sorusunu önceden karşılıyor. "Aktif malignite → tedavi etkisini bağımsız değerlendirmeyi engellediği için dışlandı" gibi.
CONSORT ve STROBE kılavuzlarının ikisi de katılımcı seçim sürecinin akış diyagramıyla gösterilmesini ister. Kaç kişi tarandı, kaç kişi kriterlere uydu, kaç kişi reddetti, kaç kişi takipten düştü — bu sayılar şeffaf olmalı.
"Elde kalan" sayıya bakın. 500 hasta taradınız, 80'i kriterlere uydu, 30'u reddetti, 50 kaldı. Bu durumda ya kriterleri gözden geçirin ya da çok merkezli tasarıma yönelin.
Son bir şey: inclusion ve exclusion ayrı ayrı yazılmalı. Inclusion hedef popülasyonu tanımlar — "Tip 2 diyabet tanısı almış, 18 yaş üstü yetişkinler." Exclusion ise inclusion'ı karşılasa bile çalışmadan çıkarılacak durumları belirtir — "gebelik, aktif kanser tedavisi, çalışma ilacına bilinen alerji." Bu iki listeyi birbirine karıştırmak yaygın bir yazım hatasıdır ve hakemlerin canını sıkar.