5000 hastayı içeren çok merkezli bir çalışma yürüttünüz. Yeni bir antidiyabetik ilaç HbA1c'yi ortalama %0.1 düşürüyor. p<0.001 çıktı — istatistiksel olarak son derece anlamlı. Makaleyi göndermeden önce endokrinoloji uzmanı bir meslektaşınıza gösterdiniz. Baktı, başını salladı: "Bu fark klinik olarak bir şey ifade etmiyor."
p değeri ne söylüyor, ne söylemiyor?
p değeri şunu söylüyor: gözlenen fark, rastlantıyla açıklanamayacak kadar büyük. Ama şunu söylemiyor: bu fark hastaya fayda sağlayacak kadar büyük mü?
İstatistiksel anlamlılık bir olasılık hesabı. Klinik anlamlılık ise hasta yönetiminde somut fark yaratan bir eşik meselesi. İkisinin kesiştiği noktalar var elbette, ama her zaman örtüşmüyorlar.
İki senaryo bu ayrımı çok net ortaya koyuyor:
Senaryo 1: 40 hastada sistolik kan basıncını 12 mmHg düşürdünüz, p=0.08. İstatistiksel olarak anlamlı değil — ama 12 mmHg'lık düşüş klinik olarak oldukça değerli. Sorun metodolojik: örneklem bu etkiyi yakalayacak güçte değildi.
Senaryo 2: 8000 hastada sistolik kan basıncını 1.4 mmHg düşürdünüz, p<0.001. İstatistiksel olarak çok anlamlı — ama 1.4 mmHg pratikte hasta açısından fark yaratmıyor. Etki gerçek ama klinik olarak önemsiz.
İki Farklı Tuzak
p Anlamlı, Klinik Anlamsız
Klinik Anlamlı, p Anlamsız
MCID: klinik anlamlılığın ölçülebilir hali
MCID (Minimal Clinically Important Difference), hastaların veya hekimlerin "bu bir iyileşme" diyebileceği en küçük değişim. Her klinik parametrenin literatürde kabul görmüş MCID değerleri var:
| Parametre | MCID Eşiği | Açıklama |
|---|---|---|
| HbA1c | %0.5 | Daha düşük değişimler uzun dönem risk açısından anlamsız |
| Sistolik KB | 5-10 mmHg | Kardiyovasküler risk azalması için minimum hedef |
| VAS ağrı skoru | 1.3-1.4 (0-10) | Hastanın "ağrım azaldı" diyebileceği eşik |
| LDL kolesterol | 10 mg/dL | Kardiyak olay riskinde anlamlı azalma |
| 6 dakika yürüme testi | 30-40 metre | KOH hastalarında yaşam kalitesi farkı |
Yukarıdaki çalışmada HbA1c farkı %0.1 — MCID'nin (%0.5) çok altında. p değeri ne kadar küçük olursa olsun, klinik pratikte kullanılabilir bir bulgu değil.
Uyarı
MCID değerleri parametre ve hasta popülasyonuna göre değişiyor. Diyabetli yaşlılarda MCID daha yüksek olabilir, gençlerde daha düşük. Kullanılacak MCID değeri literatürden alınırken, çalışma popülasyonuna uygun referansı seçmekte fayda var.
Büyük örneklem paradoksu
İstatistiksel güç üç şeye bağlı: etki büyüklüğü, örneklem büyüklüğü ve alfa düzeyi. Örneklem yeterince büyükse, klinik olarak önemsiz bir etki bile p<0.05'i geçiyor.
10.000 kişilik bir çalışma düşünelim. Plasebo grubunda ortalama HbA1c %7.80, ilaç grubunda %7.75. Fark: %0.05. p=0.002. İstatistiksel olarak anlamlı — ama Cohen's d hesaplandığında 0.08 çıkıyor, yani ihmal edilebilir düzeyde. Hasta için pratik değeri yok.
Tersine, 50 kişilik bir çalışmada 18 mmHg sistolik düşüş bulunup p=0.09 alınabiliyor. Klinik olarak çok değerli bir etki, ama istatistiksel güç yetersiz kalmış. Bu durumda örneklem büyüklüğü hesaplama yapılıp gelecek çalışma için uygun hasta sayısı önerilebiliyor.
Etki büyüklüğü: p değerinin eksik bıraktığını tamamlıyor
p değeri tek başına yeterli değil — standartlaştırılmış etki büyüklüğü (Cohen's d, Hedge's g, eta-kare) klinik anlamlılığı yorumlamak için anahtar.
| Cohen's d | Yorum |
|---|---|
| < 0.2 | İhmal edilebilir |
| 0.2 - 0.5 | Küçük |
| 0.5 - 0.8 | Orta |
| > 0.8 | Büyük |
Bu eşikler genel bir kılavuz. Bazı alanlarda d=0.3 bile büyük sayılabiliyor (eğitim araştırmaları), bazılarında d=0.6 yetersiz kalıyor (akut cerrahi müdahale). Alan literatürünü iyi bilmek bu yorumlamada belirleyici.
Küçük etki büyüklüğü her zaman değersiz mi?
Klinik olarak küçük bir etki bazı durumlarda yine de değerli olabiliyor:
- Düşük maliyetli müdahale: Yan etkisi minimal, ucuz bir yöntem küçük fayda bile sağlasa kabul edilebilir
- Geniş popülasyon: Milyonlarca kişide %0.1'lik iyileşme, toplum sağlığı açısından büyük etki yaratabilir
- Kombinasyon tedavisi: Tek başına küçük etki gösteren ilaç, diğer tedavilerle kombine edildiğinde klinik fayda sağlayabilir
- Yan etki azalması: Etkisi aynı ama yan etkisi daha az olan bir ilaç küçük avantaj bile sunsa tercih edilebilir
Bu bağlamları tartışma bölümünde açıklamak, "etkimiz küçük çıktı" eleştirisini bertaraf eden güçlü bir strateji.
Raporlamada doğru yaklaşım
Sonuçlar bölümünde istatistiksel sonuçlarla birlikte klinik yorum da verilmeli:
"Tedavi grubu HbA1c ortalaması plasebo grubuna göre %0.12 daha düşük bulunmuştur (%95 GA: %0.06 - %0.18; p=0.001; Cohen's d=0.15). Bu fark istatistiksel olarak anlamlı olmakla birlikte, literatürde kabul edilen MCID eşiğinin (%0.5) altındadır."
Tartışma bölümünde MCID referans gösterilerek klinik bağlam tartışılır:
"Gözlenen HbA1c düşüşü klinik anlamlılık eşiğinin altında kalmıştır. Ancak kombinasyon tedavisinde bu ilacın rolü, maliyet-etkinlik ve yan etki profili dikkate alındığında, ek tedavi seçeneği olarak değerlendirilmeye değer olabilir."
Hem ham farkı (3.2 mmHg gibi), hem standartlaştırılmış etki büyüklüğünü (Cohen's d=0.41), hem de MCID'ye göre yorumu birlikte sunmak — hakemler bu şeffaflığı takdir ediyor. p değeri anlamsız çıktığında ne yapılacağını bilmek de bu sürecin doğal tamamlayıcısı.
İpucu
Başlık ve özette bulguları şişirmemekte fayda var. "Yeni ilaç HbA1c kontrolünde etkili bulundu" yerine "Yeni antidiyabetik ajan HbA1c üzerinde ılımlı etki gösterdi" ifadesi daha dürüst. Bu nüans, hakemler tarafından kesinlikle fark ediliyor.
İstatistiksel ve klinik anlamlılık ayrımının doğru yapılması, makalenin tartışma bölümünün kalitesini belirliyor. Model İstatistik ekibi olarak analiz sonuçlarınızın hem istatistiksel hem klinik perspektiften yorumlanmasında yardımcı olmaktan memnuniyet duyarız.