Onkoloji çalışması tamamlandı, hastalara 5 yıl takip yapıldı. Ama bazı hastalar hala hayatta, bazıları kayıp. SPSS'te "survival" sekmesi açıldığında ne yapılacağı net değil. Bir de danışman "Cox regresyon yap" diyor — log-rank test ile Cox arasındaki fark ne?
Sağkalım analizi, normal karşılaştırma testlerinden temelden farklı bir mantıkla çalışıyor. Bu farkı kavramadan yapılan analizler, hakem sürecinde ciddi eleştirilerle karşılaşıyor.
Sağkalım verisi neden farklı?
Sağkalım verisini diğer verilerden ayıran iki temel özellik var:
Sansürlü veri (censored data): Takip süresi bittiğinde bazı hastalar hala hayatta. Olay (ölüm, nüks vb.) gözlemlenmedi — ama bu "olay hiç olmayacak" anlamına gelmiyor. Sadece gözlem penceresi kapanmış durumda.
Farklı takip süreleri: Bir hasta 6 ay takip edilmiş, diğeri 3 yıl. Birinde 1 yılda olay gerçekleşmiş, diğerinde 2 yılda. Bu farklılıkları basit ortalamayla değerlendirmek mümkün değil — her hastanın takip süresi dikkate alınması gereken bir bilgi taşıyor.
Danışmanlık sürecimizde sık karşılaştığımız bir durum: kalp yetmezliği çalışmasında bir hasta 3. ayda tekrar hastaneye yatmış, diğeri 18 ay boyunca takip edilmiş ama hiç yatmamış. İkinci hasta sağ sansürlü (right-censored) — ve Kaplan-Meier tam da bu sansürü dikkate alarak gerçek sağkalım oranını hesaplıyor.
Kaplan-Meier: temel sağkalım eğrisi
Kaplan-Meier (KM) yöntemi, her zaman noktasında sağkalım olasılığını hesaplıyor. Mantık basit: her olay zamanında, o ana kadar hayatta olan hastalardan kaçı olay yaşadı? Bu oranın tersini (sağkalanı) çarparak kümülatif sağkalım eğrisi oluşuyor.
KM eğrisi basamaklı bir grafik. Her düşüş bir olay olduğunu, her yatay çizgi o sürede olay olmadığını gösteriyor. Sansürlü hastalar küçük bir işaretle (+) işaretleniyor.
İki grup arasında fark olup olmadığı log-rank testi ile değerlendiriliyor. Bu test, tüm takip boyunca gözlenen ve beklenen olay sayılarını karşılaştırıyor.
Log-rank testi fark olup olmadığını söylüyor — ama farkın büyüklüğünü, başka değişkenlerin etkisini dikkate almıyor. Bunun için Cox regresyona geçiş gerekiyor.
Cox regresyon: çoklu değişkenli sağkalım analizi
Cox orantılı hazard modeli, sağkalım analizinin çok değişkenli versiyonu. Tedavi etkisinin yaş ve cinsiyet kontrol edildiğinde hala anlamlı olup olmadığı, yaşın her 10 yıl artışında riski ne kadar artırdığı, hangi değişkenlerin bağımsız prognostik faktör olduğu — bu soruların tümüne Cox regresyon yanıt veriyor.
Çıktıdaki temel değer Hazard Ratio (HR):
| HR Değeri | Anlam |
|---|---|
| HR = 1 | Fark yok |
| HR > 1 | Risk artışı (HR=2 → 2 kat fazla risk) |
| HR < 1 | Koruyucu etki (HR=0.5 → yarı yarıya az risk) |
HR ile Odds Ratio (OR) farklı kavramlar. OR kesitsel verilerde kullanılırken, HR zamana bağlı olay riskini ifade ediyor. İkisini karıştırmak sık yapılan hatalardan biri. Lojistik regresyonda OR yorumlama yazımız bu ayrımı detaylı ele alıyor.
Akademik Not
Hazard (tehlike), birim zamandaki anlık olay riskini ifade ediyor. Hazard ratio ise iki grubun hazard'larının oranı — "grup A'daki bir hasta, grup B'deki bir hastaya göre herhangi bir anda kaç kat daha riskli?" sorusunu yanıtlıyor.
Orantılı hazard varsayımı
Cox regresyonun en kritik koşulu orantılı hazard (PH) varsayımı: iki grubun hazard oranının zaman içinde sabit kalması. Tedavi erken dönemde etkili ama sonradan etkisi azalıyorsa, PH varsayımı ihlal ediliyor.
Grafiksel kontrol: Log-log sağkalım eğrilerinin paralelliği değerlendirilir. Paralel değilse PH ihlali söz konusu.
Schoenfeld residuals testi: p>0.05 çıktığında varsayım sağlanmış kabul ediliyor. Hakem neredeyse her zaman "PH varsayımı test edildi mi?" sorusunu soruyor — Schoenfeld testi sonucunu raporlamak zorunlu bir adım.
PH ihlali tespit edildiğinde üç yaklaşım gündemde: zaman-bağımlı Cox modeli (etkinin zamana göre değiştiği durumlar), stratifiye Cox modeli (ihlali yapan değişken kategorikse) veya Weibull/exponential gibi parametrik modeller.
Univariate ve multivariate yaklaşım
Doğru yaklaşım iki aşamalı: önce her değişken tek başına test ediliyor (univariate Cox), p<0.10 veya p<0.20 olanlar not ediliyor. Sonra bu değişkenler ve klinik olarak önemli faktörler (yaş, evre vb.) birlikte multivariate modele alınıyor.
Makaleye hem univariate hem multivariate sonuçlarının tablo halinde sunulması bekleniyor. Univariate'te anlamlı ama multivariate'te anlamsız çıkan bir değişken, başka bir değişkenle confounding ilişkisi olduğuna işaret ediyor.
Kaplan-Meier ile Cox farkı
| Özellik | Kaplan-Meier + Log-rank | Cox Regresyon |
|---|---|---|
| Değişken sayısı | Genelde 1 (tek faktör) | Birden fazla |
| Çoklu değişken kontrolü | Yok | Var |
| Çıktı | Sağkalım eğrisi, p değeri | Hazard ratio, %95 GA |
| Kullanım | Tek faktör karşılaştırma | Düzeltilmiş analiz |
İkisi birlikte kullanıldığında en güçlü sunum ortaya çıkıyor: önce KM eğrisi ile fark görselleştiriliyor, sonra Cox ile düzeltilmiş HR raporlanıyor.
Raporlama standardı
Yöntemler bölümünde: "Sağkalım analizi Kaplan-Meier yöntemi ile yapıldı. Gruplar arası karşılaştırma için log-rank testi kullanıldı. Çoklu değişkenli analizde Cox orantılı hazard modeli kuruldu. Orantılı hazard varsayımı Schoenfeld residuals testi ile kontrol edildi."
Sonuçlar bölümünde: "Tedavi A grubunda ortanca sağkalım 24 ay (%95 GA: 18-30), Tedavi B grubunda 36 ay (%95 GA: 30-42) bulundu (log-rank p=0.021). Multivariate Cox regresyonda Tedavi B bağımsız prognostik faktör olarak saptandı (HR=0.52, %95 GA: 0.31-0.87, p=0.013)."
İpucu
Hazard ratio raporlanırken %95 güven aralığının mutlaka eklenmesi gerekiyor. HR=0.6 görünüşte olumlu ama güven aralığı 0.3-1.2 ise (1'i içeriyor), istatistiksel olarak anlamlı değil. p değeri anlamsız çıktığında etki büyüklüğüne odaklanmak bu durumda etkili bir strateji.
Sık yapılan hatalar
Sansürlü hastaları analiz dışı bırakmak. Sansürlü hastalar "bilgi yok" demek değil — o ana kadarki sağkalım bilgisiyle katkı sağlıyorlar. Complete case analysis yerine tüm hastaların dahil edilmesi gerekiyor.
Ortanca sağkalıma ulaşmadan yorum yapmak. Hastaların %50'si hala hayattaysa ortanca sağkalım hesaplanamıyor. "Median not reached" olarak raporlanıp alternatif olarak 1 yıllık, 3 yıllık sağkalım oranları sunulabiliyor.
PH varsayımını test etmemek. Schoenfeld testi sonucu raporlanmadığında hakem revizyonu neredeyse garanti. İhlal varsa stratifiye Cox veya zaman-bağımlı covariates ile model düzeltilmeli.
Gruplar arasında sansür oranı çok farklıyken log-rank kullanmak. Bir grupta %80 sansür, diğerinde %20 varsa log-rank testi güç kaybediyor. Bu durumda Gehan-Breslow veya Tarone-Ware testi daha güvenilir sonuç veriyor.
Model İstatistik ekibi olarak sağkalım analizinin planlanmasından KM eğrisi ve Cox regresyon raporlamasına, PH varsayım kontrolünden hakem yanıtlarına kadar tüm süreçte destek sunmaktan memnuniyet duyarız.